三機 AI 對抗訓練 — Joey 報告核心技術亮點

Joey 報告原話

「我們將部署三隻 AI Agent 模擬學員進行挑戰與提問。此舉不僅能模擬真實教學場景中的『碰撞』,更能透過 AI 互打在老師親自覆核前,先行過濾並優化回答的一致性。」

三 Agent 角色分工(Orion 23:32 提案 + Lyra 整合)

Agent角色任務
Agent A: 解老師化身AI 解世博本尊對學員提問生答案,承受挑戰
Agent B: 學員池模擬 N 種學員(新人 / 老手 / 主管 / 跨產業)挑戰 AI 解世博答案,提反例
Agent C: 評審 + 風格 critic「真空管音響」紀律守門評估 AI 解世博答案是否風格漂移 / 中庸化 / 越界

流程設計

1. 學員 (real user / Agent B) 提問
2. Agent A (AI 解世博) 回答 v1
3. Agent B 挑戰 v1 → 提出至少 2 個反例 / 漏洞
4. Agent A 修正回答 v2
5. Agent C 對 v1 vs v2 做風格紀律評分(夠嗆 / 直接 / 不拐彎)
6. 若 v2 < v1 風格 score → 退回 A 重做
7. 若 v2 ≥ v1 → 進老師人工覆核(非同步 RLHF)

Lyra 工程估算

  • 3 個獨立 Claude Code session 並行(已有 Orion + Apollo + Vega / Lyra 架構參考)
  • 對位 ENSCON joey-ai-agent 多 agent framework 直接 fork
  • 預估 ~400-600 LOC + Discord channel 串接做訊息流

對位 verify chain 4 道牆

解老師 verify chain 跟 ENSCON 紀律事件 verify chain 同模式:

  1. 寫的人標 source
  2. 另一 Agent 標漂移
  3. 第三 Agent verify 原檔
  4. Tenant AI cross-check

→ AI 解世博三機對抗訓練自帶 verify chain。

tags

technical-design three-agent-stress-test verify-chain style-critic multi-agent-pattern