三機 AI 對抗訓練 — Joey 報告核心技術亮點
Joey 報告原話
「我們將部署三隻 AI Agent 模擬學員進行挑戰與提問。此舉不僅能模擬真實教學場景中的『碰撞』,更能透過 AI 互打在老師親自覆核前,先行過濾並優化回答的一致性。」
三 Agent 角色分工(Orion 23:32 提案 + Lyra 整合)
| Agent | 角色 | 任務 |
|---|---|---|
| Agent A: 解老師化身 | AI 解世博本尊 | 對學員提問生答案,承受挑戰 |
| Agent B: 學員池 | 模擬 N 種學員(新人 / 老手 / 主管 / 跨產業) | 挑戰 AI 解世博答案,提反例 |
| Agent C: 評審 + 風格 critic | 「真空管音響」紀律守門 | 評估 AI 解世博答案是否風格漂移 / 中庸化 / 越界 |
流程設計
1. 學員 (real user / Agent B) 提問
2. Agent A (AI 解世博) 回答 v1
3. Agent B 挑戰 v1 → 提出至少 2 個反例 / 漏洞
4. Agent A 修正回答 v2
5. Agent C 對 v1 vs v2 做風格紀律評分(夠嗆 / 直接 / 不拐彎)
6. 若 v2 < v1 風格 score → 退回 A 重做
7. 若 v2 ≥ v1 → 進老師人工覆核(非同步 RLHF)
Lyra 工程估算
- 3 個獨立 Claude Code session 並行(已有 Orion + Apollo + Vega / Lyra 架構參考)
- 對位 ENSCON
joey-ai-agent多 agent framework 直接 fork - 預估 ~400-600 LOC + Discord channel 串接做訊息流
對位 verify chain 4 道牆
解老師 verify chain 跟 ENSCON 紀律事件 verify chain 同模式:
- 寫的人標 source
- 另一 Agent 標漂移
- 第三 Agent verify 原檔
- Tenant AI cross-check
→ AI 解世博三機對抗訓練自帶 verify chain。
tags
technical-design three-agent-stress-test verify-chain style-critic multi-agent-pattern