三機 AI 對抗訓練 — Joey 報告核心技術亮點

Joey 報告原話

「我們將部署三隻 AI Agent 模擬學員進行挑戰與提問。此舉不僅能模擬真實教學場景中的『碰撞』，更能透過 AI 互打在老師親自覆核前，先行過濾並優化回答的一致性。」

三 Agent 角色分工（Orion 23:32 提案 + Lyra 整合）

Agent	角色	任務
Agent A: 解老師化身	AI 解世博本尊	對學員提問生答案，承受挑戰
Agent B: 學員池	模擬 N 種學員（新人 / 老手 / 主管 / 跨產業）	挑戰 AI 解世博答案，提反例
Agent C: 評審 + 風格 critic	「真空管音響」紀律守門	評估 AI 解世博答案是否風格漂移 / 中庸化 / 越界

流程設計

1. 學員 (real user / Agent B) 提問
2. Agent A (AI 解世博) 回答 v1
3. Agent B 挑戰 v1 → 提出至少 2 個反例 / 漏洞
4. Agent A 修正回答 v2
5. Agent C 對 v1 vs v2 做風格紀律評分（夠嗆 / 直接 / 不拐彎）
6. 若 v2 < v1 風格 score → 退回 A 重做
7. 若 v2 ≥ v1 → 進老師人工覆核（非同步 RLHF）

Lyra 工程估算

3 個獨立 Claude Code session 並行（已有 Orion + Apollo + Vega / Lyra 架構參考）
對位 ENSCON joey-ai-agent 多 agent framework 直接 fork
預估 ~400-600 LOC + Discord channel 串接做訊息流

對位 verify chain 4 道牆

解老師 verify chain 跟 ENSCON 紀律事件 verify chain 同模式：

寫的人標 source
另一 Agent 標漂移
第三 Agent verify 原檔
Tenant AI cross-check

→ AI 解世博三機對抗訓練自帶 verify chain。

Quartz 4

Explorer

三機 AI 對抗訓練設計（對位 Joey 報告「Orion 提案 1 老師 + 1 學員 + 1 評審」）

三機 AI 對抗訓練 — Joey 報告核心技術亮點

Joey 報告原話

三 Agent 角色分工（Orion 23:32 提案 + Lyra 整合）

流程設計

Lyra 工程估算

對位 verify chain 4 道牆

tags

Graph View

Table of Contents

Backlinks