Show HN: Pantheon – AI對抗AI:一個寫代碼,另一個攻擊它
Pantheon 是一組 Claude Code 技能,通過多智能體框架運行編碼任務:規劃、N 個並行實現、對抗驗證和評審。它能捕獲單次提交會遺漏的缺陷,利用獨立審查者來破壞構建。
近日,開發者 lolu1032 在 GitHub 上發佈了一款名為 Pantheon 的開源項目,這是一組針對 Claude Code 的技能,旨在通過多智能體協作提升代碼質量。Pantheon 的核心思路是在編碼任務中引入對抗性驗證,而不是依賴單一模型的單次輸出。整個流程分為四個階段:首先,一個規劃者制定詳細規格和測試計劃;然後,N 個實現者並行編寫不同策略的代碼,並運行自測進行自我修正;接着,獨立的對抗性審查者嘗試破壞每個成功的構建;最後,評審者選出最佳實現,並整合其他方案的優點。
Pantheon 提供兩個版本:pantheon 完全基於 Claude,驗證環節也由 Claude 自己完成;而 pantheon-x 則使用 OpenAI 的 GPT-5.5(通過 Codex 插件)作為對抗性審查者,從而避免同一模型可能產生的盲點。這意味着 pantheon-x 能更有效地捕獲自測無法發現的隱性錯誤。
使用 Pantheon 需要滿足一定條件:必須擁有付費的 Claude Code 計劃(Pro、Max、Team 或 Enterprise),並在 Pro 計劃中啓用動態工作流。對於 pantheon-x,還需安裝 OpenAI 的 Codex 插件並登錄 ChatGPT 或提供 API 密鑰。安裝過程簡單,只需將倉庫克隆到 Claude 的技能目錄即可。
每個 Pantheon 任務會消耗大量令牌,默認設置下約為幾十萬到一百萬個令牌,耗時 6-10 分鐘,適合用於最困難的 10-20% 的編碼任務,而非日常小修改。項目採用 MIT 許可證,開發者鼓勵用户在複雜任務中嘗試,並歡迎提交問題和拉取請求。
總的來説,Pantheon 通過多智能體對抗驗證機制,為利用大型語言模型的編碼任務提供了一種提升正確性的實用腳手架。它並非提升模型智能本身,而是在現有模型能力基礎上,通過工程手段減少錯誤,尤其適用於能夠通過測試用例明確驗證正確性的場景。