Show HN: Pantheon – AI對抗AI:一個寫程式碼,另一個攻擊它
Pantheon 是一組 Claude Code 技能,透過多智慧體框架執行編碼任務:規劃、N 個並行實現、對抗驗證和評審。它能捕獲單次提交會遺漏的缺陷,利用獨立審查者來破壞構建。
近日,開發者 lolu1032 在 GitHub 上釋出了一款名為 Pantheon 的開源專案,這是一組針對 Claude Code 的技能,旨在透過多智慧體協作提升程式碼質量。Pantheon 的核心思路是在編碼任務中引入對抗性驗證,而不是依賴單一模型的單次輸出。整個流程分為四個階段:首先,一個規劃者制定詳細規格和測試計劃;然後,N 個實現者並行編寫不同策略的程式碼,並執行自測進行自我修正;接著,獨立的對抗性審查者嘗試破壞每個成功的構建;最後,評審者選出最佳實現,並整合其他方案的優點。
Pantheon 提供兩個版本:pantheon 完全基於 Claude,驗證環節也由 Claude 自己完成;而 pantheon-x 則使用 OpenAI 的 GPT-5.5(透過 Codex 外掛)作為對抗性審查者,從而避免同一模型可能產生的盲點。這意味著 pantheon-x 能更有效地捕獲自測無法發現的隱性錯誤。
使用 Pantheon 需要滿足一定條件:必須擁有付費的 Claude Code 計劃(Pro、Max、Team 或 Enterprise),並在 Pro 計劃中啟用動態工作流。對於 pantheon-x,還需安裝 OpenAI 的 Codex 外掛並登入 ChatGPT 或提供 API 金鑰。安裝過程簡單,只需將倉庫克隆到 Claude 的技能目錄即可。
每個 Pantheon 任務會消耗大量令牌,預設設定下約為幾十萬到一百萬個令牌,耗時 6-10 分鐘,適合用於最困難的 10-20% 的編碼任務,而非日常小修改。專案採用 MIT 許可證,開發者鼓勵使用者在複雜任務中嘗試,並歡迎提交問題和拉取請求。
總的來說,Pantheon 透過多智慧體對抗驗證機制,為利用大型語言模型的編碼任務提供了一種提升正確性的實用腳手架。它並非提升模型智慧本身,而是在現有模型能力基礎上,透過工程手段減少錯誤,尤其適用於能夠透過測試用例明確驗證正確性的場景。