Show HN: Pantheon – AI对抗AI:一个写代码,另一个攻击它
Pantheon 是一组 Claude Code 技能,通过多智能体框架运行编码任务:规划、N 个并行实现、对抗验证和评审。它能捕获单次提交会遗漏的缺陷,利用独立审查者来破坏构建。
近日,开发者 lolu1032 在 GitHub 上发布了一款名为 Pantheon 的开源项目,这是一组针对 Claude Code 的技能,旨在通过多智能体协作提升代码质量。Pantheon 的核心思路是在编码任务中引入对抗性验证,而不是依赖单一模型的单次输出。整个流程分为四个阶段:首先,一个规划者制定详细规格和测试计划;然后,N 个实现者并行编写不同策略的代码,并运行自测进行自我修正;接着,独立的对抗性审查者尝试破坏每个成功的构建;最后,评审者选出最佳实现,并整合其他方案的优点。
Pantheon 提供两个版本:pantheon 完全基于 Claude,验证环节也由 Claude 自己完成;而 pantheon-x 则使用 OpenAI 的 GPT-5.5(通过 Codex 插件)作为对抗性审查者,从而避免同一模型可能产生的盲点。这意味着 pantheon-x 能更有效地捕获自测无法发现的隐性错误。
使用 Pantheon 需要满足一定条件:必须拥有付费的 Claude Code 计划(Pro、Max、Team 或 Enterprise),并在 Pro 计划中启用动态工作流。对于 pantheon-x,还需安装 OpenAI 的 Codex 插件并登录 ChatGPT 或提供 API 密钥。安装过程简单,只需将仓库克隆到 Claude 的技能目录即可。
每个 Pantheon 任务会消耗大量令牌,默认设置下约为几十万到一百万个令牌,耗时 6-10 分钟,适合用于最困难的 10-20% 的编码任务,而非日常小修改。项目采用 MIT 许可证,开发者鼓励用户在复杂任务中尝试,并欢迎提交问题和拉取请求。
总的来说,Pantheon 通过多智能体对抗验证机制,为利用大型语言模型的编码任务提供了一种提升正确性的实用脚手架。它并非提升模型智能本身,而是在现有模型能力基础上,通过工程手段减少错误,尤其适用于能够通过测试用例明确验证正确性的场景。