AI News HubLIVE
站内改写2 分で読了

Show HN: Pantheon – AI vs AI: 一方がコードを書き、他方が攻撃する

Pantheon は、Claude Code スキルのペアで、計画、N 個の並列実装、敵対的検証、審査員からなるマルチエージェントハーネスを介してコーディングタスクを実行します。単一のパスでは見逃されるバグを、独立したレビュアーがビルドを破壊することでキャッチします。

ソースHacker News AI著者: lolu1032

最近、開発者の lolu1032 が GitHub で Pantheon というオープンソースプロジェクトを公開しました。これは Claude Code のスキルセットであり、マルチエージェントハーネスを使用してコーディングタスクの品質を向上させることを目的としています。Pantheon の核心的なアイデアは、単一モデルの単一パスに頼るのではなく、敵対的検証を導入することです。プロセスは 4 段階で構成されます。最初に、プランナーが詳細な仕様とテスト計画を作成します。次に、N 個の実装者が異なる戦略で並行してコードを書き、自己テストと自己修正を行います。その後、独立した敵対的レビュアーが各ビルドを破壊しようと試みます。最後に、審査員が最適な実装を選択し、他の候補から優れたアイデアを統合します。

Pantheon には 2 つのバージョンがあります。pantheon は完全に Claude ベースで、検証も Claude が行います。一方、pantheon-x は OpenAI の GPT-5.5(Codex プラグイン経由)を敵対的レビュアーとして使用し、同一モデルの盲点を回避します。これにより、自己テストでは見逃される欠陥をより効果的に捕捉できます。

使用にはいくつかの前提条件があります。有料の Claude Code プラン(Pro、Max、Team、Enterprise)が必要で、Pro プランでは動的ワークフローを有効にする必要があります。pantheon-x を使用するには、OpenAI の Codex プラグインをインストールし、ChatGPT にログインするか API キーを設定する必要があります。インストールは簡単で、リポジトリを Claude のスキルディレクトリにクローンするだけです。

各 Pantheon タスクは大量のトークンを消費し、デフォルト設定で数十万から約 100 万トークン、実行時間は約 6〜10 分です。そのため、日常的な編集ではなく、最も難しい 10〜20% のタスクに使用することが推奨されています。プロジェクトは MIT ライセンスで公開されており、開発者は複雑なタスクでの使用を奨励し、Issue や Pull Request を歓迎しています。

要するに、Pantheon はマルチエージェント敵対的検証メカニズムを通じて、大規模言語モデルを使用したコーディングタスクの正確性を向上させる実用的な足場を提供します。モデルの知能そのものを向上させるのではなく、既存のモデル能力に基づいて工学的な手段でエラーを減らすものであり、特にテストケースで明確に検証可能なシナリオに適しています。