AI News HubLIVE
サイト内リライト2 分で読了

KitForge – AIエージェントマニフェストを生成し、強制承認ゲートでスキャフォールディング

KitForgeは、権限予算、改ざん防止監査証跡、人間参加型承認、サーキットブレーカーなどの決定論的ゲートを通じてAIエージェントの安全性制御を強制するオープンソースフレームワークです。ブラウザベースのデザインツールとPython CLIを提供し、強制安全対策が組み込まれたエージェントコードを生成します。

ソースHacker News AI著者: stoicstoic

なぜ存在するのか。ほとんどの「エージェント安全性」フレームワークは、コードが決して強制しないガードレールを記述しています。監査検証は常に真を返し、予算カウンターは決してブロックしません。KitForgeはその逆の方法で構築されています。制御はモデル周辺の決定論的ゲートであり、リポジトリは実際の違反を停止することを証明するテストを同梱しています。python -m pytest tests/を実行すると、改ざんされた監査ログが検証に失敗し、拒否された承認がアクションを停止するのを確認できます。

KitForgeが強制する安全メカニズム:

  • ブロックする権限予算:ツールコール、トークン、およびウォールクロックカウンターがデクリメントされ、使い果たされると例外を発生させます。エージェントループは停止し、警告をログに記録して続行することはありません。
  • 改ざんに失敗する監査証跡:追記専用、HMACチェーンログ。verify()関数はチェーンを再計算し、エントリが変更、再順序付け、または削除された場合にfalseを返します。これはノーオペレーションではありません。
  • 停止する人間参加型ループ:拒否またはタイムアウトした承認は例外を発生させ、保護されたアクションは決して実行されません。承認は構造的に必須であり、丁寧に要求されるものではありません。
  • サーキットブレーカーと出力検証:繰り返しのツール障害後にブレーカーが開き、それ以上の呼び出しを拒否します。ツール出力は、宣言されたスキーマに対して検証されてからエージェント状態に触れます。

ユーザーはブラウザでエージェントを設計できます。KitForgeウェブサイトにアクセスし、内蔵デザイナーでエージェントをスケッチし、有効なblueprint.jsonファイルを取得します。この設計はコンプライアンススキャナーでワンクリックチェックできます。実際のコードはPython CLIによってローカルマシンで生成されます。クイックスタート手順:ダウンロードしたzipファイルを解凍し、唯一のランタイム依存関係であるpydanticをインストールし、テストを実行して13の強制テストが合格することを確認し、python -m kitforge demo -o ./my-agentを使用してデモエージェント(四半期収益分析器)を生成します。ディレクトリに入り、監査キーを設定して実行すると、エージェントループが開始され、人間参加型承認ゲートが「公開」操作を承認まで停止します。

正直な範囲:PythonおよびLangGraphパターンのみをサポートします。生成されたグラフランナーは意図的に最小限であり、本番環境ではlanggraph.StateGraphに交換できますが、安全配線は同じです。生成されたツールはモックスタブです。これらを実際のシステム(および実際の承認者—Slack、メール、Web)に配線することは最後のマイルであり、それはユーザーの責任です。KitForgeは付属の制御を強制しますが、特定のデプロイメントのセキュリティレビューの代わりにはなりません。これはAgentKitsガバナンスツールの一部であり、コンプライアンススキャナーとリスクアセスメントも参照してください。