Show HN:ペネトレーションテストと脆弱性研究のためのAIネイティブレッドチーム
Z3r0 は AI ネイティブのレッドチームフレームワークで、承認優先、ロールベースの実行、構造化された証拠記録を強調します。Docker サンドボックスによる制御された実行を提供し、再開可能な長期タスクをサポートします。アーキテクチャには、最高セキュリティ責任者、監査エンジニアなどの専門エージェントが含まれ、偵察、脆弱性検証、コード監査などを調整します。システム設計は、運用の境界と人間によるレビューのトレーサビリティに重点を置いています。
Z3r0 は、ペネトレーションテストと脆弱性研究のために設計された AI ネイティブのレッドチームフレームワークです。GitHub でオープンソースとして公開されており、その中核理念は「自動化の前に承認」です。すべてのワークフローは、ツールの機能が使用される前に、法的範囲、制御されたターゲット、およびオペレーターの責任が明確に定義されていることを前提としています。
システムはロールベースのレッドチーム実行モデルを採用しています。主任調整エージェント(最高セキュリティ責任者 Z3r0)がタスクの分解と結果の統合を担当し、専門エージェントには偵察(L1ly)、脆弱性検証(Fr4nk)、コード監査(V3ra)、リバースエンジニアリング(J4m3)、暗号レビュー(Nu1L)が含まれます。これらのエージェントは限定された責任範囲内で協力し、各プロセスに明確な責任者を確保します。
従来の対話型 AI とは異なり、Z3r0 は一時的なコンテキストではなく構造化された証拠を重視します。WorkProject レコードは、資産、発見、関係エッジ、攻撃パスを永続的に保存し、会話が変わった後でも証拠をレビュー可能にします。この設計により、長期実行タスクの一時停止と再開が可能になります。バックグラウンドのサブエージェントやサンドボックスジョブは通知メカニズムを通じてプライマリエージェントに通知され、ポーリングや待機ループは不要です。
実行面では、すべてのコマンド実行、ブラウザワークフロー、ファイル管理、GUI ツールは、バインドされた Docker サンドボックスを介して実行され、アプリケーションホストを直接使用しません。これにより厳格な境界制御が提供されます。フロントエンドは安定した REST および WebSocket インターフェースを介してバックエンドと通信し、モデル SDK やベンダーの内部実装に依存しません。
システムアーキテクチャは明確な層に分かれています:ユーザーワークベンチ、API 境界、ランタイムオーケストレーション、再開可能なインスタンスドライバー、通知ベースの活性、セッションエージェントグラフ、制御された実行、モデルアクセス、ストリーミングイベント契約、永続タイムラインリプレイ、および WorkProject 証拠レコード。バックエンドは認証、セッションライフサイクル、コンテキスト投影、イベント正規化、委任、サンドボックスバインディング、ツールマウント、通知、永続化、プロジェクトスコープレコード、履歴圧縮を担当します。
ランタイムモデルは非ブロッキングインスタンスドライバーと割り込み駆動タスク実行を導入します。AgentSession ドライバーは初期ターン後に停止し、バックグラウンド通知を待ってから再開します。通知はアクティブワークの唯一の真実の源として機能し、エージェントがバックグラウンドタスク完了後に適切に起動されることを保証します。イベント正規化により、生のモデルおよびエージェント SDK イベントは、thinking_delta、text_delta などの安定したフロントエンドイベントに変換されます。
委任フローは専門エージェントの実行方法を示しています:CSO エージェントは委任ツールを介してサブエージェントタスクを開始し、サブエージェントはプライマリエージェントと同じ run_until_idle エグゼキュータを使用し、イベントをストリーミングしてから休止または完了状態になります。サブエージェントが完了または失敗すると、タスクの更新と親通知ステータスの変更が同じデータベーストランザクションでコミットされ、一貫性が確保されます。
Z3r0 のエージェントチームには 6 つのロールがあります:Z3r0(最高セキュリティ責任者)、V3ra(最高監査エンジニア)、L1ly(最高インテリジェンスエンジニア)、Fr4nk(最高ペネトレーションエンジニア)、J4m3(最高リバースエンジニア)、Nu1L(最高暗号エンジニア)。各エージェントの能力はセッションごとにアセンブルされ、AgentRegistry が設定、ロール仕様、知識生成、サンドボックスバインディング、WorkProject バインディングを使用してセッションレベルのエージェントグラフを動的に作成します。
このプロジェクトは、セキュリティテストにおける AI の新しいアプローチを表しており、構造化、再開可能、境界制御された実行を通じて、AI エージェントの能力をプロフェッショナルなレッドチーム運用のニーズと組み合わせています。オープンソースの性質により、コミュニティによるレビューと貢献が可能です。