AI News HubLIVE
站内改写2 分で読了

我々はアンソロピックのグラスウィングを手に入れた(ミソス5やフェイブル5は不要?)

アンソロピックのGlasswingに触発され、著者はローカルハードウェアで動作する自律型セキュリティ研究者Lucentを構築した。Lucentは段階的なソースコードバグハンターで、単一のRTX 3090上でローカルの27B Qwenモデルを実行し、Luceboxにより約3.4倍のデコード速度を実現。初めてhermes-agentに適用したところ、静的解析で1342件の候補が、ローカルスイープで126件、フロンティアモデルの敵対的監査で15件、最終的に2件の実際の脆弱性に絞り込まれた。ローカル読み取りのコストは約1.62ドル。最も印象的だったのは、レビューアエージェントが、著者が以前に3つのエクスプロイトを、ベンダーがこっそり書き換えた脅威モデルに対してスコアリングしていたことを見抜いた瞬間である。

ソースHacker News AI著者: Seventeen18

アンソロピックがGlasswingを発表した。それはコードベースを自律的に読み取り、実際の脆弱性を持ち帰るセキュリティ研究者である。著者も同じようなツールを欲したが、API呼び出しごとに課金されるのではなく、自分の制御下にあるモデルを自分のマシン上で実行し、電気代だけで一晩中動作させたいと考えた。そこで生まれたのがLucentである。

Lucentは段階的なパイプラインであり、各段階で異なるモデルを実行でき、ターゲットのソースコードはロックされたDockerサンドボックス内に読み取り専用でマウントされる。パイプラインは4つの段階からなる:ランク(Rank)、ハント(Hunt)、検証(Verify)、エクスプロイト(Exploit)。ランク段階では、各ソースファイルが脆弱性を隠している可能性に応じてスコアリングされ、高価な段階が予算を重要な場所に使えるようにする。ハント段階では、階層化されたファイル並列エージェントプールがランク付けされたファイルを読み取り、行番号とメカニズムの説明とともにリードを記録する。検証段階では、各リードをソースに対して再読み取りし、反証を試みる。エクスプロイト段階では、生存したリードをエクスプロイトトリアージとバリアントループに送り、動作する概念実証の生成を試みる。

ハードウェア面では、高容量の読み取りは単一のRTX 3090上で実行される。ランカーとハンターはローカルオープンソースのQwen3.6-27Bモデルを駆動し、Luceboxがサービスを提供する。Luceboxは投機的デコードを使用し、複数の将来トークンをバッチで検証するため、コードのようなテキストでは約3.4倍の生成速度(約130トークン/秒、通常の自己回帰デコードでは38トークン/秒)を達成する。これにより、27Bモデルが大きなコードツリーを十分な速さで読み取れるようになる。

初めてhermes-agentに適用した際、静的解析は1342の候補サイトをマークし、ローカルスイープで126件のリードに絞り込み、フロンティアモデル(Opus 4.7)による敵対的監査で15件、最終的に2件の実際の脆弱性に至った。一つはチャット内の誰でも応答できる承認プロンプトであり、もう一つは範囲内でNousに報告されたが、修正がまだリリースされていないため詳細は保留されている。最も印象的な瞬間は、レビューアエージェントが、著者が以前に実証した3つのエクスプロイトが、ベンダーが6週間前に置き換えたセキュリティポリシーに基づいて評価されていたことを見抜いたことである。

構築プロセスは決して順調ではなかった。初期の試みでは、大規模なクラウドモデルを手動で駆動した結果、自信過剰でほとんどが誤った出力を得た。その後、著者はパイプラインの構築に移り、数週間にわたる失敗を経験した。ランカーが興味深いファイルを埋もれさせ、ハンターが存在しないファイル行参照を生成し、検証器が殺すべきものを通過させ、Luceboxゲートウェイが負荷で停止して再起動が必要になるなどの問題が発生した。著者はこれらの問題を一つずつ修正し、検証器に自身の入力(ディスク上のファイルを含む)を信用しないように教え、チェックポイントを追加して中断から再開できるようにした。

最終的に、Lucentは実際の世界でその価値を証明し、複雑なコードベースから低コストで実際の脆弱性を発見した。これは適切な設計の下で、オープンソースモデルとコンシューマグレードのハードウェアでも印象的なセキュリティ研究能力が実現可能であることを示している。