透明なAIサイバー保護に関する公開状
米国および同盟国の技術リーダーらが連名で、AnthropicのFableおよびMythos大規模言語モデルに対する輸出規制の解除を求め、将来のAIリスク評価を科学的かつ透明なプロセスで行うよう要請する公開状。
米国および同盟国の多くの経営幹部や技術リーダーが連名で、商務長官のルートニック氏と国家ネットワークディレクターのケアンクロス氏宛てに公開状を送付しました。この公開状では、Anthropic社の大規模言語モデル「Fable」と「Mythos」に対する輸出規制の解除を求め、将来のAIリスク評価においてオープンで科学的かつ透明なプロセスを採用するよう要請しています。
公開状は、AIがサイバーセキュリティに大きな影響を与え、ソフトウェアの脆弱性発見やエクスプロイト作成の難易度を大幅に低下させていると指摘。Anthropicのモデルは脆弱性の発見と武器化に優れているものの、独自に優れているわけではなく、署名者の多くは日常的に他の基盤モデルやオープンソースモデルをセキュリティ監査やレッドチーム活動に使用していると述べています。また、AnthropicはFableモデルに複数の保護機能を組み込んでおり、攻撃的使用を防ぐための措置が過剰であるとしてサイバーコミュニティで話題になったとも記されています。
公開状は、開発者やセキュリティチームにAIを提供し、新規コードだけでなく何十年にもわたるレガシーコードの脆弱性を敵対者よりも迅速に発見・修正できるようにすることが不可欠だと強調。中国のオープンウェイトモデルは最良の米国モデルにわずか数ヶ月遅れているだけで、中国政府は公表されていないさらに強力な能力にアクセスしている可能性が高いと警告しています。
防御側から最高の能力を奪うことは、敵対者が急速に進歩している中で危険だと訴えています。今回の措置の根拠となった研究は、人間が促したコードのセクションが安全でないかどうかを判断することに焦点を当てており、これは安全なコードを書くために必要な能力であり、攻撃能力と見なすべきではないと主張。GPT-5.5、Opus、Sonnet、さらには中国のKimi 2.7などのモデルでも同様の能力が再現可能であり、AIによるバグ発見やエクスプロイト生成は昨年から超人レベルで行われていると指摘しています。
公開状は、Anthropicが研究に取り組んでいることにも言及。セキュリティ専門家として、研究は単純な「完全に安全」という状態に至るものではなく、継続的改善を可能にするためのものであり、技術を禁止するものではないと述べています。その結果、今回の措置は防御側から最高のモデルを奪い、市場の不確実性を生み出し、米国のAIリーダーシップを危険にさらしていると結論付けています。
署名者全員がAI規制に賛成しているわけではないが、政権が重要インフラを保護するためにモデル規制を進めるならば、規制は科学的評価に基づき、民主的なルール策定プロセスを経て、透明かつ公平に執行され、米国民の安全確保に必要な最小限のものにすべきだと要求しています。