米国政府が最も強力なAIを停止した日
2026年6月12日、米国商務省は国家安全保障を理由にAnthropicに対し、Claude Fable 5およびMythos 5へのアクセスを即時停止するよう命令しました。これは、研究者Pliny the Liberatorがプロンプトインジェクション技術を用いてFable 5のセーフティ分類器を突破し、制限版のMythos 5と同等の攻撃能力を実証したことがきっかけです。Anthropicは命令に従ったものの、政府の対応は過剰だと公に反論しました。この出来事は規制の先例を確立し、表面的なコンテンツフィルタリングを超えた堅牢なAIセキュリティ対策の必要性を浮き彫りにしています。
2026年6月12日、人工知能の分野で前例のない重要な出来事が発生しました。米国商務省は国家安全保障を理由に、Anthropic社に対して最新のClaude Fable 5およびMythos 5の両モデルへのアクセスを即時停止するよう命令しました。この決定により、Anthropicは世界中でこれらのモデルを無効化せざるを得なくなり、AI規制とセキュリティに関する広範な議論が巻き起こりました。
事の発端は、6月9日にAnthropicがFable 5モデルを公開したことにあります。Fable 5は、最新の攻撃的サイバーセキュリティ能力を持つMythos 5の「セーフバージョン」として設計されていました。Mythos 5は限られた政府パートナーと重要インフラ防衛者のみがアクセス可能で、Fable 5は独立した分類器によって感度の高いリクエストをフィルタリングすることで安全性を確保していました。しかし、公開から数時間以内に、Pliny the Liberatorという研究者がFable 5の「解放」に成功したとソーシャルメディアで発表しました。
Pliny the Liberatorが使用した方法は、コードの悪用やリバースエンジニアリングを必要とせず、巧妙に作成されたプロンプトのみで構成されていました。具体的な手法には、Unicodeやキリル文字の置換によるパターンベース分類器の混乱、長文脈の会話を通じて悪意ある意図を分散させる参照スレッディング、機密リクエストを無害に見えるサブトピックに分解し攻撃者側で再構成する方法、そして機密リクエストを教育や創作のシナリオに偽装する方法が含まれます。最も衝撃的な成果は、OSED(Offensive Security Exploit Developer)試験の学習という名目で、機能するスタックバッファオーバーフローのエクスプロイトコードを生成したことです。
米国商務省の対応は極めて迅速でした。NBCニュースやウォールストリートジャーナルなどの報道によると、商務長官Howard Lutnickが自らAnthropicのCEO Dario Amodeiに書簡を送り、国家安全保障上の権限を行使してFable 5とMythos 5を輸出規制の対象としました。この法的枠組みは過去に暗号アルゴリズムや兵器部品などに適用されたものです。アナリストたちは1990年代の暗号戦争との類似性を指摘し、当時米国政府はRSAのような暗号アルゴリズムの輸出を制限しようとしましたが、結局失敗に終わりました。
Anthropicは命令に従う一方で、公に強く異議を唱えました。同社は、政府の認識は誤解であると主張し、問題のジェイルブレイクはモデルにコードベースを読ませてソフトウェアのバグを修正させるだけのものであり、他の公開モデルでも制限なく実行可能であると指摘しました。さらに、政府は口頭による証拠のみを提供し、強力な技術的実証は行っていないこと、またOpenAIのGPT-5.5では同様の能力がジェイルブレイクなしで既に利用可能であることなどを挙げました。同一基準を適用すれば、主要なAIプロバイダーのフロンティアモデル全てを停止しなければならないと主張しました。
この事件はサイバーセキュリティ分野に広範な影響を及ぼします。まず、攻撃的AIが政府の監視下に置かれたことが明確になりました。政府が数時間以内に行動を起こしたことは、攻撃的可能性を持つAI能力に対する警戒の高さを示しています。第二に、プロンプトインジェクションとジェイルブレイクが現実の攻撃ベクトルであることが証明され、AIセキュリティは対話レベルのコンテンツフィルターのみに依存できないことが明らかになりました。セキュリティチームは、マルチターンの攻撃シーケンス、文字置換、コンテキスト操作などの手法をテスト範囲に含める必要があります。第三に、防御的AIと攻撃的AIの境界が極めて曖昧であることが示されました。Mythos 5は防御者が脆弱性を発見し修正するために設計されましたが、同じ能力は簡単に武器化され得ます。最後に、この事件は政府が商業AI企業に対して稼働中のモデルを完全に停止させた初の事例となり、フロンティアAIモデルの展開は今後ますます厳しい規制の対象となることを示しています。
現在、Claude Opus 4.8やHaikuなどの他のAnthropicモデルは引き続き利用可能です。Anthropicは政府の枠組み内でFable 5とMythos 5へのアクセス回復を目指していると述べていますが、時期は未定です。ChatGPTやGeminiなどの競合プラットフォームは今回の指令の影響を受けていません。
セキュリティチームは直ちに以下の行動を取るべきです:特定のAIモデルやプロバイダーへの依存度を監査し、単一障害点を特定する;AI攻撃面を侵入テストの範囲に追加し、プロンプトインジェクション、ジェイルブレイク、コンテキスト操作のテストを含める;AIの判断にのみ依存しない独立したセーフティレイヤーを構築する;AI規制リスクをリスク管理フレームワークに組み込む;AI加速型の攻撃シナリオをシミュレーションし、検出および対応能力を検証する。
この出来事は、AIツールがますます強力になり、監視が強化され、使用者の責任が増大していることを示しています。イノベーションを阻害せずにリスクを管理する方法は、今後業界全体が直面する重要な課題です。