AI News HubLIVE
站内改写3 分で読了

米国政府によるFable 5およびMythos 5へのアクセス停止指令に関する声明

米国政府は国家安全保障を理由に、Anthropicに対しFable 5とMythos 5へのアクセスを停止するよう命じました。Anthropicは、問題とされた脆弱性は軽微であり、他のモデルでも同様の能力が利用可能であると主張しつつ、指令に従っています。サービス再開に向けて取り組んでいます。

米国政府は2026年6月12日午後5時21分(東部時間)、国家安全保障に基づく輸出管理指令を発令し、Anthropicに対し、米国内外を問わずすべての外国人(同社の外国人従業員を含む)によるFable 5およびMythos 5へのアクセスを直ちに停止するよう命じました。この命令により、Anthropicはコンプライアンス確保のため、全顧客向けにこれらのモデルを緊急に無効化せざるを得なくなりました。他のAnthropicモデル(Claudeなど)へのアクセスは影響を受けません。

Anthropicが指令を受けたのは同日午後5時21分であり、政府からは国家安全保障上の懸念に関する具体的な詳細は提供されませんでした。Anthropicの理解では、政府はFable 5を回避(ジェイルブレイク)する方法を認識したと見られます。Anthropicがこの特定の手法のデモを確認したところ、既知の軽微な脆弱性を少数特定するものであり、他の公開モデル(OpenAIのGPT-5.5を含む)でもバイパスなしに同様の脆弱性を発見できることが判明しました。これらの脆弱性は比較的単純で、日常的な防御活動で扱われているものです。

AnthropicはFableの安全性に関して、ローンチブログで述べたように、強力なセーフガードを導入しており、実際に多くのユーザーから過剰に広範だと批判されています。ローンチ前には、米国政府、英国AISI、複数の第三者機関、内部チームと協力し、合計数千時間にわたってFableのセーフガードをレッドチームテストしました。これらのテストにより、Fableのセーフガードはこれまでに展開されたどのモデルよりも実質的に効果的であることが示されました。また、モデルのセーフガードを広範囲に回避できるユニバーサルジェイルブレイクはまだ発見されていません。

Anthropicは、現在の技術では完全なジェイルブレイク耐性は不可能であると認識しており、Fable 5には多層防御戦略を採用しました。非ユニバーサルジェイルブレイクを限定的にし、ユニバーサルジェイルブレイクの作成には非常に高コストを要するようにし、さらに徹底した監視により成功した攻撃を迅速に検知・遮断することを目指しています。そのため、Fableでは顧客データの30日間保持を必須としており、これは顧客にとってコスト増となりますが、ジェイルブレイクの研究と緩和に役立っています。

Anthropicはこの多層防御戦略を支持しており、Fableのリスクを業界全体の既存モデルと同等に低減していると主張しています。政府からは有害な結果をもたらすような懸念すべき非ユニバーサルジェイルブレイクの開示すら受けていません。開示された潜在的なジェイルブレイクは完全に無害な応答か、Mythos固有の向上をもたらさない軽微な発見です。

現時点で政府から提供されたのは、特定のコードベースを読み込んでソフトウェアの欠陥を修正するようモデルに依頼するという、潜在的な非ユニバーサルジェイルブレイクの口頭証拠のみです。Anthropicが確認したところ、当該能力はOpenAIのGPT-5.5を含む他のモデルでも広く利用可能であり、システムを安全に保つ防御側が日常的に使用しています。Anthropicは今後24時間以内に詳細を共有する予定です。

Anthropicは政府の法的指令に従い、全ユーザー向けにFable 5とMythos 5へのアクセスを削除しています。しかし、限定的なジェイルブレイクの発見が、数億人のユーザーに展開された商用モデルのリコール理由になるべきではないと考えています。この基準が業界全体に適用されれば、事実上すべてのフロンティアモデルプロバイダーの新規モデル展開が停止されるとAnthropicは懸念しています。

Anthropicは、政府が透明性、公平性、明確性、技術的事実に基づく法定手続きの一部として、安全でない展開を阻止する能力を持つべきであると公に主張してきましたが、今回の措置はこれらの原則に従っていません。Anthropicはお客様への混乱をお詫びし、これは誤解であると考えており、できるだけ早くアクセスを復旧できるよう努めています。