「彼らは我々を騙した」:性格の衝突でAnthropicのモデルがオフラインに
Axiosの記事によると、Anthropicと米国政府の間の性格の衝突が、輸出規制によりAIモデル(MythosとFable)の停止を引き起こした。関係者によると、解決策はモデルを脱獄不可能にするか、態度を改善することだという。
Axiosの詳細な報道によると、Anthropicと米国政府の間の性格の衝突が、同社のAIモデル「Mythos」および「Fable」が輸出規制により停止される事態を招いた。この記事は、多くの「政権関係者」や「Anthropicに近い情報筋」を引用し、両者のコミュニケーションと態度における深刻な不一致を浮き彫りにしている。これは、米国政府の輸出規制によるMythos/Fable停止事件に関する最も詳細な内部事情の報道とされている。
本日、Anthropicの研究者であるLogan Graham、Dave Orr、そしてブログでよく話題になるNicholas Carliniがワシントンの商務省当局者と会談する予定だ。会談が目前に迫っているが、記事の結びの言葉は楽観を許さない。記事は、一つの選択肢はAnthropicのモデルを脱獄不可能にすることだが、完璧な脱獄耐性は不可能かもしれないと指摘する。それができない場合、政府側はAnthropicが態度を改め、「全員が安全で、安心し、幸せだと感じる」ことを望んでいるという。
さらに、筆者のSimon Willisonは、Anthropicが2023年の論文「Universal and Transferable Adversarial Attacks on Aligned Language Models」で述べられた攻撃手法にうまく対処できたのか疑問視している。この論文は言語モデルに対する敵対的攻撃手法を示しており、Anthropicのモデルは依然として脆弱である可能性がある。この出来事は、Anthropicのモデル利用可能性に影響を与えただけでなく、AIの安全性と政府規制に関する広範な議論を引き起こしている。
この記事は2026年6月15日に投稿されたSimon Willisonによるリンクブログであり、Axiosの記事に対する分析とコメントを提供している。記事では、Anthropicのモデル停止事件が、テクノロジー企業と政府機関の協力とコミュニケーションの重要性を浮き彫りにしたと述べている。今後、イノベーションと安全性のバランスをどのように取るか、同様の衝突を回避する方法は、業界全体が直面する課題である。