AI News HubLIVE
站内改写4 分で読了

Anthropic Fableの混乱を解説

金曜日以来、Anthropic、Mythos、Fableモデルをめぐる論争が話題となっています。本記事では、国防総省との確執、Mythosモデルの発表、ホワイトハウスとの意見の相違、Fable 5のリリースとその安全規制に対する批判、そしてトランプ政権による輸出管理措置に至るまでのタイムラインを整理します。賛否両論を分析し、筆者はAnthropicの対応はおおむね適切であり、結果的にFableの広告になっていると結論づけています。

ソースThe New Stack AI著者: Alex Wilhelm

金曜日以来、Anthropic、Mythos、Fableモデルをめぐる一連の騒動がテクノロジー業界の話題を独占しています。展開は非常に速く、目を離すと置いていかれるほどです。以下は、何が起きたのか、誰がAnthropicを善玉と見なし、誰が悪玉と見なしているのかについての私の意見を交えたタイムラインです。私の結論:Anthropicの対応はおおむね正しく、これはFableにとって最高の広告になったと言えるでしょう。

タイムライン

2月/3月:Anthropicと米国防総省が、同社のAIモデルの使用をめぐって対立。Anthropicは技術使用に一定の制限を求めました。この争いの結果、Anthropicは「サプライチェーンリスク」と見なされ、政府および政府請負業者による同社モデルの使用が制限されることになりました。

4月7日:Anthropicが新しいモデルファミリー「Mythos」を発表。Mythosが新種のサイバーセキュリティ脆弱性の発見・悪用に優れていることが判明したため、Anthropicは「Project Glasswing」を立ち上げ、主要テクノロジー企業に広範な公開前に自社ソフトウェアを強化するツールへのアクセスを提供しました。

4月16日:ホワイトハウスが、政府機関向けにMythosのバージョンを提供するよう準備していると報じられる。

4月30日:AnthropicがMythosにアクセスできるグループの拡大を希望したのに対し、ホワイトハウスは反対。パートナーが増えるとAnthropicの計算リソースが制約され、政府のモデルアクセスが制限されることを懸念したとされています。

6月2日:Anthropicは、Project Glasswingの初期パートナー50社がMythosを使用して1万以上の深刻なソフトウェア脆弱性を発見したと発表。同社はプロジェクトを15カ国150の新組織に拡大しました。また、「Mythosレベルの機能を一般的に利用可能にする」ことを約束する一方で、「モデルのサイバー機能が悪用されるのを防ぐ高度に堅牢なセーフガードは、当社および知る限り他のAI開発者もまだ開発していない」と述べました。

6月9日:AnthropicがFable 5を発表・リリース。これはサイバーセキュリティおよび生物学関連リスクを低減するために構築された「Mythosクラス」のモデルです。同社はリリースノートで、「一般的なリリースに十分な」セーフガードをMythos(Fable)に構築したと述べました。その際、Anthropicは「安全性を優先」し、Fable 5のガードレールを「理想的よりも厳格」にしたと説明しています。一部のユーザーは、Fable 5が特定のユースケース(主に生物学関連のクエリ)で過度に制限され、ほとんど役に立たないと感じました。Fable 5には蒸留防止策と厳格な30日間のデータ保持ポリシーも実装されており、Anthropicはこれにより「複雑で新しい攻撃(新しい脱獄や多数のリクエストにわたる攻撃を含む)から防御し、誤検知を特定・削減する」と主張しました。この時点で、Anthropicに対する主な批判は過度に慎重であるというものでした。Mythosを非公開にし、安全重視のFableのみをリリースすることで、二層のAI市場を生み出していると非難されたのです。人々はそれを好みませんでした!Anthropicは6月9日のFableリリース日を発表前に「複数回政府に事前通知」していました。

6月10日:Anthropicが先進的なAI開発とその経済的影響に対処するための2つのフレームワークを発表。これらのペーパーは、「政府の行動と規制——政府の過剰介入を防ぎ、イノベーションを保護するために慎重に設計された規制」を求め、モデルが「この種のリスクをもたらす場合」、政府が「その展開を阻止または防止する法的権限を持つ」ことを提唱しました。

6月11日:アマゾンのアンディ・ジャシーが、同社の研究者がFable 5から「サイバー攻撃を支援するために使用可能で、本来は禁止されるべき情報」を引き出す方法を発見したと政府に報告したと報じられました。(他にも少なくとも5社が同様の指摘を行っており、これはアマゾン固有の問題ではありませんが、重要なアクターでした。)

6月12日:ホワイトハウスの高官と政権指導部が状況を協議する会議を開き、その後、電話でAnthropic CEOのダリオ・アモデイを会話に招きました。(Politicoによると、この連絡には1時間15分を要し、同社はその間に他の幹部を派遣したとされています。アモデイが電話に出るまでに時間がかかった理由については論争がありますが、ドラマは省略して重要な点に焦点を当てましょう。)

6月12日続き:アモデイは問題を誤解と捉え、報告された「回避」は「より広範な『脱獄』と同じリスクをもたらさない」と主張。ホワイトハウスはAnthropicに「自主的にモデルを削除し、政府と協調して脆弱性に対処する」よう「促しました」。アモデイはより多くの「時間と情報」を求めたが、「モデルを撤去する約束はしませんでした」。Politicoは、スコット・ベセント財務長官が「アモデイに直接、『悪い決断』をしていると伝えた」と報じています(ホワイトハウス高官による)。

6月12日さらに:Anthropicとの合意に失敗したトランプ政権は、Fable 5とMythos 5(安全制限の異なる2つの利用可能なMythosクラスモデル)に輸出規制を課しました。Anthropicはこれに対し、「米国内外の外国人(外国人従業員を含む)によるFable 5およびMythos 5へのアクセスをすべて停止するよう命じる輸出管理指令」により、「コンプライアンスを確保するために全顧客のFable 5およびMythos 5を突然無効化せざるを得なくなった」と述べました。(強調は原文)

Anthropic善玉論

Anthropicは、独自の新規サイバー関連能力を持つと考える、より強力なAIモデルを構築しました。同社はモデルのサイバーセキュリティリスクに先手を打ち、主要テクノロジー企業からなるグループを迅速に組織し、補助金付きの早期アクセスを提供。政府はFableのセーフガードをリリース前にレッドチームテストしました……(続きはCautious Optimismで)

本記事はCautious Optimismからの抜粋です。Cautious Optimismは、テクノロジー、ビジネス、権力に焦点を当てた、適度に楽観的な出版物です。Anthropicを支持する論拠と反対する論拠、そしてAlex Wilhelmの最終的な判断については、Cautious Optimismでお読みください。