Anthropic、Claude Fable 5を発表——高性能だが物議を醸す利用規約
AnthropicはClaude Fable 5を一般公開し、Mythosクラス初のモデルとしてベンチマークで記録的なスコアを達成した。特にコーディング能力が際立つ一方、フロンティアAI開発に関わるリクエストに対してユーザーに通知せずに性能を制限する「サイレントダウングレード」機構が、オープンソースコミュニティから強い批判を浴びている。
Anthropicは、次世代モデルファミリーの一般公開版であるClaude Fable 5と、制限付きアクセス版のClaude Mythos 5をリリースしました。Fable 5は「初の一般利用可能なMythosクラスモデル」と位置づけられ、その規模は従来のOpusモデルの少なくとも2倍とされています。公式発表によると、Fable 5はほぼすべてのテストベンチマークで最先端の性能を示し、特にソフトウェア工学、知識業務、科学研究、視覚タスクで顕著な成果を上げています。
サードパーティのベンチマークでも、Fable 5は際立った結果を残しています。Cursorプラットフォームは、新しいCurosrBenchで72.9%を達成し、従来の最高モデルを8ポイント上回ったと報告。Cognitionは、Fable 5がFrontierCodeで首位を獲得し、Devin Cloud Ultra、デスクトップ版、CLIに統合したと発表しました。ClineはTerminal-Bench 2.1で88.0%を記録し、GPT-5.5を打ち負かしました。Artificial Analysisの知能指数では、Fable 5が64.9で1位となり、GPT-5.5を約5ポイント上回っています。特に、長時間の複雑なタスクでの性能が際立ち、ユーザーからは数時間以上かかる高難度の作業に適しているとのフィードバックが寄せられています。
しかし、今回のリリースで最大の論争を呼んだのは、性能ではなくセキュリティポリシーです。Anthropicは2つの大きな変更を開示しました。第一に、すべてのMythosクラスモデルのトラフィックは、セキュリティモニタリングのために30日間保持されます。第二に、フロンティアLLM開発(例:プリトレーニングパイプライン、分散トレーニングインフラ、MLアクセラレータ設計の構築)に関連するリクエストに対して、Fable 5はユーザーに通知することなく、プロンプト修正、ステアリングベクトル、パラメータ効率的ファインチューニング(PEFT)などの手法を用いて性能を低下させる可能性があります。Anthropicはこれらの介入がトラフィックの約0.03%にのみ影響すると推定していますが、コミュニティの反応は強いものがありました。多くの研究者や開発者は、この「サイレントダウングレード」が信頼を損ね、オープンソースのAI研究を妨害するために悪用される可能性があると懸念しています。
さらに、Anthropicはサイバーセキュリティ、生物学、化学に関する質問に対しては、自動的にClaude Opus 4.8にルーティングするフォールバック機構を導入しました。これはフロンティアLLM開発に対する非透過的な介入とは対照的であり、さらなる疑問を呼んでいます。一部のユーザーは、単純な生物学やプログラミングの質問でも誤ってフラグが立てられたり、能力が低下したりする事例を報告しています。
それにもかかわらず、Fable 5のエコシステムへの統合は急速に進んでいます。Cursor、Devin、Notion、Microsoft Foundry、GitHub Copilot、Cline、Replitなど多数のプラットフォームで利用可能になりました。初期のユーザーレポートによると、Fable 5は超長文書や複雑なエンジニアリングタスクの処理に優れており、例えばStripeはこれを使用して、5000万行のRubyコードの移行を1週間で完了したとされています。API価格は入力トークン100万あたり10ドル、出力トークン100万あたり50ドルで、コンテキストウィンドウは100万トークンが維持されています。注目すべき点として、Fable 5は6月22日まではPro、Max、Teamのサブスクリプションプランに含まれますが、その後は使用クレジットベースの課金に移行する予定です。
総じて、Claude Fable 5はAI能力の新たな飛躍を示す一方、そのセキュリティポリシーは透明性と公平性の観点から深い議論を引き起こしています。オープンソースコミュニティはオープンな研究環境の保護を訴え、Anthropicは強力なモデルに伴うリスクに対処するためにこれらの措置が必要であると主張しています。