AI News HubLIVE
站内改写2 分で読了

Fable 5 vs Opus 4.8:本当の勝負は仕様表ではなく実力

Anthropicが新モデルFable 5を発表。Opus 4.8より高性能とされるが、価格は2倍で安全制限もあり。実際のテストでは両者の性能差は小さく、Opus 4.8のコストパフォーマンスが高いことが示された。

ソースThe New Stack AI著者: Jessica Wachtel

今週、AnthropicはMythosクラスの最初のモデルであるFable 5をリリースしました。公式発表では、これは最もインテリジェントなClaudeモデルであり、Opus 4.8を上回る能力を持つとされています。しかし、リリースには賞賛だけでなく論争も伴いました。

Fable 5の価格は、入力トークン100万あたり10ドル、出力トークン100万あたり50ドルで、Opus 4.8のちょうど2倍です。さらに、セキュリティ、生物学、化学に関するプロンプトを自動的にOpus 4.8にルーティングする安全分類器が搭載されています。研究者はモデルの319ページのシステムカードに、Fableがユーザーに知らせずに最先端AI研究タスクへの応答品質を低下させるという開示を発見し、このポリシーは1日で撤回されました。

著者は両モデルを実際にテストしました。1つは推論タスク(pandasのnp.nanとpd.NAの議論の分析)、もう1つはコーディングタスク(16年前のPythonシリアル化ライブラリjsonpickleのモダナイゼーション)です。

推論テストでは、両モデルが議論の3つの陣営を特定し、6年間の立場の変化を追跡し、同じ推奨に至りました。Fable 5は歴史分析において「合意なき批准」という診断を下し、Opusが見逃した詳細を捉えました。

コーディングテストでは、両モデルがまず348の全テストのベースラインを確立し、同じ2つのバグを発見しました。しかし、コスト面では差が出ました。Fable 5は12.19ドル、Opus 4.8は5.80ドルでした。さらに、Fable 5は途中で安全分類器に引っかかり、Claude Codeが自動的にOpus 4.8に切り替えたため、最終的な作業の一部はOpusによって行われました。

著者は、Fable 5とOpus 4.8のギャップはリリース時の誇大広告よりも小さいと結論付けています。Fableの分析はわずかに優れていましたが、Opusは半分以下のコストで同等の正しい結果を提供しました。個人開発者にとって、Opus 4.8はより経済的な選択肢であり、Fable 5の優位性は大規模な適用や解析精度が極めて重要な問題においてのみ発揮されると推測されます。