AI News HubLIVE
站内改写4 分で読了

Claude Fable 5をテスト:Anthropicの最新AIは期待に応えられるか?

本記事では、制限の厳しかったMythos Previewを基にAnthropicが開発したClaude Fable 5をテストする。主要機能、ベンチマーク性能、アクセス方法、スクリーンショットからのNetflixインターフェース再現や手書きダッシュボードのモダンアプリ化といった実践的なタスクを評価。結果、ビジュアル理解、コード生成、複雑なマルチステップタスクにおいて優れた性能を示した。AnthropicはFable 5を広く公開する一方、Mythos 5を信頼できるパートナーに限定することで、高度なAI能力と責任あるアクセスのバランスを図っている。

ソースAnalytics Vidhya著者: Riya Bansal

Anthropicが今年初めに発表したClaude Mythos Previewは世界的な関心を集めたが、その後、Claude Fable 5とClaude Mythos 5の2つの新製品へと進化した。これらのモデルは厳しく制限されていたMythos Previewから派生し、Anthropicの最先端AI機能をより広い層に提供する。AnthropicはFable 5がさまざまなベンチマークで新記録を打ち立てたと主張している。本記事では、これらのMythos級モデルの機能、違い、アクセス方法を詳しく見ていく。

Claude Fable 5とは?

Anthropicによると、Fable 5はソフトウェアエンジニアリング、ナレッジワーク、ビジョン、科学研究、長時間実行タスクにおいて、これまでのClaudeモデルを上回る性能を発揮する。さらに、タスクが複雑になり、長時間の推論が必要になるほど、Fable 5の優位性が高まるとされている。つまり、Fable 5は複数のステップ、大量の情報、拡張されたコンテキストを必要とするワークフロー(コードベース全体の移行、財務分析、複雑な文書レビュー、科学研究、スクリーンショットからアプリ生成など)向けに設計されている。短いインタラクションだけでなく、長時間にわたる要求の厳しいワークフローでも性能と一貫性を維持することを目指している。

Claude Fable 5とMythos 5の主な機能

Claude Fable 5とClaude Mythos 5の最大の改善点は、より長く複雑なタスクを処理できることだ。Anthropicによれば、コーディング、ナレッジワーク、ビジョン、メモリ、科学研究で強力な性能を発揮する。テストでは、Fable 5は大規模なコーディングプロジェクトを処理し、財務文書を分析し、チャートを解釈し、スクリーンショットからアプリケーションを再構築した。重要な差別化要因は自律性にある。モデルは長時間のワークフローに集中し、コンテキストを効果的に保持し、少ないガイダンスでマルチステップ問題を解決できる。Mythos 5はこれらの機能をサイバーセキュリティ、創薬、分子生物学、ゲノミクス研究などの分野の信頼できるユーザーに拡張する。

主な機能は以下の通り:

  • 高度なコーディング:複雑なソフトウェア工学と長期開発タスクをサポート。
  • 強化されたナレッジワーク:文書分析、財務推論、問題解決に優れる。
  • 改良されたビジョン:スクリーンショット、チャート、科学図、UIレイアウトを理解。
  • 長文脈メモリ:大規模な入力と拡張ワークフローでコンテキストを維持。
  • 科学研究サポート:信頼できるアクセス環境で生物学、ゲノミクス、創薬を支援。
  • 組み込みの安全策:サイバーセキュリティ、生物学、化学、モデル蒸留などの機密領域に追加の保護を適用。

ベンチマーク性能

Anthropicのベンチマーク結果によると、Claude Fable 5とMythos 5は、エージェンティックコーディング、ナレッジワーク、推論、ツール使用、サイバーセキュリティ、生物学、健康など、実用的なAIアプリケーションに最も重要な多くの分野でリードしている。全体的な結論として、これらのモデルは持続的な推論、広範なコンテキスト、効果的なツール使用を必要とする複雑なマルチステップタスクで最も強力である。

Claude Fable 5へのアクセス方法

Claude Fable 5の利用開始は簡単だ。オプションは以下の通り:

  • Claude API:モデル文字列claude-fable-5で即座にアクセス可能。従量制のエンタープライズプランでも利用可。
  • Claudeアプリ:Pro、Max、Team、シートベースのエンタープライズプランで2026年6月22日まで追加料金なし。アクセスは段階的に展開。
  • クラウドプラットフォーム:AWS、Google Cloud、Microsoft Foundryで利用可能。Claude CodeおよびClaudeプラットフォームも同様。
  • 料金:入力トークン100万トークンあたり10ドル、出力トークン100万トークンあたり50ドル。プロンプトキャッシングにより入力トークンコストを最大90%削減可能。

注意:Fable 5にはサイバーセキュリティと生物学に関する安全策が含まれている。フラグが立てられたクエリはOpus 4.8にルーティングされ、Fableの費用は発生しない。これはユーザーにとってほぼ透過的である。

実際のテスト

ベンチマークは有用だが、開発者にとって重要なのはモデルが実際の開発を高速化できるかどうかだ。私はFable 5を2つのタスクでテストし、視覚入力の理解、プロダクション品質のコード生成、既存のデザインから作業する能力を評価した。

タスク1:スクリーンショットからのNetflixインターフェース再現

目的:Fable 5のビジュアル理解とフロントエンド能力を評価。

入力:Netflixの「新着&人気」ページのスクリーンショット1枚。複雑なナビゲーションバー、水平スクロールのコンテンツカルーセル、コンテンツカード上のランクラベル、複数のコンテンツセクション(異なるレイアウト)、ダークテーマ、バッジ、ラベル、オーバーレイを含む。

プロンプト:「このスクリーンショットを動作するHTML/CSSページとして再現してください。ピクセル単位で正確に。フレームワークは使わず、クリーンなHTMLとCSSのみ。デスクトップとモバイルでレスポンシブにしてください。」

出力:Fable 5は重要なUIコンポーネントをすべて特定し、実際のNetflixウェブサイトに似た機能的なウェブページを作成した。ページの主要な構成要素(固定ナビゲーションと水平に配置された複数の縦型カード)を正しく認識した。特に印象的だったのは、繰り返しパターンをよく認識した点で、各ムービーカードに同じ構造を使用し、ページ全体でスタイルを統一した。

タスク2:手書きダッシュボードスケッチのモダンな分析アプリケーションへの変換

目的:実際の製品ワークフローをシミュレートし、ラフなスケッチを洗練されたアプリケーションに変換。

入力:手書きのダッシュボードワイヤーフレーム。レイアウト指示、グラフ、KPIカード、テーブル、ナビゲーション要素、ダッシュボードウィジェットを含む。

プロンプト:「この手書きのダッシュボードをモダンなSaaS分析アプリケーションに変換してください。React、Tailwind CSS、レスポンシブデザインの原則を使用。洗練されたグラフ、モダンなカードレイアウト、微妙なアニメーション、適切なスペーシング、プロフェッショナルなタイポグラフィを作成。不足しているデザインの詳細は適宜補完し、スケッチの構造は維持してください。」

出力:Fable 5はピクセルをコピーするのではなく意図を解釈した。サイドバーナビゲーション、KPI分析カード、データ可視化エリア、管理コントロール、テーブル、カスタマーインテリジェンスウィジェットを含む一貫性のあるレイアウトを生成した。モデルは不足している色、タイポグラフィ、スペーシング、インタラクティブ性をインテリジェントに補完した。いくつかのデザイン選択は追加のスタイリングに傾き、本番環境での調整が必要かもしれないが、アプリケーションは実用的で視覚的に一貫していた。

結論

今回のリリースで最も注目すべき点は、性能や新機能だけでなく、アクセス管理の方法である。Anthropicは最も強力なモデルをすべての人に公開するのではなく、広く利用可能なAIと制限されたフロンティアAIの間に明確な線引きをしている。Fable 5はMythos級のインテリジェンスの大部分を開発者、企業、Claudeユーザーに提供する一方、Mythos 5は機密領域の信頼できるパートナーや研究者に限定されている。このアプローチは、将来の高度なAIの展開方法が、能力だけでなくリスクと責任あるアクセスに基づくものになることを示唆している。ユーザーにとって、Fable 5はより強力なコーディング、推論、ビジョン、研究サポートを提供する。Anthropicにとって、Mythos 5は最もリスクの高い能力を公開せずにフロンティアAIを安全に拡張できるかどうかをテストする場となる。