Anthropic、画像理解でOpenAIに追いつく
Anthropicは2つの新モデルClaude Mythos 5とClaude Fable 5を発表。コーディング能力は大幅に向上したが、画像理解の進歩は限定的。テストではFable 5とGPT-5.5が昨年のトップモデルを悩ませた多くの画像問題を解決できるものの、幾何学的推論は幼児並みであり、汎用AIへの道のりはまだ遠い。
今週火曜日、Anthropicは2つの新モデル、Claude Mythos 5とClaude Fable 5をリリースした。内部構造は非常に似ており、両方とも2ヶ月前にAnthropicが発表したが一般公開されなかったClaude Mythos Previewのバリエーションである。違いはリリース方法にある。
Mythos 5は、Project Glasswingの下で厳選された組織のみが利用できる。これらの信頼できるパートナーは比較的自由にアクセスできる。一方、Fable 5は一般公開されるが、重要な制限がある。新しいシステムは、ユーザーが危険なリクエスト(ハッキングや生物兵器の設計など)を行った場合に自動的に検出し、より弱いClaude Opus 4.8にルーティングする。
MythosとFableは、過去1年間のトレンドを継続し、コーディング能力で大きな飛躍を遂げた。しかし、他の能力では進歩が少ない。例えば、フロンティアモデルは歴史的に画像理解が苦手で、これは2024年から2025年にかけて広く文書化されている。最近まで、トップモデルはアナログ時計を読んだり、画像内のアイテム数を数えたりする単純なタスクにも苦戦していた。
公式発表記事を読んで、著者はこの一文に目を留めた:「Fable 5は、視覚に関わるタスクで新たな最先端モデルです」。これらのタスク自体は重要ではないが、それらは現代AI業界で広く信じられている仮説(十分なデータと計算能力があれば、フロンティアモデルは真の汎用知能を獲得する)の興味深いテストケースとなる。新しいモデルが数学とコーディングで劇的に向上し、画像理解でわずかしか向上しないなら、真の汎用知能はまだ遠いことを示唆している。
そこで著者は、Fable 5とその主要な競合モデルの視覚能力を評価することにした。これは2025年8月のGPT-5に関する記事以来のことだ。その結果、Claude Fable 5とGPT-5.5(ただしGoogleのGeminiモデルは除く)は、昨年のトップモデルを悩ませた多くの画像ベースの問題を一貫して解決できることがわかった。Fable 5はこれらのタスクでGPT-5.5よりもわずかに優れているが、非常に僅差である。
しかし、これらのモデルはそれほど進歩していない。GPT-5.5とClaude Fable 5の幾何学的推論能力は、幼児と同程度である。この種のタスクで超人的なパフォーマンスを達成するには、より根本的なアーキテクチャの革新が必要かもしれない。