Claude Fable 5、FrontierMathの最難関問題でGPT-5.5を13ポイント上回る
AnthropicのClaude Fable 5が、FrontierMathの最も難しい層で88%の精度を達成。2026年初頭のOpus 4.5では10%未満だったことから大幅な向上。OpenAIのGPT-5.5は同層で約75%。AIの数学能力向上ペースは加速し続けている。
Anthropicが発表したClaude Fable 5は、FrontierMathベンチマークの最難関問題群で88%の精度を達成しました。これは2026年初頭にOpus 4.5が記録した10%未満から大幅な飛躍です。一方、OpenAIのGPT-5.5は同じ層で約75%のスコアに留まり、Claude Fable 5に約13ポイントの差をつけられました。この結果は、AIの数学推論能力が急速に向上していることを示しています。FrontierMathはEpoch AIが設計した、極めて複雑な数学問題を解く能力を評価するベンチマークです。Claude Fable 5の性能向上は、トレーニング手法やアーキテクチャの改良により、かつては遠い目標と考えられていた数学問題をAIが解決できるようになったことを示唆しています。研究者らは、この傾向が続けば、AIが近い将来数学研究でより重要な役割を果たすようになる可能性があると指摘しています。