AI News HubLIVE
サイト内リライト2 分で読了

Fable 5、AIフリーランス作業の新記録を樹立——しかし人類の代替はまだ先

AnthropicのFable 5モデルがリモート労働指数で16.1%の自動化率を達成し、過去最高を倍増したが、人間のフリーランサーを置き換えるには程遠い。

ソースZDNet AI

Anthropicの高評価モデルFable 5が一時的な停止を経て復活し、自動化作業の基準を再び塗り替えました。米国政府は6月30日にこのモデルを再承認しました。Anthropicによれば、Fable 5は一部の組織のみが利用可能なMythos 5と能力面で類似しています。停止前に人工知能安全センター(CAIS)が2025年10月にリリースしたリモート労働指数(RLI)でテストしたところ、AnthropicのOpus 4.8やOpenAIのGPT-5.5を大幅に上回る結果を示しました。

RLIは「AIエージェントが実際の経済的に価値のあるフリーランスプロジェクトを、クライアントが受け入れる品質で完了できる頻度」を測定します。コンピューター支援設計、グラフィックデザイン、データ分析、ビデオ制作などが含まれます。各モデルの成果物は人間の評価者により専門的な基準と比較されます。Fable 5の自動化率は16.1%で、Opus 4.8(8.3%)の2倍、GPT-5.5(6.3%)を上回りました。CAISは、これまで評価したすべてのモデルの中で最高得点であると指摘しています。以前の最高記録は4.17%(Claude Coworkフレームワークを使用したOpus 4.6)で、RLI発表時の最前線は2.5%でした。CAISは「最前線は8ヶ月足らずで4倍以上に拡大し、経済的に有能なAIエージェントがどれほど急速に進歩しているかを示す具体的なシグナルです」と述べています。

AIモデルの加速は顕著ですが、それが直ちにフリーランスの仕事の置き換えを意味するわけではありません。16%はまだ100%には程遠いです。さらに、セキュリティ上の懸念や導入の障害により、多くの企業でのAIツール統合は遅く、多段階のプロセスです。人間のフリーランサーを完全に置き換えるには、作業品質、予算、タイムラインをチェックするエージェントのネットワークが必要であり、トレードオフは一対一ではありません。CAISは人間の評価者を「LLM審査員」で置き換えようと試みましたが、モデルは失敗しました。RLI成果物の評価自体が要求の高いエージェントタスクだからです。

それでも、能力の向上により、特定の企業ではフリーランスの機会が減少する可能性があります。コンピューター操作スキルが現在の制限であり、この分野がエージェントモデルへの投資により急速に改善しているなら、その障壁は最終的に消えるかもしれません。CAISはまた、人間にとって時間のかかるタスクがAIにとって必ずしも難しいわけではないことを発見しました。この時間軸分析はコーディングには当てはまりますが、RLIが測定するより広範なリモートタスクには当てはまりません。現時点では、将来について結論を引き出すのは困難です。