AI News HubLIVE
站内改写2 分で読了

【AINews】FableとMythosが正式に危険すぎてリリース不可に

Anthropicがリリースからわずか3日後に、米国政府の指令によりClaude Fable 5とMythos 5のアクセスを停止し、「モデル主権」論争を引き起こした。同時に、オープンソースコミュニティからKimi K2.7-CodeとMiniMax M3がリリースされ、ベンチマークやエージェントインフラにも重要なアップデートがあった。

ソースLatent Space

6月11日から12日のAIニュースで最大の話題は、Anthropicが最新モデルClaude Fable 5とMythos 5のアクセスを一時停止したことです。米国政府の指令により、外国人ユーザーへの提供が制限され、全ユーザーに影響が及びました。Anthropicは、政府が「潜在的な狭い非普遍的なジェイルブレイク」の口頭証拠のみを提供したと述べ、誤解の可能性を示唆しています。この措置は即座に下流の製品やベンチマークに波及し、Cognition/DevinやAgent Arenaなどに影響を与えました。

AIコミュニティはこの出来事を「モデル主権」リスクと捉え、単なる政策問題ではなく、クローズドなフロンティアAPIが輸出規制で突然利用不可になるリスクを指摘しました。Anthropicはレート制限をリセットして影響を緩和しようとしましたが、業界はインフラの所有権とサプライチェーンの多様化の重要性を再認識しました。

一方、オープンソースモデル分野では大きなリリースがありました。Moonshot AIがKimi K2.7-Codeをオープンソース化しました。これはコーディングに特化したMoEモデルで、総パラメータ1T、アクティブ32B、256Kコンテキストを備え、複数のベンチマークでK2.6を上回りましたが、コミュニティの評価は「より正直だが、必ずしも支配的ではない」というものでした。MiniMaxもM3をリリース。約428Bパラメータ、アクティブ23BのマルチモーダルMoEモデルで、1Mコンテキストをサポートし、SGLangやvLLMなどのエコシステムが即座に対応しました。

ベンチマークでは、Artificial AnalysisがSWE-Bench ProをDeepSWEに置き換え、ベンチマークゲーミングを低減。その結果、Claude Code + Fable 5が77でトップ、Codex + GPT-5.5が76で続き、ランキングが大きく変動しました。また、Epoch AIはFrontierMath v2を公開し、問題の42%のエラーを修正。これによりスコアが大幅に上昇し、数学ベンチマークの天井が急速に動いていることが示されました。

エージェントインフラでは、Artificial AnalysisがAA-AgentPerfを発表。長期間のコーディング軌跡を用いてエージェント推論の効率を測定し、「メガワットあたりのエージェント数」を指標としました。さらに、SkyPilotがSkyPilot Sandboxesをリリースし、ユーザー自身のKubernetesクラスタ上でLLM生成コードを実行可能に。サブ秒起動、1クラスタあたり5万以上のサンドボックス、ホスト型ベンダー比4~10倍のコスト削減を謳っています。これらは、デモからコンテインメント、再現性、インフラ所有への移行を示しています。

総じて、今週のニュースはAI分野の急速な変化と地政学的リスクの影響、そしてオープンソースコミュニティによるモデル革新とインフラ整備の継続的な努力を浮き彫りにしました。