AI News HubLIVE
サイト内リライト2 分で読了

GLM-5.2:オープンエージェントの段階的変化

Z.aiがリリースしたGLM-5.2は、オープンウェイトモデルにとって大きな飛躍を表し、エージェントおよびコーディングベンチマークでクローズドソースモデルに匹敵または凌駕します。Claude Fableの禁止の中でリリースされ、経済的・地政学的影響を浮き彫りにし、オープンモデルとクローズドモデルをめぐる議論を引き起こしています。

ソースInterconnects (Nathan Lambert)著者: Nathan Lambert

少し前、AI界がClaude Fable 5の突然の輸出規制と実質的な禁止に衝撃を受けている中、Z.aiは最新モデルGLM-5.2をリリースしました。このモデルは6月13日(土曜日)に異例のタイミングでGLMコーディングプランメンバーに公開されました。これは通常、何か特別な理由があることを示しています。Z.aiは、AnthropicがAI研究者に対して静かなセーフガードを導入したことで高まる「反オープンサイエンス」の機運を利用しようとしたのでしょう。

GLM-5.2は一見すると段階的なアップデートに見えますが、実際にはオープンウェイトモデルの能力における飛躍的な変化を表しています。コミュニティベンチマークでは、Arenaのエージェントリーダーボードで唯一OpenAIやAnthropicの最新モデルと競合するオープンモデルとなり、デザイン面ではClaude Fableすら凌駕しました。

尊敬するAI評論家や研究者のほとんどが、実際に使用した後でこのモデルを称賛しています。これほどコミュニティの議論の焦点が明確になったオープンモデルのリリースは、DeepSeek R1以来です。GLM-5.2の進歩はAIの進歩にとって一方通行の扉のようなものです。AnthropicがClaude Codeによって記録的な収益成長率を達成しているのは、最高のモデルを持つからですが、GLM-5.2は信頼できる代替案を提供する最初のオープンモデルです。

重要なのは、GLM-5.2がコーディングハーネスで真のオープンエージェントとして感じられる最初のオープンウェイトモデルであることです。著者は実際にテストし、モデルの能力がすぐに実用的であると感じましたが、Claude Codeがモデルに画像を送信しようとしてFireworks APIを壊すといった小さな問題もありました。

このリリースは広範囲に影響を及ぼします。第一に、オープンモデルがクローズドモデルに追いつくタイムラグが約6~9ヶ月であるという見解を裏付けました。米国の研究所が計算リソースを急速に増やす中で、性能ギャップが拡大すると予想されていましたが、GLM-5.2はその予想を覆しました。これはAnthropicなどのクローズドラボに価格圧力をかけ、オープンモデル推論プロバイダーを後押しします。

より深刻な影響は規制と管理に関するものです。GLM-5.2のリリース日は、Claude FableやClaude Mythosと永続的に関連付けられるでしょう。現在、米国政府はMythos級のモデル能力は安全ではないと判断し、中国のモデルメーカーは誰でも利用可能な能力を開発しています。もしオープンモデルが禁止され、クローズドモデルだけが2年間で10倍または100倍の性能向上を遂げれば、さらに大きな問題が発生します。

意思決定者に対して、ますます高性能になるオープンモデルをどのように管理するかを想像し伝えるには、さらに多くの人々が必要です。NVIDIAの次世代チップがすでに生産に入り、アルゴリズムの進歩が続く中、AIの進歩はまだ何年も続くでしょう。オープンモデル擁護者にとっては狭い道のりですが、性能の飛躍的向上がクローズドモデルだけのものにならないようにする方法を見つける必要があります。