AI News HubLIVE
站内改写2 分で読了

GLM-5.2はおそらく最も強力なテキスト専用オープンウェイトLLM

中国のAIラボZ.aiがGLM-5.2をリリース。753Bパラメータ、100万トークンのコンテキストウィンドウを持つ混合専門家モデルで、MITライセンスで公開。オープンウェイトモデルの中でArtificial Analysis Intelligence Indexでトップだが、トークン消費が多い。Code Arena WebDevで2位。SVG生成では強いが、前モデルGLM-5.1と比較してばらつきがある。

中国のAIラボZ.aiは6月13日、コーディングプラン購読者向けにGLM-5.2をリリースし、翌16日にMITライセンスで完全なオープンウェイトを公開した。本モデルはGLM-5およびGLM-5.1と同規模の7530億パラメータ(うち400億がアクティブ)で、1.51TBのモデルサイズを持つ混合専門家アーキテクチャを採用。テキスト入力専用で、Z.aiは別にビジョンモデルファミリー(最新はGLM-5V-Turbo)を持つが、こちらはオープンウェイトではない。GLM-5.2のコンテキストウィンドウは100万トークンと、GLM-5.1の20万トークンから拡大された。

本モデルのリリースは大きな話題を呼んでいる。独立ベンチマークのArtificial Analysisは、GLM-5.2がArtificial Analysis Intelligence Index v4.1でオープンウェイトモデル中トップの51点を獲得し、MiniMax-M3(44点)、DeepSeek V4 Pro(最大44点)、Kimi K2.6(43点)をリードすると報告。一方、トークン消費が多く、Intelligence Indexタスクあたり平均4万3000出力トークンを使用(GLM-5.1は2万6000、MiniMax-M3は2万4000、Kimi K2.6は3万5000、DeepSeek V4 Proは最大3万7000)。

Code Arena WebDevリーダーボードでは、Claude Fable 5に次ぐ2位にランクイン。このリーダーボードはフロントエンドWeb開発タスク(エージェント型コーディングワークフローを含む)を測定する。画像入力がないにもかかわらず高順位を獲得したことは、著者が画像入力を優れたフロントエンドモデルの鍵と誤って考えていた点で印象的である。

OpenRouter経由で9つのプロバイダから利用可能で、ほとんどの場合、入力100万トークンあたり1.40ドル、出力あたり4.40ドル。比較として、GPT-5.5は5ドル/30ドル、Claude Opus 4.5-4.8は5ドル/25ドル。

SVG生成テストでは、GLM-5.2は「自転車に乗るペリカン」のプロンプトに対して、完全にアニメーション化された自己完結型SVGを返し、すべてのアニメーションが正常に動作(車輪のスポーク、ペダルの回転、ペリカンの上下動、目が外れることもなし)。しかし、「電動スクーターに乗る北バージニアオポッサム」では、GLM-5.1の傑作とは対照的に、背景のグリッド線が不自然でスクーターの形状も悪く、オポッサムがほとんど認識できず、アニメーションすら試みていない。GLM-5.1のバージョンはオポッサムがはっきりと識別でき、尾が揺れ、キャプションが表示され、まばたきの際に目が外れる程度の軽微な問題しかなかった。この結果は、GLM-5.2が一部のタスクで品質にばらつきがあることを示している。