AI News HubLIVE
站内改写2 分で読了

オープンソースAIがOpenAIのGPT-5.5をコーディングで打ち負かす(価格は6分の1)

GLM-5.2はZ.AIが開発したオープンソースの旗艦モデルで、100万トークンのコンテキストを持ち、複数のコーディングベンチマークでGPT-5.5を上回り、コストは僅かです。

ソースHacker News AI著者: Raj_Sidwadkar

Z.AIは、長期的なタスク向けに設計されたオープンソースの旗艦モデルGLM-5.2を正式にリリースしました。GLM-5.2の最も注目すべき特徴は、真に利用可能な100万トークンのコンテキストウィンドウであり、これによりプロジェクトレベルのエンジニアリングコンテキストを処理し、安定した実行性能を維持できます。コンテキスト長を単に拡張するソリューションとは異なり、GLM-5.2は長期的なコーディングエージェントシナリオに特化した数ヶ月のトレーニングを経ており、大規模実装、自動化研究、パフォーマンス最適化などの高価値タスクをカバーしています。

標準的なコーディングベンチマークでは、GLM-5.2は優れたパフォーマンスを発揮し、最強のオープンソースモデルとなりました。Terminal-Bench 2.1では81.0を記録し、前世代のGLM-5.1の62.0から大幅に向上し、クローズドソースのフロンティアモデルであるClaude Opus 4.8の85.0に迫ります。SWE-bench Proでは62.1を獲得し、GLM-5.1の58.4を上回りました。さらに、GLM-5.2は複数のベンチマークでOpenAIのGPT-5.5を上回り、オープンソースモデルとクローズドソースモデルのギャップをさらに縮めました。

ベンチマークの優れた結果に加えて、GLM-5.2は実際の開発シナリオでも開発者から肯定的なフィードバックを得ています。正式リリース前からGLMコーディングプランユーザーに提供され、開発者は主に4つの改善点を報告しました:プロジェクトレベルのコンテキスト能力の向上により、コードベース全体を単一の推論ワークフローに配置可能に;長期的なタスク実行の安定性が向上し、複雑なタスクが途中で逸脱しにくく;生産グレードのエンジニアリング標準への準拠が信頼性を増し、チーム開発ワークフローでのハード制約を enforcing;クライアントサイドおよびモバイルエンジニアリング能力が強化され、アプリ生成を超えて完全なデバイス上デバッグループをサポート。

GLM-5.2はストリーミング出力、関数呼び出し、コンテキストキャッシング、構造化出力、MCP統合など複数の思考モードを提供し、さまざまなシナリオに柔軟に対応します。アプリケーション面では、プロジェクトレベルのコードベース引き継ぎ、長期的リファクタリング、生産グレード標準のストレステスト、モバイルデバイス上デバッグ、WeChatミニプログラム開発、ミニゲーム開発、研究再現、コードからビデオ生成など多岐にわたります。各シナリオには推奨される使用方法が付属しており、開発者が迅速に開始できます。

GLM-5.2を試したい開発者向けに、Z.AIは完全なAPIドキュメントとクイックスタートの例を提供しています。cURL、公式Python SDK、公式Java SDK、OpenAI Python SDKなど複数の呼び出し方法が用意されています。基本的な呼び出し例では、システムプロンプトとユーザーメッセージの設定方法、そして最高の結果を得るための思考モードの有効化方法を示しています。GLM-5.2のリリースは、オープンソースAIがコーディング分野で重要な一歩を踏み出し、クローズドソースのフロンティアモデルに匹敵するパフォーマンスを極めて低いコストで提供することを示しています。