AI News HubLIVE
站内改写

Qwen 3.7が国産モデル首位に、世界ランキングは第5位

Artificial Analysisの最新ランキングで、AlibabaのQwen3.7-Maxがスコア56.6を獲得し、国産モデルでトップ、世界で第5位となりました。GPT、Claude、Geminiの最強モデルに迫る性能で、エージェント向けに設計されています。まもなくAlibaba Cloud BailianでAPIサービスとして提供開始予定です。

記事インテリジェンス

エンジニア上級

要点

  • Qwen3.7-MaxがArtificial Analysisでスコア56.6を獲得、世界第5位、国産モデル第1位
  • GPT-5.4、Gemini3.1 Pro Preview、Claude-Opus4.7に迫る性能
  • エージェントAI向けに設計、35時間・1000回以上のツール呼び出しを伴う複雑タスクを自律実行可能
  • まもなくAlibaba Cloud BailianでAPI提供予定

重要な理由

このニュースが重要なのは、Qwen3.7-MaxがArtificial Analysisでスコア56.6を獲得、世界第5位、国産モデル第1位ためです。

技術的影響

モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。

2026年5月21日、独立系AIベンチマークプラットフォームのArtificial Analysisは最新のグローバル大規模言語モデルランキングを発表しました。AlibabaのフラッグシップモデルであるQwen3.7-Maxはスコア56.6を達成し、Kimi-K2.6、DeepSeek-v4-Pro-Max、GLM5.1など他の国産モデルを全て上回り、世界ランキングで第5位に入りました。その性能はGPT-5.4 (xhigh)、Gemini3.1 Pro Preview、Claude-Opus4.7 (max)といったトップモデルに迫っており、中国のAI開発における重要なマイルストーンとなっています。このランキングは、業界で最も影響力があり信頼性の高い大規模言語モデルのベンチマークの一つとして広く認知されています。

Qwen3.7-Maxはエージェント型AI向けに特別に設計されており、コーディング、エージェント動作、推論といった中核能力で大幅な進歩を遂げています。このモデルはClaude Code、OpenClaw、Hermes Agent、Qwen Codeなど様々なエージェントフレームワークとシームレスに連携し、最長35時間・1000回以上のツール呼び出しを伴う複雑な長時間タスクを自律的に実行し、エンタープライズレベルの要求を満たす本番品質の成果を提供できます。これは自律型AIエージェントの能力における飛躍的な進歩を示しています。

関係者によると、Qwen3.7-MaxはまもなくAlibaba Cloud Bailian上でAPIサービスとして提供開始される予定です。これにより、開発者や企業がさらに容易にアクセスできるようになります。この成果は、わずか1ヶ月前に発表されたQwen3.6-Max-Previewが国産モデル最高性能を記録したことに続くもので、Alibabaの中国AI市場における支配的地位をさらに強固なものにしています。急速な改善は、中国AI業界における激しい競争と革新を示しており、Alibabaが大規模言語モデルの可能性を常に押し広げていることを物語っています。