AI News HubLIVE
站内改写2 分で読了

Moonshot AI、Kimi K2.7-Codeを公開:Kimi Code Bench v2でK2.6比+21.8%のコードモデル

Moonshot AIは、Kimi K2.6をベースにしたコード特化型エージェントモデル「Kimi K2.7-Code」をオープンソース化しました。256Kのコンテキストウィンドウと、推論トークン使用量を約30%削減。6つのベンチマークでK2.6を上回り、Kimi Code Bench v2では+21.8%を達成。Kimi APIおよびKimi Codeから利用可能です。

ソースMarkTechPost著者: Asif Razzaq

今週、Moonshot AIはコード特化型エージェントモデル「Kimi K2.7-Code」をリリースしました。モデルの重みはHugging Face上でModified MITライセンスのもと公開され、Kimi APIおよびKimi Codeからもアクセス可能です。

K2.7-Codeは汎用チャットではなく、長期的なソフトウェアエンジニアリングタスクを対象としています。計画、編集、ツール実行、デバッグを多段階で行います。Moonshotはこのモデルと連携するサブスクリプション型コーディングプラットフォームも提供しています。

モデルアーキテクチャは混合エキスパート(MoE)で、総パラメータ1T、トークンあたり32Bを活性化します。384のエキスパートを持ち、トークンごとに8つのエキスパートと1つの共有エキスパートを選択、61層(うち1層は高密度)で構成。アテンションにはMLA、フィードフォワードにはSwiGLUを採用。MoonViT視覚エンコーダは4億パラメータを追加し、画像・動画入力に対応。ネイティブINT4量子化を実装し、コンテキストウィンドウは256Kトークン(262,144)です。

使用上の制約として、思考モードは必須で無効化するとAPIエラーが返ります。サンプリングパラメータは固定(temperature 1.0、top_p 0.95、n 1、ペナルティ0.0)で、デフォルト最大出力は32,768トークン。セルフホスティングはvLLM、SGLang、KTransformersで可能ですが、Hugging Faceリポジトリは約595 GBと大容量で、サーバークラスのデプロイが前提です。

ベンチマークでは、Moonshotチームが6つの指標を公表。K2.7-CodeはK2.6を全指標で上回り、最大の向上はKimi Code Bench v2で50.9→62.0(+21.8%)。また、MCP Mark Verifiedでは81.1を記録し、Claude Opus 4.8(76.4)を上回りました。MLS Bench LiteではGPT-5.5に迫るスコアです。

推論トークンの効率性も際立ちます。K2.6比で約30%の削減を報告しており、「考えすぎの低減」と位置づけています。推論トークンは出力トークンとして課金されるため、長いコーディングタスクではコスト削減、処理速度向上、コンテキスト制限までのステップ増加につながります。

主なユースケースは、リポジトリ規模のリファクタリング、コードレビュー、MCPツールワークフロー、長文コンテキスト分析です。例えば、失敗するテストスイートをエージェントに指示すると、ファイルを読み込み、モジュール間を編集し、テストが通るまで再実行します。プルリクエストの差分を渡してリスク分析を依頼することもでき、256Kウィンドウが大規模な差分やログを収容します。

API価格は入力100万トークンあたり$0.95、出力$4.00、キャッシュ入力は$0.19と、クローズドなフロンティアモデルに比べて低価格です。オープンな代替として、Qwen3-Coder-480B-A35B(Qwenライセンス)がありますが、価格はホストによって異なります。

すべてのベンチマークは自社報告であり、独立した検証待ちですが、K2.7-Codeはコード分野で明確な進歩を示しています。オープンウェイト、固定サンプリング、思考モードの強制、大規模なセルフホスティング要件が主なトレードオフです。