2026-05-06 08:36 UTC+9サイト内リライト2 分で読了更新: 2026-06-27 09:25 UTC+9

Kimi K2.6 テックブログ：オープンソースコーディングの進化

Kimi K2.6 は、最先端のコーディング、長期間の実行、エージェントスウォーム機能を備えた新しいオープンソースモデルです。本記事では、その機能、ベンチマーク、コミュニティからのフィードバックを詳しく紹介します。

ソースKimi Blog

記事インテリジェンス

エンジニア上級

要点

Kimi K2.6 はコーディングタスクで最先端の性能を達成し、長期間の自律実行をサポート
SWE-Bench、Terminal-Bench、BrowseComp などのベンチマークで優れた結果
エージェントスウォームは最大300のサブエージェントを並行して動作可能
Claw Groups により、異種エージェントの協調動作と自律ワークフローを実現

重要な理由

このニュースが重要なのは、Kimi K2.6 はコーディングタスクで最先端の性能を達成し、長期間の自律実行をサポートためです。

技術的影響

モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。

このパネルは AI が生成し、正確性を確認済みです。

Kimi K2.6 は、Moonshot AI が公開した最新のオープンソースモデルであり、コーディング、長期間の実行、エージェントスウォーム機能に特化しています。このモデルは、Kimi.com、Kimi App、API、Kimi Code を通じて利用可能です。

長期間のコーディングタスクにおいて、K2.6 は顕著な改善を示しました。例えば、Mac 上で Qwen3.5-0.8B モデルを自律的にダウンロードおよびデプロイし、Zig 言語による推論最適化により、スループットを約15トークン/秒から193トークン/秒に向上させ、LM Studio より約20%高速化しました。別の例では、8年前のオープンソース金融マッチングエンジン exchange-core を13時間かけて自律的にリファクタリングし、12の最適化戦略を反復、4000行以上のコードを修正、スループットを185%向上させました。

K2.6 は業界テストでも好評を得ています。テスト担当者は、指示追従能力の向上、エッジケースへの対応、大規模コードベースでの適応性を称賛しました。また、シンプルなプロンプトから完全なフロントエンドインターフェースを生成し、認証、ユーザー操作、データベース操作を含むフルスタックワークフローをサポートします。

エージェントスウォームは、K2.6 の主要な機能です。システムはタスクを動的に分解し、最大300のサブエージェントが4000以上のステップを並行して実行します。これにより、レイテンシが大幅に削減され、出力品質が向上します。また、PDFやスプレッドシートなどの高品質ファイルを再利用可能なスキルに変換できます。

プロアクティブエージェントの分野では、K2.6 は OpenClaw や Hermes などの自律エージェントを支えています。例えば、K2.6 ベースのエージェントは5日間自律運用され、監視、インシデント対応、システム運用を処理しました。

Claw Groups 研究プレビューでは、異種エージェントのオープンなエコシステムを導入し、複数のエージェントと人間が協調作業できます。K2.6 はアダプティブコーディネーターとして機能し、スキルに基づいてタスクを割り当て、失敗時に自動的に再割り当てします。

ベンチマークでは、K2.6 は優れたパフォーマンスを示しました。HLE-Full ツール使用時54.0、BrowseComp 83.2、DeepSearchQA F1 92.5、Terminal-Bench 2.0 66.7、SWE-Bench Pro 58.6、AIME 2026 96.4、GPQA-Diamond 90.5、MathVision ツール使用時93.2。これらの結果は、コーディング、推論、ビジョンタスクにおける総合的な強みを示しています。

Kimi K2.6 は、オープンソースモデルにおけるコーディングと自律エージェントの分野での大きな進歩を象徴し、開発者に強力な新しいツールを提供するとともに、人間とAIの協働の新たなパラダイムを推進します。