AI News HubLIVE
サイト内リライト2 分で読了

Kimi K2.6 テックブログ:オープンソースコーディングの進化

Kimi K2.6 は、最先端のコーディング、長期間の実行、エージェントスウォーム機能を備えた新しいオープンソースモデルです。本記事では、その機能、ベンチマーク、コミュニティからのフィードバックを詳しく紹介します。

ソースKimi Blog

Kimi K2.6 は、Moonshot AI が公開した最新のオープンソースモデルであり、コーディング、長期間の実行、エージェントスウォーム機能に特化しています。このモデルは、Kimi.com、Kimi App、API、Kimi Code を通じて利用可能です。

長期間のコーディングタスクにおいて、K2.6 は顕著な改善を示しました。例えば、Mac 上で Qwen3.5-0.8B モデルを自律的にダウンロードおよびデプロイし、Zig 言語による推論最適化により、スループットを約15トークン/秒から193トークン/秒に向上させ、LM Studio より約20%高速化しました。別の例では、8年前のオープンソース金融マッチングエンジン exchange-core を13時間かけて自律的にリファクタリングし、12の最適化戦略を反復、4000行以上のコードを修正、スループットを185%向上させました。

K2.6 は業界テストでも好評を得ています。テスト担当者は、指示追従能力の向上、エッジケースへの対応、大規模コードベースでの適応性を称賛しました。また、シンプルなプロンプトから完全なフロントエンドインターフェースを生成し、認証、ユーザー操作、データベース操作を含むフルスタックワークフローをサポートします。

エージェントスウォームは、K2.6 の主要な機能です。システムはタスクを動的に分解し、最大300のサブエージェントが4000以上のステップを並行して実行します。これにより、レイテンシが大幅に削減され、出力品質が向上します。また、PDFやスプレッドシートなどの高品質ファイルを再利用可能なスキルに変換できます。

プロアクティブエージェントの分野では、K2.6 は OpenClaw や Hermes などの自律エージェントを支えています。例えば、K2.6 ベースのエージェントは5日間自律運用され、監視、インシデント対応、システム運用を処理しました。

Claw Groups 研究プレビューでは、異種エージェントのオープンなエコシステムを導入し、複数のエージェントと人間が協調作業できます。K2.6 はアダプティブコーディネーターとして機能し、スキルに基づいてタスクを割り当て、失敗時に自動的に再割り当てします。

ベンチマークでは、K2.6 は優れたパフォーマンスを示しました。HLE-Full ツール使用時54.0、BrowseComp 83.2、DeepSearchQA F1 92.5、Terminal-Bench 2.0 66.7、SWE-Bench Pro 58.6、AIME 2026 96.4、GPQA-Diamond 90.5、MathVision ツール使用時93.2。これらの結果は、コーディング、推論、ビジョンタスクにおける総合的な強みを示しています。

Kimi K2.6 は、オープンソースモデルにおけるコーディングと自律エージェントの分野での大きな進歩を象徴し、開発者に強力な新しいツールを提供するとともに、人間とAIの協働の新たなパラダイムを推進します。