Kimi K2.6 技術部落格:推進開源編碼
Kimi K2.6 是一款全新的開源模型,具備最先進的編碼、長週期執行和智慧體群體能力。本文詳細介紹了其核心技術、效能提升、應用場景以及社群反饋。
Kimi K2.6 是Moonshot AI最新開源的大模型,專注於編碼、長週期執行和智慧體群體能力。該模型已透過Kimi.com、Kimi App、API和Kimi Code提供。在長週期編碼任務中,Kimi K2.6展現出顯著進步:它能在Mac上自主下載部署Qwen3.5-0.8B模型,透過最佳化Zig推理實現吞吐量從約15 tokens/秒提升至193 tokens/秒,比LM Studio快約20%。另一個案例中,它自主重構了開源金融引擎exchange-core,經過13小時、超過4000次工具呼叫,最佳化了4000多行程式碼,使引擎吞吐量提升185%和133%。
Kimi K2.6在行業測試中獲得積極反饋。測試者指出其指令遵循能力更強,能更好處理邊緣情況,在大型程式碼庫中展現出精確適應性。它還能從簡單提示生成完整前端介面,包括美觀佈局、互動元素和動畫,並支援簡單全棧工作流,如認證、使用者互動和資料庫操作。
智慧體群體是K2.6的亮點。系統可動態分解任務,由最多300個領域子代理並行執行,協調超過4000個步驟,大幅降低延遲並提升輸出質量。模型還支援將PDF、電子表格等檔案轉化為可複用技能。在主動性代理方面,K2.6支撐了OpenClaw和Hermes等持續執行代理,例如一個基於K2.6的代理自主運維5天,處理監控和事件響應。
Claw Groups研究預覽引入開放異質代理生態系統,多個代理和人類可在同一空間協作,K2.6作為自適應協調器根據技能匹配任務,並在失敗時自動重分配。
基準測試中,Kimi K2.6表現優異:HLE-Full帶工具54.0,BrowseComp 83.2,DeepSearchQA F1 92.5,Terminal-Bench 2.0 66.7,SWE-Bench Pro 58.6,AIME 2026 96.4,GPQA-Diamond 90.5,MathVision帶Python 93.2。這些結果體現了其在編碼、推理和視覺任務上的全面實力。
Kimi K2.6代表了開源模型在編碼和自主代理領域的重大進步,為開發者提供了強大的新工具,並推動了人機協作的新正規化。