AI News HubLIVE
站內改寫1 分鐘閱讀

Kimi K2.6 技術博客:推進開源編碼

Kimi K2.6 是一款全新的開源模型,具備最先進的編碼、長週期執行和智能體羣體能力。本文詳細介紹了其核心技術、性能提升、應用場景以及社區反饋。

來源Kimi Blog

Kimi K2.6 是Moonshot AI最新開源的大模型,專注於編碼、長週期執行和智能體羣體能力。該模型已通過Kimi.com、Kimi App、API和Kimi Code提供。在長週期編碼任務中,Kimi K2.6展現出顯著進步:它能在Mac上自主下載部署Qwen3.5-0.8B模型,通過優化Zig推理實現吞吐量從約15 tokens/秒提升至193 tokens/秒,比LM Studio快約20%。另一個案例中,它自主重構了開源金融引擎exchange-core,經過13小時、超過4000次工具調用,優化了4000多行代碼,使引擎吞吐量提升185%和133%。

Kimi K2.6在行業測試中獲得積極反饋。測試者指出其指令遵循能力更強,能更好處理邊緣情況,在大型代碼庫中展現出精確適應性。它還能從簡單提示生成完整前端界面,包括美觀佈局、交互元素和動畫,並支持簡單全棧工作流,如認證、用户交互和數據庫操作。

智能體羣體是K2.6的亮點。系統可動態分解任務,由最多300個領域子代理並行執行,協調超過4000個步驟,大幅降低延遲並提升輸出質量。模型還支持將PDF、電子表格等文件轉化為可複用技能。在主動性代理方面,K2.6支撐了OpenClaw和Hermes等持續運行代理,例如一個基於K2.6的代理自主運維5天,處理監控和事件響應。

Claw Groups研究預覽引入開放異質代理生態系統,多個代理和人類可在同一空間協作,K2.6作為自適應協調器根據技能匹配任務,並在失敗時自動重分配。

基準測試中,Kimi K2.6表現優異:HLE-Full帶工具54.0,BrowseComp 83.2,DeepSearchQA F1 92.5,Terminal-Bench 2.0 66.7,SWE-Bench Pro 58.6,AIME 2026 96.4,GPQA-Diamond 90.5,MathVision帶Python 93.2。這些結果體現了其在編碼、推理和視覺任務上的全面實力。

Kimi K2.6代表了開源模型在編碼和自主代理領域的重大進步,為開發者提供了強大的新工具,並推動了人機協作的新範式。