Kimi K2.6 技术博客:推进开源编码
Kimi K2.6 是一款全新的开源模型,具备最先进的编码、长周期执行和智能体群体能力。本文详细介绍了其核心技术、性能提升、应用场景以及社区反馈。
Kimi K2.6 是Moonshot AI最新开源的大模型,专注于编码、长周期执行和智能体群体能力。该模型已通过Kimi.com、Kimi App、API和Kimi Code提供。在长周期编码任务中,Kimi K2.6展现出显著进步:它能在Mac上自主下载部署Qwen3.5-0.8B模型,通过优化Zig推理实现吞吐量从约15 tokens/秒提升至193 tokens/秒,比LM Studio快约20%。另一个案例中,它自主重构了开源金融引擎exchange-core,经过13小时、超过4000次工具调用,优化了4000多行代码,使引擎吞吐量提升185%和133%。
Kimi K2.6在行业测试中获得积极反馈。测试者指出其指令遵循能力更强,能更好处理边缘情况,在大型代码库中展现出精确适应性。它还能从简单提示生成完整前端界面,包括美观布局、交互元素和动画,并支持简单全栈工作流,如认证、用户交互和数据库操作。
智能体群体是K2.6的亮点。系统可动态分解任务,由最多300个领域子代理并行执行,协调超过4000个步骤,大幅降低延迟并提升输出质量。模型还支持将PDF、电子表格等文件转化为可复用技能。在主动性代理方面,K2.6支撑了OpenClaw和Hermes等持续运行代理,例如一个基于K2.6的代理自主运维5天,处理监控和事件响应。
Claw Groups研究预览引入开放异质代理生态系统,多个代理和人类可在同一空间协作,K2.6作为自适应协调器根据技能匹配任务,并在失败时自动重分配。
基准测试中,Kimi K2.6表现优异:HLE-Full带工具54.0,BrowseComp 83.2,DeepSearchQA F1 92.5,Terminal-Bench 2.0 66.7,SWE-Bench Pro 58.6,AIME 2026 96.4,GPQA-Diamond 90.5,MathVision带Python 93.2。这些结果体现了其在编码、推理和视觉任务上的全面实力。
Kimi K2.6代表了开源模型在编码和自主代理领域的重大进步,为开发者提供了强大的新工具,并推动了人机协作的新范式。