Kimi Blog AI 新闻来源

公开文章 7采集文章 7可信度 88刷新频率 120 分钟

健康状态健康来源类型官方原文权限 官方原文最近入库 2026-05-05ID kimi-blog运行状态 已启用

Official Kimi/Moonshot blog listing; verify terms before displaying full body.

最新公开文章

Kimi K2：开放智能体智能平台

2026-05-06 07:41 UTC+8

Kimi K2 是一个开放智能体智能平台，提供多种工具和研究成果，包括电子表格公式、文档处理、AI代理部署、代码代理、浏览器扩展等，以及Kimi K2.6、Agent Swarm等前沿研究。

支持Excel公式、数据透视表和图表生成
一键部署24/7运行的AI代理（Kimi Claw）

Kimi K2 思考模型

2026-05-06 07:41 UTC+8

Kimi K2 是一个开源思考模型，提供多种AI工具，包括Excel公式生成、文档处理、代码代理、浏览器扩展等，支持Agent Swarm和深度研究功能。

开源思考模型，适用于多种AI任务
集成Sheets、Docs、Code等工具

Kimi 供应商验证器

2026-05-06 07:40 UTC+8

Kimi 开源了供应商验证器（KVV），旨在帮助用户验证开源模型推理实现的准确性。项目包含六项关键基准测试，用于检测部署中的常见问题，并推动基础设施提供商修复根本原因。

KVV 包含预验证、OCRBench、MMMU Pro、AIME2025、工具调用测试和 SWE-Bench 六项基准测试。
项目通过持续基准测试公开排行榜，增强透明度。

Kimi K2.5 技术博客：视觉代理智能

2026-05-06 07:40 UTC+8

Kimi K2.5 是一个开源多模态模型，在编码和视觉任务上表现卓越。它引入自我导向的代理群体，可协调多达100个子代理并行执行，将任务完成时间缩短高达4.5倍。该模型在办公生产力方面同样出色，能处理复杂的文档、电子表格和演示文稿。Kimi K2.5 已通过Kimi.com、应用、API和Kimi Code等多个平台提供，标志着开源社区向通用人工智能迈出了重要一步。

具备视觉能力的开源编码模型，达到最先进水平。
自我导向代理群体，可并行调用多达100个子代理。

WorldVQA：衡量多模态大语言模型中的原子世界知识

2026-05-06 07:39 UTC+8

WorldVQA是一个新基准，用于评估多模态大语言模型在视觉世界知识上的事实准确性。它包含3500个高质量的图像-问题对，涵盖9个类别，重点关注头部与尾部知识分布。前沿模型准确率低于50%，暴露出过度自信和视觉知识差距。

WorldVQA基准测试多模态大语言模型的原子视觉世界知识，使用3500个高质量的图像-问题对。
模型表现显著挣扎，顶级模型准确率低于50%，尤其在长尾知识上表现更差。

Kimi Agent Swarm：大规模并行100个子代理

2026-05-06 07:37 UTC+8

Kimi推出Agent Swarm，支持最多100个子代理并行工作，实现水平扩展而非垂直扩展。该架构让AI自我组织，如同一个公司或实验室，可自动分解任务、分配代理、合成结果，在广泛研究、批量处理、多角度分析等场景显著提升效率。目前面向顶级订阅用户开放研究预览。

Agent Swarm实现水平扩展，支持多达100个并行子代理和1500次工具调用，速度比串行快4.5倍。
系统自动组织代理团队，包括CEO、研究员、分析师等角色，无需人类微管理。

Kimi K2.6 技术博客：推进开源编码

2026-05-06 07:36 UTC+8

Kimi K2.6 是一款全新的开源模型，具备最先进的编码、长周期执行和智能体群体能力。本文详细介绍了其核心技术、性能提升、应用场景以及社区反馈。

Kimi K2.6 在编码任务上达到领先水平，支持长周期自主执行
模型在SWE-Bench、Terminal-Bench等基准测试中表现出色

Kimi Blog