AI News HubLIVE
公开文章 7采集文章 7可信度 88刷新频率 120 分钟
健康状态 健康来源类型 官方原文权限 官方原文最近入库 2026-05-05ID kimi-blog运行状态 已启用

Official Kimi/Moonshot blog listing; verify terms before displaying full body.

最新公开文章

Kimi K2:开放智能体智能平台

Kimi K2 是一个开放智能体智能平台,提供多种工具和研究成果,包括电子表格公式、文档处理、AI代理部署、代码代理、浏览器扩展等,以及Kimi K2.6、Agent Swarm等前沿研究。

  • 支持Excel公式、数据透视表和图表生成
  • 一键部署24/7运行的AI代理(Kimi Claw)
站内正文

Kimi K2 思考模型

Kimi K2 是一个开源思考模型,提供多种AI工具,包括Excel公式生成、文档处理、代码代理、浏览器扩展等,支持Agent Swarm和深度研究功能。

  • 开源思考模型,适用于多种AI任务
  • 集成Sheets、Docs、Code等工具
站内正文

Kimi 供应商验证器

Kimi 开源了供应商验证器(KVV),旨在帮助用户验证开源模型推理实现的准确性。项目包含六项关键基准测试,用于检测部署中的常见问题,并推动基础设施提供商修复根本原因。

  • KVV 包含预验证、OCRBench、MMMU Pro、AIME2025、工具调用测试和 SWE-Bench 六项基准测试。
  • 项目通过持续基准测试公开排行榜,增强透明度。
站内正文

Kimi K2.5 技术博客:视觉代理智能

Kimi K2.5 是一个开源多模态模型,在编码和视觉任务上表现卓越。它引入自我导向的代理群体,可协调多达100个子代理并行执行,将任务完成时间缩短高达4.5倍。该模型在办公生产力方面同样出色,能处理复杂的文档、电子表格和演示文稿。Kimi K2.5 已通过Kimi.com、应用、API和Kimi Code等多个平台提供,标志着开源社区向通用人工智能迈出了重要一步。

  • 具备视觉能力的开源编码模型,达到最先进水平。
  • 自我导向代理群体,可并行调用多达100个子代理。
站内正文

WorldVQA:衡量多模态大语言模型中的原子世界知识

WorldVQA是一个新基准,用于评估多模态大语言模型在视觉世界知识上的事实准确性。它包含3500个高质量的图像-问题对,涵盖9个类别,重点关注头部与尾部知识分布。前沿模型准确率低于50%,暴露出过度自信和视觉知识差距。

  • WorldVQA基准测试多模态大语言模型的原子视觉世界知识,使用3500个高质量的图像-问题对。
  • 模型表现显著挣扎,顶级模型准确率低于50%,尤其在长尾知识上表现更差。
站内正文

Kimi Agent Swarm:大规模并行100个子代理

Kimi推出Agent Swarm,支持最多100个子代理并行工作,实现水平扩展而非垂直扩展。该架构让AI自我组织,如同一个公司或实验室,可自动分解任务、分配代理、合成结果,在广泛研究、批量处理、多角度分析等场景显著提升效率。目前面向顶级订阅用户开放研究预览。

  • Agent Swarm实现水平扩展,支持多达100个并行子代理和1500次工具调用,速度比串行快4.5倍。
  • 系统自动组织代理团队,包括CEO、研究员、分析师等角色,无需人类微管理。
站内正文

Kimi K2.6 技术博客:推进开源编码

Kimi K2.6 是一款全新的开源模型,具备最先进的编码、长周期执行和智能体群体能力。本文详细介绍了其核心技术、性能提升、应用场景以及社区反馈。

  • Kimi K2.6 在编码任务上达到领先水平,支持长周期自主执行
  • 模型在SWE-Bench、Terminal-Bench等基准测试中表现出色
站内正文

全部来源