LlamaIndex 新闻通讯 6-10-26
本期带来 ParseBench 在 CVPR 2026 的展示、Parse-Flow 视觉文档智能工作流、Anthropic Fable 5 基准测试结果、LlamaParse 新粒级边界框,以及 AI 首个匹克球锦标赛 The Agent Open。
欢迎阅读本期 LlamaIndex 新闻通讯!我们激动地带来多项重大更新,包括在 CVPR 2026 上展示的 ParseBench 基准、面向视觉文档智能工作流的 Parse-Flow 发布、Anthropic Fable 5 在 ParseBench 上的基准测试结果,以及 LlamaParse 中新增的粒级边界框功能。此外,不要错过 The Agent Open——AI 首届结合代码与竞技的匹克球锦标赛。
旧金山活动方面,DAIS AI 工程师欢乐时光活动让您远离 Moscone 中心的人群,与湾区的顶尖开发者共享美食与交流。该活动纯属社交性质,无演示环节。另外,The Agent Open 锦标赛作为 AI 领域的首届匹克球赛事,设有定制球场、看台座位、AI 领袖表演赛,并汇聚了所有备受关注的基础设施初创公司。
重点更新方面,Anthropic 的 Fable 5 模型在 ParseBench 第 0 天测试中展现了强大的文档理解能力:内容忠实度达到 90.02%,语义格式化准确率为 72.62%,在关键指标上领先竞争对手 12 个百分点以上。访问 www.parsebench.ai 可查看最新排行榜。ParseBench 在 CVPR 2026 大会上正式亮相,这是首个为 AI 智能体构建的文档解析基准,包含超过 2000 个人工验证页面和 167,000 多条测试规则,覆盖五个评估维度。该基准提供了数据集、代码和论文,供社区使用。
LlamaParse 方面,新增的粒级边界框为每个提取值提供词、行和单元格级别的坐标信息,实现了从提取数据到文档中精确源位置的完整审计追踪,非常适合合规与验证工作流。Parse-Flow 可视化工作流设计器现已开源,它通过拖放界面处理企业文档处理任务,包含解析、分类、拆分和提取四个原语,由 LlamaAgents 工作流驱动。该项目提供了完整的架构指南和源代码,方便开发者定制和部署。