2026-05-15 10:33 UTC+8站内改写1 分钟阅读更新: 2026-06-27 08:25 UTC+8

LlamaIndex 新闻通讯 2026-04-21

本期重点包括首个AI代理文档OCR基准测试ParseBench的发布、LiteParse正式加入LlamaIndex生态系统、Anthropic Opus 4.7的全面基准测试以及即将举行的纽约金融科技周AI活动。

欢迎阅读本期LlamaIndex新闻通讯！我们为您带来了多项激动人心的更新，包括ParseBench的正式发布——这是首个专为AI代理设计的文档OCR基准测试，涵盖图表、表格、内容忠实度等综合评估指标。此外，LiteParse在获得超过4300个GitHub星标后，正式推出了官方网站，支持50多种格式，约2秒解析500页文档，且完全无需云依赖。我们还对Anthropic Opus 4.7进行了全面的ParseBench测试，结果显示其在图表解析方面提升了42.3%，但在其他类别上表现参差不齐。LlamaParse Agentic仍以84.9%的总体性能领先，且价格极具竞争力。社区方面，纽约金融科技周AI活动将于下周举行，包括与LinkupAPI联合主办的AI开发者屋顶欢乐时光，聚焦金融科技代理、文档智能和代理工作流。此外，我们发布了三个新指标的深度解析视频：高级表格解析指标（TableRecordMatch）——用于评估以列标题为键的复杂表格记录；内容忠实度测试——通过超过16.7万条规则测试，评估遗漏、幻觉和阅读顺序错误；以及图表数据点提取（ChartDataPointMatch）——超越OCR标题，提取图表中的实际数值数据。这些新指标将帮助开发者更全面地评估文档解析质量，确保AI代理工作流的可靠性。请访问我们的博客和GitHub仓库获取更多详情。