LlamaIndex 新闻通讯 2026-04-21
本期重点包括首个AI代理文档OCR基准测试ParseBench的发布、LiteParse正式加入LlamaIndex生态系统、Anthropic Opus 4.7的全面基准测试以及即将举行的纽约金融科技周AI活动。
欢迎阅读本期LlamaIndex新闻通讯!我们为您带来了多项激动人心的更新,包括ParseBench的正式发布——这是首个专为AI代理设计的文档OCR基准测试,涵盖图表、表格、内容忠实度等综合评估指标。此外,LiteParse在获得超过4300个GitHub星标后,正式推出了官方网站,支持50多种格式,约2秒解析500页文档,且完全无需云依赖。我们还对Anthropic Opus 4.7进行了全面的ParseBench测试,结果显示其在图表解析方面提升了42.3%,但在其他类别上表现参差不齐。LlamaParse Agentic仍以84.9%的总体性能领先,且价格极具竞争力。社区方面,纽约金融科技周AI活动将于下周举行,包括与LinkupAPI联合主办的AI开发者屋顶欢乐时光,聚焦金融科技代理、文档智能和代理工作流。此外,我们发布了三个新指标的深度解析视频:高级表格解析指标(TableRecordMatch)——用于评估以列标题为键的复杂表格记录;内容忠实度测试——通过超过16.7万条规则测试,评估遗漏、幻觉和阅读顺序错误;以及图表数据点提取(ChartDataPointMatch)——超越OCR标题,提取图表中的实际数值数据。这些新指标将帮助开发者更全面地评估文档解析质量,确保AI代理工作流的可靠性。请访问我们的博客和GitHub仓库获取更多详情。