LlamaIndex 新聞通訊 6-10-26
本期帶來 ParseBench 在 CVPR 2026 的展示、Parse-Flow 視覺文檔智能工作流、Anthropic Fable 5 基準測試結果、LlamaParse 新粒級邊界框,以及 AI 首個匹克球錦標賽 The Agent Open。
歡迎閲讀本期 LlamaIndex 新聞通訊!我們激動地帶來多項重大更新,包括在 CVPR 2026 上展示的 ParseBench 基準、面向視覺文檔智能工作流的 Parse-Flow 發佈、Anthropic Fable 5 在 ParseBench 上的基準測試結果,以及 LlamaParse 中新增的粒級邊界框功能。此外,不要錯過 The Agent Open——AI 首屆結合代碼與競技的匹克球錦標賽。
舊金山活動方面,DAIS AI 工程師歡樂時光活動讓您遠離 Moscone 中心的人羣,與灣區的頂尖開發者共享美食與交流。該活動純屬社交性質,無演示環節。另外,The Agent Open 錦標賽作為 AI 領域的首屆匹克球賽事,設有定製球場、看台座位、AI 領袖表演賽,並匯聚了所有備受關注的基礎設施初創公司。
重點更新方面,Anthropic 的 Fable 5 模型在 ParseBench 第 0 天測試中展現了強大的文檔理解能力:內容忠實度達到 90.02%,語義格式化準確率為 72.62%,在關鍵指標上領先競爭對手 12 個百分點以上。訪問 www.parsebench.ai 可查看最新排行榜。ParseBench 在 CVPR 2026 大會上正式亮相,這是首個為 AI 智能體構建的文檔解析基準,包含超過 2000 個人工驗證頁面和 167,000 多條測試規則,覆蓋五個評估維度。該基準提供了數據集、代碼和論文,供社區使用。
LlamaParse 方面,新增的粒級邊界框為每個提取值提供詞、行和單元格級別的座標信息,實現了從提取數據到文檔中精確源位置的完整審計追蹤,非常適合合規與驗證工作流。Parse-Flow 可視化工作流設計器現已開源,它通過拖放界面處理企業文檔處理任務,包含解析、分類、拆分和提取四個原語,由 LlamaAgents 工作流驅動。該項目提供了完整的架構指南和源代碼,方便開發者定製和部署。