LlamaIndex 新聞通訊 2026-04-21
本期重點包括首個AI代理文件OCR基準測試ParseBench的釋出、LiteParse正式加入LlamaIndex生態系統、Anthropic Opus 4.7的全面基準測試以及即將舉行的紐約金融科技周AI活動。
歡迎閱讀本期LlamaIndex新聞通訊!我們為您帶來了多項激動人心的更新,包括ParseBench的正式釋出——這是首個專為AI代理設計的文件OCR基準測試,涵蓋圖表、表格、內容忠實度等綜合評估指標。此外,LiteParse在獲得超過4300個GitHub星標後,正式推出了官方網站,支援50多種格式,約2秒解析500頁文件,且完全無需雲依賴。我們還對Anthropic Opus 4.7進行了全面的ParseBench測試,結果顯示其在圖表解析方面提升了42.3%,但在其他類別上表現參差不齊。LlamaParse Agentic仍以84.9%的總體效能領先,且價格極具競爭力。社群方面,紐約金融科技周AI活動將於下週舉行,包括與LinkupAPI聯合主辦的AI開發者屋頂歡樂時光,聚焦金融科技代理、文件智慧和代理工作流。此外,我們釋出了三個新指標的深度解析影片:高階表格解析指標(TableRecordMatch)——用於評估以列標題為鍵的複雜表格記錄;內容忠實度測試——透過超過16.7萬條規則測試,評估遺漏、幻覺和閱讀順序錯誤;以及圖表資料點提取(ChartDataPointMatch)——超越OCR標題,提取圖表中的實際數值資料。這些新指標將幫助開發者更全面地評估文件解析質量,確保AI代理工作流的可靠性。請訪問我們的部落格和GitHub倉庫獲取更多詳情。