2026-05-15 10:33 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-27 08:25 UTC+8

LlamaIndex 新聞通訊 2026-04-21

本期重點包括首個AI代理文件OCR基準測試ParseBench的釋出、LiteParse正式加入LlamaIndex生態系統、Anthropic Opus 4.7的全面基準測試以及即將舉行的紐約金融科技周AI活動。

歡迎閱讀本期LlamaIndex新聞通訊！我們為您帶來了多項激動人心的更新，包括ParseBench的正式釋出——這是首個專為AI代理設計的文件OCR基準測試，涵蓋圖表、表格、內容忠實度等綜合評估指標。此外，LiteParse在獲得超過4300個GitHub星標後，正式推出了官方網站，支援50多種格式，約2秒解析500頁文件，且完全無需雲依賴。我們還對Anthropic Opus 4.7進行了全面的ParseBench測試，結果顯示其在圖表解析方面提升了42.3%，但在其他類別上表現參差不齊。LlamaParse Agentic仍以84.9%的總體效能領先，且價格極具競爭力。社群方面，紐約金融科技周AI活動將於下週舉行，包括與LinkupAPI聯合主辦的AI開發者屋頂歡樂時光，聚焦金融科技代理、文件智慧和代理工作流。此外，我們釋出了三個新指標的深度解析影片：高階表格解析指標（TableRecordMatch）——用於評估以列標題為鍵的複雜表格記錄；內容忠實度測試——透過超過16.7萬條規則測試，評估遺漏、幻覺和閱讀順序錯誤；以及圖表資料點提取（ChartDataPointMatch）——超越OCR標題，提取圖表中的實際數值資料。這些新指標將幫助開發者更全面地評估文件解析質量，確保AI代理工作流的可靠性。請訪問我們的部落格和GitHub倉庫獲取更多詳情。