2026-05-15 10:33 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-27 08:25 UTC+8

LlamaIndex 新聞通訊 2026-04-21

本期重點包括首個AI代理文檔OCR基準測試ParseBench的發佈、LiteParse正式加入LlamaIndex生態系統、Anthropic Opus 4.7的全面基準測試以及即將舉行的紐約金融科技周AI活動。

歡迎閲讀本期LlamaIndex新聞通訊！我們為您帶來了多項激動人心的更新，包括ParseBench的正式發佈——這是首個專為AI代理設計的文檔OCR基準測試，涵蓋圖表、表格、內容忠實度等綜合評估指標。此外，LiteParse在獲得超過4300個GitHub星標後，正式推出了官方網站，支持50多種格式，約2秒解析500頁文檔，且完全無需雲依賴。我們還對Anthropic Opus 4.7進行了全面的ParseBench測試，結果顯示其在圖表解析方面提升了42.3%，但在其他類別上表現參差不齊。LlamaParse Agentic仍以84.9%的總體性能領先，且價格極具競爭力。社區方面，紐約金融科技周AI活動將於下週舉行，包括與LinkupAPI聯合主辦的AI開發者屋頂歡樂時光，聚焦金融科技代理、文檔智能和代理工作流。此外，我們發佈了三個新指標的深度解析視頻：高級表格解析指標（TableRecordMatch）——用於評估以列標題為鍵的複雜表格記錄；內容忠實度測試——通過超過16.7萬條規則測試，評估遺漏、幻覺和閲讀順序錯誤；以及圖表數據點提取（ChartDataPointMatch）——超越OCR標題，提取圖表中的實際數值數據。這些新指標將幫助開發者更全面地評估文檔解析質量，確保AI代理工作流的可靠性。請訪問我們的博客和GitHub倉庫獲取更多詳情。