LlamaIndex 新闻通讯:智能表格提取与 LiteSearch
本周的 LlamaIndex 新闻通讯重点介绍了智能表格提取、用于本地文档检索的 LiteSearch、改进的 Word 文档处理,以及与 Gemini Live API 的集成,同时提供了法律发现和社区项目的指南。
大家好,Llama 爱好者们!🦙
欢迎来到本周的 LlamaIndex 新闻通讯!我们非常高兴与大家分享文档解析方面的重大突破,包括超越基本 OCR 的智能表格提取、Word 文档处理的革命性改进,以及完全本地文档检索系统 LiteSearch 的推出。此外,我们还带来了与 Gemini Live API 的激动人心的集成,以及针对法律发现用例的全面指南。
🎉 加入我们在旧金山的活动
庆祝我们迁至“AI 水岸”!我们将于 4 月 2 日在 Second Street 的新办公室举办“第一个星期四”预热活动。欢迎与我们的团队见面,享用美食和饮品,并与社区交流。名额有限,请尽早 RSVP!
🤩 亮点
通过智能表格提取革新文档处理:我们的深度解析文章解释了现代 OCR 如何重建表格的空间关系、保留标题层级并确保复杂文档中的数据完整性。了解三个核心阶段,并查看从发票处理到实验室结果的实际应用。阅读完整指南。
LiteSearch:完全本地文档检索系统:我们的开源工程师构建了一个高性能、本地优先的检索流水线,使用 LiteParse 演示如何组装开源工具进行解析、分块、嵌入和向量存储,且无需外部依赖。查看仓库并探索 LiteParse 文档。
革命性的 Word 文档处理:我们解决了 .docx 解析中的反直觉挑战,通过将 Word XML 表格元素映射到正确的页面位置,显著提高了具有丰富格式、合并单元格和嵌套结构的表格的质量。阅读完整文章。
☁️ LlamaParse
基于语音的文档助手与 Gemini Live API:我们构建了一个演示,将 Gemini 3.1 的 Live API 与 LiteParse 集成,打造了一个基于 TUI 的语音助手,可以通过语音命令解析文档并实时回读结果。探索 GitHub 仓库并查看 LiteParse 文档。
带有边界框的视觉引用:新指南展示了如何使用 LiteParse 通过边界框提取和页面截图将文本与页面元素关联。了解更多关于视觉引用的信息。
与 Google 合作的智能金融助手:与 Google 的合作博客,展示了如何使用 LlamaParse 和 Gemini 3 构建金融助手,包括支持 VLM 的代理 OCR,用于准确的文本和表格提取。阅读博客并探索仓库。
法律发现文档处理:全面指南,用于处理困难扫描件、退化文档和复杂的法律发现用例,使用视觉模型和自定义解析指令。阅读完整博客。
✨ 社区
GDPR 违规报告自动化:恭喜竞赛获胜者 @zubeensyed,他构建了一个代理 AI 工作流,自动化 GDPR 违规报告的结构化,将事件报告映射到符合第 33 条要求的标准化架构。阅读解决方案并观看演示。