LlamaIndex 新闻通讯 5-19-26
本期LlamaIndex新闻通讯介绍了ParseBench——首个为AI代理构建的OCR基准测试,以及新的开源工具:用于安全文档交互的Sandboxed-Lit CLI代理和用于私有部署的LiteParse-Server。此外,还回顾了新加坡和纽约的社区活动。
欢迎阅读本期的LlamaIndex新闻通讯!我们非常高兴地分享一系列重大更新,包括全新的文档解析工具,这些工具专为本地和私有部署设计,旨在为AI代理提供更安全、更高效的文档交互方式。其中,Sandboxed-Lit的引入标志着代理安全性的一大进步,而ParseBench的发布则填补了AI代理OCR评估的空白。此外,我们还带来了新加坡和纽约社区活动的精彩回顾。
首先,ParseBench网络研讨会即将举行。ParseBench是首个专门为AI代理构建的文档OCR基准测试。在当前的基准测试中,大多数方法未能准确反映AI代理在真实场景下的文档处理需求。ParseBench旨在帮助开发者评估文档摄取管道的准确性,从而优化代理性能。请立即注册参加我们的直播网络研讨会,深入了解ParseBench的设计理念和应用方法。
在开源更新方面,我们推出了Sandboxed-Lit CLI代理。这是一个基于Rust驱动的命令行代理,它巧妙地将LiteParse文档解析功能与安全的沙箱环境相结合。agent可以安全地与PDF、图像和Office文档进行交互,同时仍然保留完整的文件系统访问权限,确保在不牺牲安全性的前提下实现高效的数据处理。您可以访问GitHub仓库获取更多信息,并了解LiteParse的详细功能。
另一个重要的开源发布是LiteParse-Server。这是一个完全可自托管的HTTP服务器,专为私有文档解析而设计,确保所有处理过程100%在本地运行。该服务器支持Docker容器部署,也可以作为无服务器Express.js API运行。它内置了Redis缓存、OpenTelemetry集成以及生产级的可观测性功能,为构建稳健的文档解析服务提供了坚实基础。相关的博客文章和GitHub仓库已经上线,欢迎探索。
社区方面,我们在新加坡成功举办了AI工程师的现场研讨会和主题演讲,参与者反响热烈。接下来,我们期待在旧金山即将举行的世界博览会上与更多社区成员见面。在纽约,我们连续举办了多项活动,包括由Jerry Liu和Logan Markewich主持的实践开发者研讨会,以及AI工程师欢乐时光。这两场活动均座无虚席,社区参与度极高。如果您希望提前获取未来活动的信息,请订阅我们的Luma日历。
如果您尚未尝试LlamaParse,请立即注册并与我们联系,讨论您的特定企业用例。我们期待帮助您构建更强大的AI应用。