AI News HubLIVE
站内改写2 分钟阅读

n8n的LlamaParse平台节点:利用AI解析、分类、提取和检索文档

LlamaParse平台社区节点已发布v5和v6版本,现为n8n官方验证的社区节点。该节点整合了五个LlamaCloud资源(解析、分类、拆分、提取、检索),支持作为AI Agent工具使用。v5重写了基础架构,v6将多个独立节点整合为一个,并增加了索引管理功能。文章还提供了三种工作流示例:将检索器作为Agent工具、构建分类-提取-验证流水线、以及评估不同解析模式的输出质量。

我们发布了LlamaParse平台社区节点的v5和v6版本,该包现已正式成为n8n生态系统中经过验证的社区节点。本文介绍该节点的功能、两个主要版本的变更内容,以及三个可以利用它构建的具体工作流。

节点功能

该包提供了一个单一节点——LlamaParse平台,通过一个资源/操作下拉菜单展示了五个LlamaCloud资源。所有资源共享同一LlamaParse API凭据。

  • 解析(Parse):输入二进制文件,输出Markdown或纯文本格式的文本。
  • 分类(Classify):输入二进制文件及类别/描述规则,输出分类结果、原因和置信度。
  • 拆分(Split):输入二进制文件和类别,按片段输出每个片段的类别、置信度和页数。
  • 提取(Extract):输入二进制文件和提取配置ID,输出与模式匹配的序列化JSON结果。
  • 检索(Retrieve):输入索引ID、查询和topK,输出上下文字符串数组。

解析支持四种层级(fast、cost_effective、agentic、agentic_plus)并可选固定解析器版本。检索同时支持v1 Pipelines API和v2 Index Retrieval API。每个资源都标记为usableAsTool: true,因此可以附加到n8n AI Agent作为可调用工具,而不仅仅是存在于线性流程中。

v5版本变更

v5是基础架构的重写:

  • 放弃了SDK,改用直接HTTP调用LlamaCloud API,无需打包和维护SDK,表面更小、更可预测。
  • 提取功能从V1迁移到V2,与当前提取服务产品配置模型对齐。
  • API基础URL可配置,因此区域特定和自托管部署可以作为凭据设置,而无需分支。
  • 重写了二进制文件处理,使得文件可以从任何上游节点流畅传递。

v6版本变更

v6整合了包结构。早期版本发布了多个独立节点(LlamaParse、LlamaClassify、LlamaExtract等),v6将它们合并为单一的LlamaParse平台节点,采用与n8n第一方节点一致的资源/操作模式。此外,还增加了用于管理和检索索引的索引操作,并纳入了n8n验证审查中的修复(linting、打包和类命名更正)。

在n8n实例上安装节点

要安装LlamaParse平台节点,请前往n8n仪表板的设置 → 社区节点,然后提供@llamaindex/n8n-nodes-llamacloud作为NPM包名称,点击安装按钮即可。

示例工作流

要使用LlamaParse集成,添加LlamaParse API凭据(从cloud.llamaindex.ai粘贴密钥;基础URL默认为https://api.cloud.llamaindex.ai),然后将节点拖放到画布上。

1. 将检索器作为Agent工具

由于节点是usableAsTool: true,检索资源可以直接连接到AI Agent的工具列表中:

Agent根据用户的查询决定是否调用检索器工具。例如,如果用户提出一个需要上下文的问题,而当前Agent无法获取该上下文,Agent可以从索引中检索相关信息。Agent调用工具,接收检索到的块,并在同一轮次中基于它们进行推理:这样,你就成功地将Agent连接到自己的知识库中,并且可以轻松地添加更多工具和连接。

2. 分类 → 提取 → 验证

一个文档处理流水线,将原始文件转换为结构化的、经过验证的输出:

分类将每个文档路由到正确的分支(例如,发票与合同),提取使用针对该类型调整的模式提取结构化字段,LLM节点根据文件的解析内容验证提取数据的正确性。此外,分类中的置信度字段可以作为将低置信度文档发送到人工审查分支的便捷门控。

3. 评估解析输出

使用不同的解析模式评估解析输出:

链式解析(Agentic和Cost Effective模式),然后将输入文件通过两个解析器,并将结果收集到一个LLM提示中,例如:

{agentic output}

{cost effective output}

确定哪个层级产生了最高质量的结果。

最后,将LLM作为评判者的裁决表示为结构化输出,用于评估:这在试图为文档找到准确性和延迟之间的最佳平衡时特别有用。

开始使用

你可以立即开始使用LlamaParse平台节点,直接在n8n平台中操作,或查看以下资源:

  • GitHub仓库:github.com/run-llama/n8n-llamacloud
  • npm包:@llamaindex/n8n-nodes-llamacloud
  • 使用指南:官方网站
  • LlamaParse平台:cloud.llamaindex.ai