AI News HubLIVE
站內改寫2 分鐘閱讀

n8n的LlamaParse平台節點:利用AI解析、分類、提取和檢索文檔

LlamaParse平台社區節點已發佈v5和v6版本,現為n8n官方驗證的社區節點。該節點整合了五個LlamaCloud資源(解析、分類、拆分、提取、檢索),支持作為AI Agent工具使用。v5重寫了基礎架構,v6將多個獨立節點整合為一個,並增加了索引管理功能。文章還提供了三種工作流示例:將檢索器作為Agent工具、構建分類-提取-驗證流水線、以及評估不同解析模式的輸出質量。

我們發佈了LlamaParse平台社區節點的v5和v6版本,該包現已正式成為n8n生態系統中經過驗證的社區節點。本文介紹該節點的功能、兩個主要版本的變更內容,以及三個可以利用它構建的具體工作流。

節點功能

該包提供了一個單一節點——LlamaParse平台,通過一個資源/操作下拉菜單展示了五個LlamaCloud資源。所有資源共享同一LlamaParse API憑據。

  • 解析(Parse):輸入二進制文件,輸出Markdown或純文本格式的文本。
  • 分類(Classify):輸入二進制文件及類別/描述規則,輸出分類結果、原因和置信度。
  • 拆分(Split):輸入二進制文件和類別,按片段輸出每個片段的類別、置信度和頁數。
  • 提取(Extract):輸入二進制文件和提取配置ID,輸出與模式匹配的序列化JSON結果。
  • 檢索(Retrieve):輸入索引ID、查詢和topK,輸出上下文字符串數組。

解析支持四種層級(fast、cost_effective、agentic、agentic_plus)並可選固定解析器版本。檢索同時支持v1 Pipelines API和v2 Index Retrieval API。每個資源都標記為usableAsTool: true,因此可以附加到n8n AI Agent作為可調用工具,而不僅僅是存在於線性流程中。

v5版本變更

v5是基礎架構的重寫:

  • 放棄了SDK,改用直接HTTP調用LlamaCloud API,無需打包和維護SDK,表面更小、更可預測。
  • 提取功能從V1遷移到V2,與當前提取服務產品配置模型對齊。
  • API基礎URL可配置,因此區域特定和自託管部署可以作為憑據設置,而無需分支。
  • 重寫了二進制文件處理,使得文件可以從任何上游節點流暢傳遞。

v6版本變更

v6整合了包結構。早期版本發佈了多個獨立節點(LlamaParse、LlamaClassify、LlamaExtract等),v6將它們合併為單一的LlamaParse平台節點,採用與n8n第一方節點一致的資源/操作模式。此外,還增加了用於管理和檢索索引的索引操作,並納入了n8n驗證審查中的修復(linting、打包和類命名更正)。

在n8n實例上安裝節點

要安裝LlamaParse平台節點,請前往n8n儀表板的設置 → 社區節點,然後提供@llamaindex/n8n-nodes-llamacloud作為NPM包名稱,點擊安裝按鈕即可。

示例工作流

要使用LlamaParse集成,添加LlamaParse API憑據(從cloud.llamaindex.ai粘貼密鑰;基礎URL默認為https://api.cloud.llamaindex.ai),然後將節點拖放到畫布上。

1. 將檢索器作為Agent工具

由於節點是usableAsTool: true,檢索資源可以直接連接到AI Agent的工具列表中:

Agent根據用户的查詢決定是否調用檢索器工具。例如,如果用户提出一個需要上下文的問題,而當前Agent無法獲取該上下文,Agent可以從索引中檢索相關信息。Agent調用工具,接收檢索到的塊,並在同一輪次中基於它們進行推理:這樣,你就成功地將Agent連接到自己的知識庫中,並且可以輕鬆地添加更多工具和連接。

2. 分類 → 提取 → 驗證

一個文檔處理流水線,將原始文件轉換為結構化的、經過驗證的輸出:

分類將每個文檔路由到正確的分支(例如,發票與合同),提取使用針對該類型調整的模式提取結構化字段,LLM節點根據文件的解析內容驗證提取數據的正確性。此外,分類中的置信度字段可以作為將低置信度文檔發送到人工審查分支的便捷門控。

3. 評估解析輸出

使用不同的解析模式評估解析輸出:

鏈式解析(Agentic和Cost Effective模式),然後將輸入文件通過兩個解析器,並將結果收集到一個LLM提示中,例如:

{agentic output}

{cost effective output}

確定哪個層級產生了最高質量的結果。

最後,將LLM作為評判者的裁決表示為結構化輸出,用於評估:這在試圖為文檔找到準確性和延遲之間的最佳平衡時特別有用。

開始使用

你可以立即開始使用LlamaParse平台節點,直接在n8n平台中操作,或查看以下資源:

  • GitHub倉庫:github.com/run-llama/n8n-llamacloud
  • npm包:@llamaindex/n8n-nodes-llamacloud
  • 使用指南:官方網站
  • LlamaParse平台:cloud.llamaindex.ai