n8n的LlamaParse平臺節點:利用AI解析、分類、提取和檢索文件
LlamaParse平臺社群節點已釋出v5和v6版本,現為n8n官方驗證的社群節點。該節點整合了五個LlamaCloud資源(解析、分類、拆分、提取、檢索),支援作為AI Agent工具使用。v5重寫了基礎架構,v6將多個獨立節點整合為一個,並增加了索引管理功能。文章還提供了三種工作流示例:將檢索器作為Agent工具、構建分類-提取-驗證流水線、以及評估不同解析模式的輸出質量。
我們釋出了LlamaParse平臺社群節點的v5和v6版本,該包現已正式成為n8n生態系統中經過驗證的社群節點。本文介紹該節點的功能、兩個主要版本的變更內容,以及三個可以利用它構建的具體工作流。
節點功能
該包提供了一個單一節點——LlamaParse平臺,透過一個資源/操作下拉選單展示了五個LlamaCloud資源。所有資源共享同一LlamaParse API憑據。
- 解析(Parse):輸入二進位制檔案,輸出Markdown或純文本格式的文本。
- 分類(Classify):輸入二進位制檔案及類別/描述規則,輸出分類結果、原因和置信度。
- 拆分(Split):輸入二進位制檔案和類別,按片段輸出每個片段的類別、置信度和頁數。
- 提取(Extract):輸入二進位制檔案和提取配置ID,輸出與模式匹配的序列化JSON結果。
- 檢索(Retrieve):輸入索引ID、查詢和topK,輸出上下文字串陣列。
解析支援四種層級(fast、cost_effective、agentic、agentic_plus)並可選固定解析器版本。檢索同時支援v1 Pipelines API和v2 Index Retrieval API。每個資源都標記為usableAsTool: true,因此可以附加到n8n AI Agent作為可呼叫工具,而不僅僅是存在於線性流程中。
v5版本變更
v5是基礎架構的重寫:
- 放棄了SDK,改用直接HTTP呼叫LlamaCloud API,無需打包和維護SDK,表面更小、更可預測。
- 提取功能從V1遷移到V2,與當前提取服務產品配置模型對齊。
- API基礎URL可配置,因此區域特定和自託管部署可以作為憑據設定,而無需分支。
- 重寫了二進位制檔案處理,使得檔案可以從任何上游節點流暢傳遞。
v6版本變更
v6整合了包結構。早期版本釋出了多個獨立節點(LlamaParse、LlamaClassify、LlamaExtract等),v6將它們合併為單一的LlamaParse平臺節點,採用與n8n第一方節點一致的資源/操作模式。此外,還增加了用於管理和檢索索引的索引操作,並納入了n8n驗證審查中的修復(linting、打包和類命名更正)。
在n8n例項上安裝節點
要安裝LlamaParse平臺節點,請前往n8n儀表板的設定 → 社群節點,然後提供@llamaindex/n8n-nodes-llamacloud作為NPM包名稱,點選安裝按鈕即可。
示例工作流
要使用LlamaParse整合,新增LlamaParse API憑據(從cloud.llamaindex.ai貼上金鑰;基礎URL預設為https://api.cloud.llamaindex.ai),然後將節點拖放到畫布上。
1. 將檢索器作為Agent工具
由於節點是usableAsTool: true,檢索資源可以直接連線到AI Agent的工具列表中:
Agent根據使用者的查詢決定是否呼叫檢索器工具。例如,如果使用者提出一個需要上下文的問題,而當前Agent無法獲取該上下文,Agent可以從索引中檢索相關資訊。Agent呼叫工具,接收檢索到的塊,並在同一輪次中基於它們進行推理:這樣,你就成功地將Agent連線到自己的知識庫中,並且可以輕鬆地新增更多工具和連線。
2. 分類 → 提取 → 驗證
一個文件處理流水線,將原始檔案轉換為結構化的、經過驗證的輸出:
分類將每個文件路由到正確的分支(例如,發票與合同),提取使用針對該型別調整的模式提取結構化欄位,LLM節點根據檔案的解析內容驗證提取資料的正確性。此外,分類中的置信度欄位可以作為將低置信度文件傳送到人工審查分支的便捷門控。
3. 評估解析輸出
使用不同的解析模式評估解析輸出:
鏈式解析(Agentic和Cost Effective模式),然後將輸入檔案透過兩個解析器,並將結果收集到一個LLM提示中,例如:
{agentic output}
{cost effective output}
確定哪個層級產生了最高質量的結果。
最後,將LLM作為評判者的裁決表示為結構化輸出,用於評估:這在試圖為文件找到準確性和延遲之間的最佳平衡時特別有用。
開始使用
你可以立即開始使用LlamaParse平臺節點,直接在n8n平臺中操作,或檢視以下資源:
- GitHub倉庫:github.com/run-llama/n8n-llamacloud
- npm包:@llamaindex/n8n-nodes-llamacloud
- 使用指南:官方網站
- LlamaParse平臺:cloud.llamaindex.ai