AI News HubLIVE
サイト内リライト3 分で読了

n8n用LlamaParseプラットフォームノード:AIによる文書の解析、分類、抽出、検索

LlamaParseプラットフォームコミュニティノード(v5およびv6)は、n8nの公式検証済みコミュニティノードになりました。このノードは5つのLlamaCloudリソース(Parse、Classify、Split、Extract、Retrieve)を公開し、n8n AIエージェントのツールとして使用できます。v5ではSDKを廃止し直接HTTP呼び出しに変更、抽出機能をV2に移行、APIベースURLを設定可能にしました。v6では複数のノードを1つに統合し、インデックス操作を追加しました。記事では、検索ツールをエージェントツールとして使用する方法、分類→抽出→検証パイプライン、異なる解析モードでの出力評価の3つのワークフロー例を紹介しています。

LlamaParseプラットフォームコミュニティノードのv5およびv6をリリースしました。このパッケージは現在、n8nエコシステム内で公式に検証されたコミュニティノードです。この記事では、ノードの機能、2つのメジャーバージョンの変更点、およびそれを用いて構築できる3つの具体的なワークフローを紹介します。

ノードの機能

このパッケージは、LlamaParseプラットフォームという単一のノードを提供し、リソース/操作ドロップダウンで5つのLlamaCloudリソースを公開します。すべてのリソースは同じLlamaParse APIクレデンシャルを共有します。

  • Parse:バイナリファイルを入力として受け取り、Markdownまたはプレーンテキストのテキストを出力します。
  • Classify:バイナリファイルとカテゴリ/説明ルールを入力として受け取り、カテゴリ、理由、信頼度を出力します。
  • Split:バイナリファイルとカテゴリを入力として受け取り、セグメントごとにカテゴリ、信頼度、ページ数を出力します。
  • Extract:バイナリファイルと抽出設定IDを入力として受け取り、スキーマに一致するシリアル化されたJSON結果を出力します。
  • Retrieve:indexId、クエリ、topKを入力として受け取り、コンテキストの文字列配列を出力します。

Parseは4つのティア(fast、cost_effective、agentic、agentic_plus)をサポートし、オプションで解析バージョンを固定できます。Retrieveはv1 Pipelines APIとv2 Index Retrieval APIの両方を対象としています。すべてのリソースはusableAsTool: trueとマークされているため、線形フローだけでなく、n8n AIエージェントに呼び出し可能なツールとしてアタッチできます。

v5の変更点

v5は基盤の書き換えでした:

  • SDKを廃止し、LlamaCloud APIに対する直接HTTP呼び出しに変更。これによりSDKのバンドルとメンテナンスが不要になり、より小さく予測可能な表面になりました。
  • ExtractをV1からV2に移行し、現在のExtractサービスプロダクト構成モデルに合わせました。
  • APIベースURLを設定可能にしたため、リージョン固有およびセルフホストデプロイメントをフォークではなくクレデンシャル設定として扱えます。
  • バイナリファイル処理を再構築し、アップストリームノードからファイルをシームレスに渡せるようにしました。

v6の変更点

v6はパッケージを統合しました。以前のリリースでは複数の独立したノード(LlamaParse、LlamaClassify、LlamaExtractなど)が出荷されていましたが、v6ではそれらを単一のLlamaParseプラットフォームノードにまとめ、n8nのファーストパーティノードで使用されるリソース/操作パターンを採用しました。また、インデックスの管理と検索のためのインデックスアクションを追加し、n8n検証レビューからの修正(linting、パッケージング、クラス名の修正)を組み込みました。

n8nインスタンスへのノードのインストール

LlamaParseプラットフォームノードをインストールするには、n8nダッシュボードの設定 → コミュニティノードに移動し、NPMパッケージ名として@llamaindex/n8n-nodes-llamacloudを指定してインストールボタンをクリックします。

ワークフロー例

LlamaParse統合を使用するには、LlamaParse APIクレデンシャルを追加し(cloud.llamaindex.aiからキーを貼り付け、ベースURLはデフォルトでhttps://api.cloud.llamaindex.ai)、ノードをキャンバスにドロップします。

1. 検索ツールをエージェントツールとして使用

ノードがusableAsTool: trueであるため、検索リソースをAIエージェントのツールリストに直接配線できます:

エージェントはユーザーのクエリに基づいて検索ツールを呼び出すかどうかを決定します。例えば、ユーザーがエージェントが現在持っていないコンテキストを必要とするドメイン固有の質問をした場合、エージェントはインデックスから関連情報を検索できます。エージェントはツールを呼び出し、検索されたチャンクを受け取り、同じターンでそれらに基づいて推論します:これにより、エージェントを自身の知識ベースに接続し、さらにツールや接続を簡単に追加できます。

2. 分類 → 抽出 → 検証

生のファイルを構造化された検証済み出力に変換するドキュメント処理パイプライン:

分類は各ドキュメントを適切なブランチ(例:請求書 vs 契約)にルーティングし、抽出はそのタイプに合わせて調整されたスキーマを使用して構造化フィールドを抽出し、LLMノードがファイルの解析内容に基づいて抽出データの正確性を検証します。さらに、分類の信頼度フィールドは、信頼度の低いドキュメントを手動レビューブランチに送るための便利なゲートとして使用できます。

3. 解析出力の評価

異なる解析モードで解析出力を評価します:

AgenticモードとCost EffectiveモードでParseをチェーンし、入力ファイルを両方のパーサーに通して、結果を次のようなLLMプロンプトに収集します:

{agentic output}

{cost effective output}

どのティアが最高品質の結果を生成したかを判断します。

最後に、LLM-as-a-judgeの判定を構造化出力として表現し、評価に使用します:これは、ドキュメントの精度とレイテンシーの最適なバランスを見つけようとする場合に特に重要です。

はじめに

LlamaParseプラットフォームノードを今すぐ使い始めるには、n8nプラットフォームで直接使用するか、以下を確認してください:

  • GitHubリポジトリ:github.com/run-llama/n8n-llamacloud
  • npmパッケージ:@llamaindex/n8n-nodes-llamacloud
  • 使用ガイド:公式ウェブサイト
  • LlamaParseプラットフォーム:cloud.llamaindex.ai