LlamaIndex ニュースレター 2026-04-21
今週のハイライトは、AIエージェント向け初のドキュメントOCRベンチマーク「ParseBench」のリリース、LiteParseのLlamaIndexエコシステムへの正式参加、Anthropic Opus 4.7の総合ベンチマーク、そして来週のNYCフィンテックウィークAIイベントです。
LlamaIndexニュースレターの今週号では、AIエージェント向け初のドキュメントOCRベンチマーク「ParseBench」のリリース、LiteParseの公式ウェブサイト開設、Anthropic Opus 4.7のベンチマーク結果、そしてNYCフィンテックウィークAIイベントについて詳しくお伝えします。ParseBenchは、チャート、テーブル、コンテンツの忠実性などを総合的に評価する指標を備えており、詳細はGitHubリポジトリで公開されています。また、5つの新しい精度指標のうち3つについて詳細な動画を公開しました:高度なテーブル解析指標(TableRecordMatch)は、列ヘッダーをキーとする複雑なテーブルをレコードとして評価する新しい指標です。コンテンツ忠実性テストでは、省略、幻覚、読み順違反の3つの障害モードを16万7000以上のルールベーステストで評価し、エージェントワークフローにおける解析の信頼性を確保します。チャートデータポイント抽出(ChartDataPointMatch)は、キャプションのOCRを超えて、チャートから実際の数値データを抽出し、テキスト認識と真のチャート理解のギャップを埋めます。LiteParseは4300以上のGitHubスターを獲得し、公式ウェブサイトを開設。約2秒で500ページを解析し、50以上のフォーマットに対応、クラウド依存ゼロです。近日開催予定のライブワークショップでは、フィンテックデューデリジェンスエージェントを構築します。Anthropic Opus 4.7のParseBench結果では、チャート解析が42.3%向上したものの、他のカテゴリでは混在した結果となりました。LlamaParse Agenticは依然として84.9%の総合パフォーマンスでリードし、競争力のある価格を維持しています。コミュニティとしては、来週NYCフィンテックウィークAIトラックが開催され、LinkupAPIと共催のAIビルダーズルーフトップハッピーアワーが行われます。