LlamaIndex ニュースレター:インテリジェントテーブル抽出とLiteSearch
今週のLlamaIndexニュースレターでは、インテリジェントテーブル抽出、ローカル文書検索システムLiteSearch、改善されたWord文書処理、Gemini Live APIとの統合、さらに法的発見やコミュニティプロジェクトのガイドを紹介します。
こんにちは、Llama愛好家の皆さん!🦙
今週のLlamaIndexニュースレターへようこそ!文書解析における画期的な進歩、特に基本OCRを超えるインテリジェントテーブル抽出、Word文書処理の革新的な改善、そして完全ローカル文書検索システムLiteSearchの発表を共有できることを嬉しく思います。さらに、Gemini Live APIとのエキサイティングな統合や、法的発見のユースケース向けの包括的なガイドも提供しています。
🎉 サンフランシスコでのイベントに参加しよう
「AIウォーターフロント」への移転を祝して!4月2日にセカンドストリートの新オフィスで「ファーストサーズデー」のプレイベントを開催します。チームと会い、食事や飲み物を楽しみ、コミュニティと交流しましょう。定員に限りがあるので、早めにRSVPしてください!
🤩 ハイライト
インテリジェントテーブル抽出で文書処理を変革:最新のOCRがテーブルの空間関係を再構築し、ヘッダー階層を保持し、複雑な文書全体でデータの整合性を確保する方法を詳しく解説します。3つのコアフェーズを学び、請求書処理から検査結果までの実世界の応用をご覧ください。完全ガイドを読む。
LiteSearch:完全ローカル文書検索システム:当社のOSSエンジニアが、LiteParseを使用して高性能でローカルファーストの検索パイプラインを構築し、解析、チャンク分割、埋め込み、ベクトルストレージのためのオープンツールを外部依存関係なしで組み立てる方法を実証しました。リポジトリをチェックし、LiteParseのドキュメントを探索してください。
革新的なWord文書処理:.docx解析の直感に反する課題を解決し、Word XMLテーブル要素を正しいページ位置にマッピングすることで、リッチな書式、結合セル、ネスト構造を持つテーブルの品質を大幅に向上させました。詳細はこちら。
☁️ LlamaParse
音声駆動の文書アシスタントとGemini Live API:Gemini 3.1のLive APIとLiteParseを統合したデモを構築し、音声コマンドで文書を解析し、リアルタイムで結果を読み上げるTUIベースの音声アシスタントを実現しました。GitHubリポジトリを探索し、LiteParseのドキュメントをご覧ください。
バウンディングボックスによるビジュアル引用:バウンディングボックス抽出とページスクリーンショットを使用して、テキストをページ要素に関連付ける新しいガイドです。ビジュアル引用の詳細をご覧ください。
Googleとのスマート金融アシスタント:Googleとのコラボレーションブログで、LlamaParseとGemini 3を使用して金融アシスタントを構築する方法を紹介し、正確なテキストとテーブル抽出のためのVLM対応エージェントOCRを含みます。ブログを読み、リポジトリを探索してください。
法的発見文書処理:困難なスキャン、劣化文書、複雑な法的発見のユースケースを、ビジョンモデルとカスタム解析命令で処理するための包括的なガイドです。完全なブログを読む。
✨ コミュニティ
GDPR違反報告の自動化:コンテスト優勝者@zubeensyedが、エージェントAIワークフローを構築し、GDPR違反報告の構造化を自動化し、インシデント報告を第33条の要件に準拠した標準化スキーマにマッピングしたことを祝福します。ソリューションを読み、ウォークスルーをご覧ください。