AI News HubLIVE
サイト内リライト2 分で読了

因果関係:多言語ファインチューニングを活用した金融QA@FinCausal 2026

本稿では、HSA_CORALチームがFinCausal 2026共有タスクに提出した研究成果を紹介します。このタスクは、金融ナラティブから因果関係を抽出するための抽出型質問応答を英語とスペイン語で行うものです。チームは、エンコーダのみのトークンタグ付け(多言語BERT)、エンコーダ-デコーダ生成(多言語BART)、およびデコーダのみの大規模言語モデル(Llama 3.1やGPTバリアント)の3つのモデルファミリーを比較し、プロンプト最適化、少数ショットデモンストレーション、教師ありファインチューニングを用いました。結果、教師ありファインチューニングが最大の改善をもたらし、最良のGPT-4.1 Miniは英語で最高スコア、スペイン語で第3位を獲得しました。多言語ファインチューニングの価値を示しています。

ソースarXiv Computational Linguistics著者: Akash Kumar Gautam, Serhii Hamotskyi, Christian H\"anig

金融分野において、ナラティブテキストから因果関係を正確に抽出することは、リスク評価、意思決定支援、コンプライアンス分析にとって極めて重要です。FinCausal 2026共有タスクはこのニーズに応えるべく、参加者に対して英語とスペイン語の金融ナラティブから抽出型質問応答(extractive QA)を用いて原因と結果の関係を特定することを求めました。HSA_CORALチームは、このタスクに対して複数のモデルを体系的に比較するシステムを提出しました。

チームは3つのモデルファミリーを評価しました。1つ目はエンコーダのみのトークンタグ付けで、多言語BERT(mBERT)を用いて因果関係抽出を系列ラベリング問題として扱います。2つ目はエンコーダ-デコーダ生成モデルで、多言語BART(mBART)を利用して因果関係を含む回答テキストを直接生成します。3つ目はデコーダのみの大規模言語モデル(LLM)で、Llama 3.1やGPT系列のバリアント(GPT-4.1 Miniなど)が含まれます。これらのモデルは、プロンプト最適化、少数ショットデモンストレーション、教師ありファインチューニングの3つの戦略と組み合わせて実験されました。

実験の結果、プロンプトや少数ショットの手法でも競争力のある性能を示しましたが、教師ありファインチューニングがすべての設定で最大の性能向上をもたらしました。最良のシステムは、英語とスペイン語の両方のトレーニングデータを組み合わせてファインチューニングされたGPT-4.1 Miniで、英語サブタスクで最高得点4.8140(同点首位)、スペイン語サブタスクで第3位(4.7753)を獲得しました。評価は、共有タスクで採用されたLLM-as-a-judge指標(大規模言語モデルが判定者となる)に基づいています。

本研究は、タスク固有の適応と多言語ファインチューニングが金融因果関係QAにおける言語間転送に極めて有効であることを示しています。本論文は2026年のLREC会議における第7回金融ナラティブ処理ワークショップ(FNP 2026)で受理され、会議録に掲載されました。HSA_CORALチームの成果は、特に多言語環境での金融因果推論に対する実用的な技術的アプローチを提供し、今後の応用が期待されます。