セグメント開示の完全性と比較可能性を向上させる大規模言語モデルアプローチ
この研究は、大規模言語モデルベースのフレームワークを開発し、Form 10-Kから直接セグメント開示情報を抽出し、報告可能なセグメントとネストされたセグメント情報の両方を保持します。さらに、複数の提出書類からの情報を統合して比較可能性をサポートする検索拡張システムを設計します。このフレームワークは、企業内の縦断的分析と企業間の地理的セグメントのアライメントで実証され、正確な抽出と期間を超えたクエリへの効果的な対応を示しています。
記事インテリジェンス
要点
- セグメント開示は財務報告の中心だが、10-K内の分散形式により完全性と比較可能性に課題がある。
- LLMベースのフレームワークで、ネストされたセグメントも含め10-Kから直接抽出。
- 複数の提出書類を横断する検索拡張システムで比較可能性を強化。
- 企業内の縦断分析と企業間の地理的セグメントアライメントで検証。
重要な理由
このニュースが重要なのは、セグメント開示は財務報告の中心だが、10-K内の分散形式により完全性と比較可能性に課題があるためです。
技術的影響
モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。
セグメントレベルの開示は財務報告の中核要素であり、企業の内部組織や経済活動の各事業単位への配分に関する洞察を提供します。しかし、セグメント情報は定性および定量形式の両方で提示されることが多く、Form 10-Kの表やナラティブセクションに分散しています。構造化データベースに依存する実証研究は、完全性と比較可能性の両面で課題に直面します。一部の企業・年度観測が欠落している可能性があり、ネストされたセグメント開示は捕捉されず、縦断的および企業間の比較可能性のサポートは限られています。
この問題に対処するため、本研究は大規模言語モデル(LLM)ベースのフレームワークを開発し、Form 10-Kから直接セグメント開示情報を抽出し、報告可能なセグメント情報とネストされたセグメント情報の両方を保持します。さらに、複数の提出書類からの情報を組み込んで比較可能性をサポートする検索拡張システムを設計します。このシステムは、異なる提出書類を横断してアナリストに包括的な視点を提供し、企業間および時系列の比較を容易にします。
研究は、2つの代表的な設定でその応用を示しています。1つは企業内の縦断的分析で、時間の経過に伴うセグメントの変化を解釈するもの、例えば、複数年の10-Kを追跡して特定の事業セグメントの成長を分析します。もう1つは、異なる報告構造を持つ企業間での地理的セグメントのアライメントで、異なる分類基準を使用する企業の地理的セグメントを標準化して比較します。結果は、この人工物がセグメントレベルの情報を正確に抽出し、期間を超えた知識を必要とする質問に効果的に回答することを示しており、LLMベースのアプローチがセグメント開示の測定と解釈を強化する可能性を示しています。
この研究は『Accounting Horizons』に提出され、39ページ、4つの図で構成されています。コードとデータは関連プラットフォームを通じて公開され、他の研究者による再現とさらなる探索が可能です。全体として、この研究は財務報告分野に革新的な自動化ツールを提供し、セグメント開示分析の効率と深さを向上させることが期待されます。