AI News HubLIVE
サイト内リライト1 分で読了

TokenScope: 大規模言語モデルのコードタスクにおけるトークンレベルの説明可能性と解釈可能性

TokenScopeは、コード生成中のLLMのトークンレベルでの意思決定を可視化するインタラクティブなツールであり、トークンメトリクス、アテンションパターン、反実分岐を提供する。

ソースarXiv Computational Linguistics著者: Amirreza Esmaeili, Fatemeh Fard

大規模言語モデル(LLM)はコード生成タスクで優れた性能を発揮するが、トークンレベルでの意思決定メカニズムは依然としてブラックボックスである。既存のツールはモデルの内部状態や生成結果の一部を提供するものの、デコード中の信号、きめ細かい不確実性の測定、および代替生成経路を探索するためのインタラクティブな仕組みが不足している。この課題に対し、研究者のAmirreza Esmaeili氏とFatemeh Fard氏はTokenScopeを提案した。これはデコーダベースのLLM向けの対話型解釈可能性分析ツールであり、コード生成中にトークンレベルの確率や不確実性などのメトリクス、アテンションパターン、抽象構文木(AST)に基づく構造情報をリアルタイムで提供する。主要機能には、インタラクティブなトークン置換(特定のトークンを変更してモデルの反応を観察)、反実分岐(仮想的な代替経路を生成して比較)、およびコード認識集約(トークンを構文的にグループ化して解析)が含まれる。デコード中の信号と構造的プログラム解析を統合することで、TokenScopeはコード生成におけるLLMの振る舞いを体系的に調査する新たな手段を提供する。このツールはモデル出力のデバッグや生成コードの信頼性向上に貢献し、将来的により透明で信頼性の高いコードインテリジェンスシステムの基盤となることが期待される。関連論文は2026年4月30日にarXivに提出され、計算言語学(cs.CL)、人工知能(cs.AI)、ソフトウェア工学(cs.SE)の分野をカバーしている。研究者や開発者はこれにより、コード生成時のモデルの内部動作をより深く理解し、説明可能なAIのソフトウェア工学への応用を推進できる。