非暴力コミュニケーション制約による大規模言語モデル対話における会話エスカレーションの低減
本研究では、非暴力コミュニケーション(NVC)の原則を軽量なプロンプトレベルの制約として活用し、感情的に緊張した状況で大規模言語モデル(LLM)の対話行動をより緩和・非エスカレーション方向に導く方法を探る。複数のモデルとユーザーの抵抗レベルの異なるデュアルエージェントシミュレーションフレームワークを通じて、NVC制約付きプロンプティングが一貫して会話エスカレーションを低減し、抵抗の強いユーザーとのやり取りを安定化させることを示した。
近年、大規模言語モデル(LLM)は、対人関係の衝突やフラストレーション、苦痛といった感情的に緊張した状況で利用されるケースが増えている。しかし、これまでの安全性研究は、有害なコンテンツやポリシー違反といった明示的な危害の防止に焦点を当てており、会話の流れの中で意図せず対立を激化させる行動には十分な注意が払われてこなかった。2026年5月1日にarXiv(ID: 2606.26106)に投稿されたZhixing Sunらによる研究では、非暴力コミュニケーション(NVC)に由来する軽量なプロンプトレベルの制約を用いて、LLMをよりエスカレーションを抑えた対話行動へと導く可能性を調査した。
NVCは、マーシャル・ローゼンバーグによって開発された共感的なコミュニケーション手法であり、非難を避け、感情を認識し、明確な要求を伝えることを重視する。研究チームは、NVCの原則をプロセス指向のガイドラインとして再定義し、モデルがユーザーを非難することを避け、ユーザーの感情体験に注意を向け、アドバイスをする前に明確化を促すようにした。これらの制約はプロンプトに追加されるだけで、モデルの再訓練や微調整は不要である。
提案手法を評価するため、研究者らはデュアルエージェントシミュレーションフレームワークを構築した。一方のエージェントは対立に直面するユーザーを模倣し、もう一方がLLMを担う。ユーザーエージェントは低抵抗から高抵抗までの複数のレベルに設定され、現実のユーザーの感情的反応を模擬した。実験では、GPT-4のバリアントやLlamaシリーズなど、複数の指示チューニングモデルが使用された。結果として、NVC制約を用いたプロンプトは、特に抵抗の強いユーザーとの対話において、会話のエスカレーションを一貫して低減し、攻撃的な言葉の発生を減少させた。
この研究の重要な知見は、複雑な訓練を必要とせず、シンプルなコミュニケーション制約をプロンプトに追加するだけで、LLMの対話行動を有意に改善できる点にある。これは、敏感な話題を扱うAIアシスタントの信頼性と安全性を高めるための実用的な手法となる可能性がある。研究の有効性は異なるモデル間で一貫しており、方法の汎用性を示している。
本研究は複数の研究機関による共同成果であり、今後の展望として、NVC制約をモデル訓練に組み込む方法や、アクティブリスニングや感情焦点化など他の心理学フレームワークのAI対話への応用が考えられている。この研究は、より安全で信頼できる対話システムの構築に向けた具体的なアプローチを提供している。