透過非暴力溝通約束減少大型語言模型對話中的衝突升級
本研究探討如何利用非暴力溝通(NVC)原則作為輕量級提示約束,引導大型語言模型(LLM)在情感衝突情境中採取更緩和、非升級的對話行為。透過雙智慧體模擬框架,實驗表明NVC約束能顯著減少對話升級,穩定與高牴觸使用者的互動。
近年來,大型語言模型(LLM)越來越多地被應用於情感激烈的場景,例如人際衝突、挫折和痛苦。然而,現有的安全研究主要集中在防止毒性內容或違反政策的顯性危害,而對可能無意中加劇衝突的對話行為關注不足。一項新研究由Zhixing Sun等學者於2026年5月1日提交至arXiv(編號2606.26106),提出透過輕量級提示約束引入非暴力溝通(NVC)原則,以引導LLM採取更緩和的對話行為。
非暴力溝通是一種強調同理心、避免指責和清晰表達需求的溝通方式,最初由馬歇爾·盧森堡提出。研究人員將NVC原則轉化為過程導向的指導方針,鼓勵模型避免歸咎於使用者,關注使用者的情緒體驗,並在提供建議之前先進行澄清。這些約束以提示(prompt)的形式附加到模型輸入中,無需修改模型引數或進行額外訓練。
為了驗證這一方法,研究團隊構建了一個雙智慧體模擬框架,其中一個智慧體扮演面臨衝突的使用者,另一個代表LLM。使用者智慧體被設定為不同程度的牴觸水平(從低到高),模擬真實世界中使用者可能表現出的情緒化反應。實驗涵蓋了多種指令調優模型,包括GPT-4的變體、Llama系列以及其他開源模型。結果顯示,採用NVC約束的提示方法一致地降低了對話升級,特別是在與高度牴觸的使用者互動時,能夠穩定對話程序,減少攻擊性語言的產生。
該研究的核心發現是,簡單的溝通約束——而非複雜的訓練或微調——即可顯著改善LLM在衝突易發場景中的表現。這意味著,透過設計更智慧的提示策略,可以提升AI助手在處理敏感話題時的信任度和安全性。研究還指出,NVC約束的有效性在不同模型間表現一致,表明該方法具有泛化能力。
研究團隊來自多所機構,論文已提交至arXiv,並計劃在計算語言學領域會議上展示。未來工作可能包括將NVC約束整合到模型訓練中,以及探索其他心理學框架(如積極傾聽、情緒聚焦)在AI對話中的應用。這項研究為構建更安全、更值得信賴的對話系統提供了切實可行的思路。