2026-06-04 12:00 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

話語角色標籤作為語言模型上下文使用的呈現時間變量

一項新研究探討了不同話語角色標籤（如“引用：”、“指令：”、“示例：”）如何影響語言模型對上下文的採納程度。通過在500個MMLU-Pro項目上使用固定內容探針，發現標籤可將誤導採納率改變56-84個百分點。指令和引用等標籤增加採納，而示例標籤抑制採納。研究建議在RAG基準測試中報告並控制包裝器標籤。

來源arXiv Computational Linguistics作者: Jianguo Zhu

近年來，上下文增強的語言模型系統廣泛使用諸如“參考：”、“證據：”、“指令：”、“註釋：”或“示例：”等標籤來包裝提供的額外內容。然而，這些標籤對模型行為的影響尚未得到充分研究。一項由朱建國主導的新研究通過精心設計的實驗揭示了這一現象：相同的誤導性答案在不同標籤下會導致模型截然不同的採納率。

研究人員設計了一個配對固定內容探針，基於500個MMLU-Pro項目。每個項目在相同誤導性答案斷言下，僅改變話語角色標籤，然後觀察模型是否輸出注入的錯誤選項。實驗中測試了多個主流模型，包括GPT-5.5、DeepSeek V4 Pro、Llama-3-8B-Instruct和Qwen2.5-7B-Instruct。結果顯示，誤導採納率因標籤不同而波動高達56至84個百分點。具體而言，“指令：”和“參考：”這類綁定或源類標籤導致模型高度採納誤導信息，而“示例：”標籤則持續抑制採納，即使內容完全一致。

進一步的邊界探針為這一效應提供了更細緻的刻畫。在算術推理任務中，標籤的影響減弱，可能是因為模型更依賴內在計算。當上下文是段落狀的外部文本時，標籤間的採納率差距依然存在但較小。短答案評估排除了模型簡單複製選項字母的可能，而嵌套標籤衝突實驗表明，示例框架可以限制採納的範圍。一項200例的單作者手動審計也證實了短答案對比的穩定性。

研究者的結論務實而有限：上下文利用率以及讀者端RAG基準測試應報告並控制包裝標籤，因為呈現方式的選擇會改變模型對提供上下文的依賴程度。這一發現對未來的模型評測、系統設計以及如何有效利用上下文具有重要指導意義，尤其是在構建可靠的知識增強系統時。