2026-06-12站内改写1 分鐘閱讀更新: 2026-06-12

基於波斯諺語條件的故事生成中的約束語義解壓縮研究

本研究將抽象的波斯諺語轉化為富有道德寓意的故事視為一種'約束語義解壓縮'任務，並引入波斯諺語對齊敘事資料集（PAND）。透過混合評估框架，發現當前LLM雖能生成流暢文本，但常無法忠實體現諺語中的道德和因果結構，而顯式推理和迭代細化可部分緩解這一解壓縮差距。

來源arXiv Computational Linguistics作者: Zahra Habibzadeh, Paria Khoshtab, Amir Mesbah, Yadollah Yaghoobzadeh

生成抽象諺語所蘊含的道德故事是一項挑戰，需要深厚的文化理解和穩健的語義基礎。近期一篇來自arXiv的論文將這一問題形式化為“約束語義解壓縮”任務，並以波斯諺語為切入點，研究大型語言模型（LLM）從抽象意義到具體敘事的實現能力。研究者提出了波斯諺語對齊敘事資料集（PAND），該資料集包含波斯諺語、人類編寫的對應故事以及明確的寓意解釋。透過結合人類校準的LLM作為評判與結構度量的混合評估框架，論文分析了多種提示策略下的模型行為。

實驗表明，當前LLM存在一個持續的“解壓縮差距”：儘管模型能夠生成表面流暢的故事，但往往無法忠實體現諺語中蘊含的道德和因果結構。例如，模型可能生成一個有趣但偏離原意的故事。然而，研究進一步發現，透過顯式推理和迭代細化，可以在一定程度上緩解這一問題，這表明解壓縮錯誤更多源於將抽象意義轉化為敘事形式的困難，而非相關知識的完全缺乏。該任務自然可擴充套件到其他形式的壓縮文化知識，如成語、格言或寓言。論文的貢獻在於定義了一個新的評估基準，併為提升LLM在文化敏感任務中的表現提供了方向。未來工作可探索更精細的解壓縮技術和跨語言應用。具體而言，研究人員從波斯文學和文化中收集了數百條常見諺語，每條諺語都附有由母語者撰寫的道德故事和明確的寓意解釋。資料集的設計確保了故事的道德忠實性和文化準確性。在評估方面，混合框架不僅使用結構指標（如故事是否包含諺語中的關鍵元素），還使用經過人類校準的LLM作為法官來評估故事的道德忠實性。實驗涉及多種提示策略，包括直接生成、顯式推理鏈和迭代細化。結果顯示，直接生成時模型往往產生與諺語道德相悖的故事，而透過顯式推理和迭代細化，模型的道德忠實性顯著提高。這一發現對於開發文化敏感的NLP系統具有重要意義，也為未來諺語理解與生成的研究提供了新基準。