2026-06-12站内改写1 分钟阅读更新: 2026-06-12

基于波斯谚语条件的故事生成中的约束语义解压缩研究

本研究将抽象的波斯谚语转化为富有道德寓意的故事视为一种'约束语义解压缩'任务，并引入波斯谚语对齐叙事数据集（PAND）。通过混合评估框架，发现当前LLM虽能生成流畅文本，但常无法忠实体现谚语中的道德和因果结构，而显式推理和迭代细化可部分缓解这一解压缩差距。

来源arXiv Computational Linguistics作者: Zahra Habibzadeh, Paria Khoshtab, Amir Mesbah, Yadollah Yaghoobzadeh

生成抽象谚语所蕴含的道德故事是一项挑战，需要深厚的文化理解和稳健的语义基础。近期一篇来自arXiv的论文将这一问题形式化为“约束语义解压缩”任务，并以波斯谚语为切入点，研究大型语言模型（LLM）从抽象意义到具体叙事的实现能力。研究者提出了波斯谚语对齐叙事数据集（PAND），该数据集包含波斯谚语、人类编写的对应故事以及明确的寓意解释。通过结合人类校准的LLM作为评判与结构度量的混合评估框架，论文分析了多种提示策略下的模型行为。

实验表明，当前LLM存在一个持续的“解压缩差距”：尽管模型能够生成表面流畅的故事，但往往无法忠实体现谚语中蕴含的道德和因果结构。例如，模型可能生成一个有趣但偏离原意的故事。然而，研究进一步发现，通过显式推理和迭代细化，可以在一定程度上缓解这一问题，这表明解压缩错误更多源于将抽象意义转化为叙事形式的困难，而非相关知识的完全缺乏。该任务自然可扩展到其他形式的压缩文化知识，如成语、格言或寓言。论文的贡献在于定义了一个新的评估基准，并为提升LLM在文化敏感任务中的表现提供了方向。未来工作可探索更精细的解压缩技术和跨语言应用。具体而言，研究人员从波斯文学和文化中收集了数百条常见谚语，每条谚语都附有由母语者撰写的道德故事和明确的寓意解释。数据集的设计确保了故事的道德忠实性和文化准确性。在评估方面，混合框架不仅使用结构指标（如故事是否包含谚语中的关键元素），还使用经过人类校准的LLM作为法官来评估故事的道德忠实性。实验涉及多种提示策略，包括直接生成、显式推理链和迭代细化。结果显示，直接生成时模型往往产生与谚语道德相悖的故事，而通过显式推理和迭代细化，模型的道德忠实性显著提高。这一发现对于开发文化敏感的NLP系统具有重要意义，也为未来谚语理解与生成的研究提供了新基准。