MemSlides:一种用于个性化幻灯片生成与多轮局部修订的层次化记忆驱动智能体框架
MemSlides提出了一种层次化记忆框架,将长期记忆(用户档案记忆和工具记忆)与工作记忆分离,结合幻灯片局部修订,实现多轮交互中的用户偏好保持与可靠编辑。实验表明该方法在个性化对齐、修改行为和偏好跨轮传递方面显著优于基线。
在个性化演示文稿生成领域,现有方法通常仅依赖当前提示或模板,难以跨任务保持一致的用户偏好,也无法在多轮修订中妥善保留新引入的需求。针对这一问题,研究团队提出了MemSlides框架,通过层次化记忆结构将长期记忆与工作记忆分离,并进一步将长期记忆划分为用户档案记忆和工具记忆,旨在实现更精准、可靠且高效的个性化幻灯片生成与修订。
具体而言,用户档案记忆存储基于意图的条件化档案,用于初始轮次的个性化。这些档案包含了用户在不同场景下的稳定偏好,例如对配色方案、排版风格、图表类型等的喜好。工作记忆则维护活跃偏好和会话约束,在修订过程中动态更新,确保跨轮次连续性和一致性。例如,如果用户在第一轮要求增加数据可视化,工作记忆会记住这一需求,并在后续轮次中自动应用。工具记忆存储可复用的执行经验,例如如何高效调整某个特定类型的图表或如何应用统一的主题样式,从而支持可靠的局部编辑操作。
MemSlides设计了范围限定的幻灯片局部修订机制,每次更新仅作用于最小受影响区域,显著降低计算开销。这意味着当用户要求修改某一张幻灯片的布局时,系统不会重新生成整个演示文稿,而是精确定位到需要改变的元素,进行局部调整。这种机制不仅提高了效率,还避免了无关内容被意外改动。
在受控实验中,用户档案记忆在多人物、多意图档案库中提升了人物一致性判断,准确率提高了15%以上。工具记忆注入改善了诊断环境中的闭环修改行为,使得系统能够自主识别并修复常见错误。定性案例展示了工作记忆对偏好跨轮传递的支持,例如用户在多轮修订中反复调整同一张幻灯片的配色,工作记忆能够确保每次修改都基于最新的偏好状态。综合结果表明,有效的个性化演示文稿创作依赖于将稳定的用户档案、会话级工作记忆和可复用的执行经验进行分离处理,并在生成与局部修订中协同运用。这一框架为下一代智能演示工具提供了重要基础,有望广泛应用于教育、企业汇报、产品演示等场景。