TrajGenAgent:用于人类移动轨迹生成的分层LLM智能体
TrajGenAgent提出了一种基于分层LLM智能体的框架,无需模型微调即可生成逼真的合成人类移动轨迹。它采用两阶段设计:LLM首先通过上下文学习合成个体和星期条件化的活动链,然后通过确定性工作流(包括个性化POI检索、距离感知位置选择、运动学感知的旅行时间传播和LLM持续时间估计)将每个活动转化为完整的访问记录。此外,引入基于异常检测的评估框架来评估行为与语义合理性。实验表明,该方法在时空保真度、语义一致性和个体行为真实性方面优于现有方法。
TrajGenAgent是一种创新的分层LLM智能体框架,专门用于生成逼真的人类移动轨迹。该研究由Siyu Li等人完成,于2026年6月10日提交至arXiv预印本平台,并被第27届IEEE国际移动数据管理会议(MDM 2026)接收。人类移动数据在交通规划、城市管理和流行病控制等领域具有重要价值,但大规模真实轨迹的收集成本高昂且涉及隐私问题,因此合成轨迹的生成成为研究热点。
现有的基于大型语言模型(LLM)的轨迹生成方法主要分为两类:提示工程和轨迹级微调。提示工程利用零样本推理能力,但缺乏对时空细节的精确控制;而轨迹级微调虽然能提高统计精度,却需要大量计算资源,并可能削弱模型的泛化能力。TrajGenAgent通过避免模型微调,巧妙地克服了这些局限。
TrajGenAgent采用两阶段的“组织者-工作者”架构。在第一阶段,LLM作为组织者,通过上下文学习从历史数据中合成个体和星期条件化的活动链。这些活动链概括了用户在特定日期的活动序列,例如上午去办公室、中午去餐馆等。第二阶段,一个确定性工作流将每个活动细化为完整的访问记录。该工作流包含四个关键组件:个性化兴趣点(POI)检索,根据用户偏好推荐具体地点;距离感知的位置选择,确保地点之间的空间合理性;运动学感知的旅行时间传播,使用现实交通模型估算出行时间;以及基于LLM的持续时间估计,合理预测每项活动的时长。
为了评估生成轨迹的真实性,研究团队还设计了一套基于异常检测的评估框架。该框架使用两个互补的检测器:一个聚焦于行为层面的合理性,例如日常活动的规律性;另一个关注语义层面的连贯性,例如行程逻辑是否自然。在基准数据集(如Geolife)和大规模模拟数据集上的实验表明,TrajGenAgent在时空保真度、语义连贯性和个体行为真实性方面均优于现有神经方法和LLM基线方法,同时避免了任何参数更新,从而保持了模型的通用推理能力。