AI News HubLIVE
站内改写1 分钟阅读

GeoDisaster:面向操作式灾害地理智能的编排智能体基准测试

GeoDisaster是一个新型操作式灾害地理智能基准测试,包含2,921个实例、43种问题类型和五个任务族(森林退化监测、多灾种分析、建筑损坏评估、洪水安全路径规划、Sentinel-1 SAR洪水监测)。它整合了异构的EO/GIS数据,并使用可执行工作流生成真实答案。该论文还提出了一个包含18个灾害工具的多智能体框架,以及角色-合约期望对齐(RCEA)方法,通过失败感知的监督微调和合约驱动的强化学习来提升工具使用和决策质量。实验表明,GeoDisaster对现有模型构成挑战,而RCEA改善了工具使用、证据基础和状态一致性。

来源arXiv Computer Vision作者: Maram Hasan, Aman Verma, Savitra Roy, Hariseetharam Gunduboina, Daksh Jain, Muhammad Haris Khan, Subhasis Chaudhuri, Biplab Banerjee

在灾害响应中,地理空间情报的及时性和准确性至关重要。然而,现有的遥感视觉语言模型(RS-VLM)虽然在视觉解释和指令遵循方面有所进步,但在需要基于工具的推理和结构化决策的操作式地理智能方面仍显不足。为此,研究团队推出了GeoDisaster——一个面向操作式灾害地理智能的开放基准测试。

GeoDisaster包含2,921个经过验证的实例,涵盖43种问题类型和五个任务族:森林退化监测、多灾种分析、建筑损坏评估、洪水安全路径规划以及Sentinel-1 SAR洪水监测。每个实例整合了多种异构地球观测与地理信息系统数据,包括光学和SAR图像、栅格掩膜、矢量几何、道路网络和暴露图层。这些数据覆盖了灾害检测、损害评估、暴露估计和诊断报告生成等关键环节。为确保答案的可靠性,基准测试采用了可执行的地理空间工作流和确定性一致性检查,从而避免了语言模型标注带来的偏差。

除了基准测试本身,论文还提出了一个编排式多智能体框架,集成了18个面向灾害的工具。在该框架中,角色专业化的智能体通过显式的执行合约进行协调,并采用角色-合约期望对齐(RCEA)方法进行优化。RCEA结合了失败感知的监督微调和合约驱动的强化学习,在密集的步骤级信号上进行训练,从而提升了工具使用、证据基础、状态一致性和决策生成能力。

实验结果显示,GeoDisaster对现有的RS-VLM和智能体系统构成了显著挑战,而RCEA方法在各项目标上均带来了改进。这一工作不仅为灾害地理智能提供了标准化的评估平台,也为未来智能体系统的研究奠定了坚实基础。该论文由Maram Hasan等八位作者完成,共28页,包含11张图表,于2026年6月15日提交至arXiv。论文主题涵盖计算机视觉与模式识别(cs.CV)以及多智能体系统(cs.MA)。