2026-05-25 12:00 UTC+8站内改写1 分钟阅读更新: 2026-06-30 21:03 UTC+8

SciAtlas：用于自动化科学研究的大规模知识图谱

SciAtlas整合了来自26个学科的4300万篇论文，构建了包含1.57亿个实体和30亿个三元组的知识图谱，使AI代理能够进行拓扑感知的科学推理，减少逻辑幻觉。

来源arXiv AI作者: Shuofei Qiao, Yunxiang Wei, Jiazheng Fan, Bin Wu, Busheng Zhang, Mengru Wang, Yuqi Zhu, Ningyu Zhang, Keyan Ding, Qiang Zhang, Huajun Chen

随着全球学术产出的指数级增长，研究人员和AI代理面临着前所未有的“信息爆炸”困境。碎片化、非结构化的知识组织方式严重阻碍了深度的跨学科整合。当前的学术检索工具主要依赖表面关键字匹配或向量空间语义检索，缺乏在复杂逻辑连接中导航所需的拓扑推理能力。而基于代理的深度研究框架容易出现逻辑幻觉，且推理成本高昂。为弥补这一空白，研究人员在2026年5月20日提交的一篇论文中提出了SciAtlas——一个大规模、多学科、异构的学术资源知识图谱，旨在作为全景式的科学演化网络。

SciAtlas整合了来自26个学科的超过4300万篇论文，构建了包含1.57亿个实体和30亿个三元组的知识图谱。它提供了一个结构化的拓扑认知基板，能够打破学科壁垒，为AI代理提供全局视角。此外，研究团队还开发了一种神经符号检索算法，该算法采用三路径协同召回和图重排技术，实现了从简单的语义匹配到确定性关联发现的无缝过渡。

论文展示了SciAtlas的多个关键应用方向，包括文献综述、自动研究趋势综合、想法定位和学术轨迹探索。这些应用表明，SciAtlas可以作为有效的“认知地图”，赋能自动化科学研究的完整流程，同时显著降低推理成本。研究团队已在GitHub上发布了知识图谱检索接口和多种下游任务的代码。该工作目前仍处于进行中，涉及人工智能、计算与语言、信息检索和机器学习等多个学科领域。