NAIRR科学计划重塑科学研究,由NVIDIA AI基础设施驱动
美国国家科学基金会的NAIRR试点项目运行两年,支持超过700个项目,NVIDIA提供DGX节点和技术支持。项目涵盖蛋白质预测、传染病管理等领域,其中Polymathic AI、密歇根大学和波士顿大学的项目取得突破。
过去两年间,美国国家科学基金会(NSF)的国家人工智能研究资源(NAIRR)试点项目已推动美国700多个项目的创新研究,涵盖蛋白质预测和传染病暴发管理等领域。NVIDIA通过基于云的资源为NAIRR试点做出贡献,为研究人员提供至少四台NVIDIA DGX节点的专用访问权限,为期至少一个月。NVIDIA还提供技术支持,帮助研究人员入驻并完成项目。
借助NVIDIA的AI基础设施支持和DGX参考架构提供专用资源,研究人员大幅缩短了工作流程时间,并发现了将重塑医疗、农业和能源等行业的前沿技术。以下重点介绍几个NAIRR项目。
Polymathic AI——一个由国际科学家组成的联盟(包括Flatiron Institute、剑桥大学和劳伦斯伯克利国家实验室)——借助NVIDIA GPU和NVLink互联技术,通过其大规模数据集“Well”加强了物理流体模拟。该数据集将用于训练迄今最大、最广泛适用的流体行为基础模型,名为Walrus。该模型连同其数据、代码和预训练权重已公开发布。Polymathic AI的方法建立在以往物理预训练环境的基础上,解决了当前规模和预训练多样性的限制。研究小组还计划探索扩展定律,以加速开发更强大的科学应用基础模型。
密歇根大学的研究人员由航空航天工程系教授Venkat Viswanathan领导,正在开发一个模型融合框架,将特定领域的分子AI和通用大语言模型结合起来。目标是帮助计算科学家更轻松地探索化学空间,用自然语言提出化学相关问题,并识别下一代能源技术的有前途材料。分子基础模型系列MIST(分子洞察SMILES变换器)专为化学空间中的发现和探索而设计。MIST模型在海量无标记分子数据集上预训练,并使用新型分词器Smirk更好地捕获分子表示中的核、电子、几何、同位素和立体化学信息。MIST模型在400多个结构-性质关系上进行了微调,在电化学、量子化学、生理学等多个基准测试中达到或超过最先进性能。MIST是在40 GPU的NVIDIA DGX集群和ALCF Polaris集群上开发的,团队使用NVIDIA NGC PyTorch容器在不同的集群上支持可重复的GPU加速开发。将MIST与通用LLM融合,使精确的量子化学计算更易获得,并加速实现交通电气化(如重型和航空领域)所需的储能和转换系统设计。
波士顿大学Hariri计算机与新兴传染病中心正在利用NVIDIA加速计算训练和评估LLM,通过AI管道支持名为BEACON的暴发监测项目。该LLM使用大量传染病和流行病易发病原体的文档进行训练,以支持BEACON的现场专家和疫情分析师。该模型将能够分析全球范围内新发疾病暴发的在线帖子,提取特征进行下游分类和优先级排序。BEACON将从多种来源(包括全球疾病追踪平台HealthMap、新闻和社交媒体、专家以及社区论坛或个人通信)处理信号,生成简洁的疫情报告。这些全面的疫情分析可为新兴传染病的临床实践指南提供信息,并识别需要进一步数据补充的缺口。国际部署的医生、政府组织和学术研究人员已在使用BEACON模型快速识别和治疗传染病。波士顿大学Hariri研究所所长Ioannis Paschalidis表示:“在我们开发这个管道之前,传染病专家编写一份报告需要几个小时,现在大约只需两分钟。”
NAIRR和NVIDIA的影响不仅限于此。哈佛大学、斯坦福大学、科罗拉多州立大学等许多其他大学也在借助NAIRR和NVIDIA开创科学突破。随着科学家更广泛地获得AI和加速计算,创新正以前所未有的速度推动一个更安全、更健康的未来。