NAIRR科學計劃重塑科學研究,由NVIDIA AI基礎設施驅動
美國國家科學基金會的NAIRR試點項目運行兩年,支持超過700個項目,NVIDIA提供DGX節點和技術支持。項目涵蓋蛋白質預測、傳染病管理等領域,其中Polymathic AI、密歇根大學和波士頓大學的項目取得突破。
過去兩年間,美國國家科學基金會(NSF)的國家人工智能研究資源(NAIRR)試點項目已推動美國700多個項目的創新研究,涵蓋蛋白質預測和傳染病暴發管理等領域。NVIDIA通過基於雲的資源為NAIRR試點做出貢獻,為研究人員提供至少四台NVIDIA DGX節點的專用訪問權限,為期至少一個月。NVIDIA還提供技術支持,幫助研究人員入駐並完成項目。
藉助NVIDIA的AI基礎設施支持和DGX參考架構提供專用資源,研究人員大幅縮短了工作流程時間,並發現了將重塑醫療、農業和能源等行業的前沿技術。以下重點介紹幾個NAIRR項目。
Polymathic AI——一個由國際科學家組成的聯盟(包括Flatiron Institute、劍橋大學和勞倫斯伯克利國家實驗室)——藉助NVIDIA GPU和NVLink互聯技術,通過其大規模數據集“Well”加強了物理流體模擬。該數據集將用於訓練迄今最大、最廣泛適用的流體行為基礎模型,名為Walrus。該模型連同其數據、代碼和預訓練權重已公開發布。Polymathic AI的方法建立在以往物理預訓練環境的基礎上,解決了當前規模和預訓練多樣性的限制。研究小組還計劃探索擴展定律,以加速開發更強大的科學應用基礎模型。
密歇根大學的研究人員由航空航天工程系教授Venkat Viswanathan領導,正在開發一個模型融合框架,將特定領域的分子AI和通用大語言模型結合起來。目標是幫助計算科學家更輕鬆地探索化學空間,用自然語言提出化學相關問題,並識別下一代能源技術的有前途材料。分子基礎模型系列MIST(分子洞察SMILES變換器)專為化學空間中的發現和探索而設計。MIST模型在海量無標記分子數據集上預訓練,並使用新型分詞器Smirk更好地捕獲分子表示中的核、電子、幾何、同位素和立體化學信息。MIST模型在400多個結構-性質關係上進行了微調,在電化學、量子化學、生理學等多個基準測試中達到或超過最先進性能。MIST是在40 GPU的NVIDIA DGX集羣和ALCF Polaris集羣上開發的,團隊使用NVIDIA NGC PyTorch容器在不同的集羣上支持可重複的GPU加速開發。將MIST與通用LLM融合,使精確的量子化學計算更易獲得,並加速實現交通電氣化(如重型和航空領域)所需的儲能和轉換系統設計。
波士頓大學Hariri計算機與新興傳染病中心正在利用NVIDIA加速計算訓練和評估LLM,通過AI管道支持名為BEACON的暴發監測項目。該LLM使用大量傳染病和流行病易發病原體的文檔進行訓練,以支持BEACON的現場專家和疫情分析師。該模型將能夠分析全球範圍內新發疾病暴發的在線帖子,提取特徵進行下游分類和優先級排序。BEACON將從多種來源(包括全球疾病追蹤平台HealthMap、新聞和社交媒體、專家以及社區論壇或個人通信)處理信號,生成簡潔的疫情報告。這些全面的疫情分析可為新興傳染病的臨牀實踐指南提供信息,並識別需要進一步數據補充的缺口。國際部署的醫生、政府組織和學術研究人員已在使用BEACON模型快速識別和治療傳染病。波士頓大學Hariri研究所所長Ioannis Paschalidis表示:“在我們開發這個管道之前,傳染病專家編寫一份報告需要幾個小時,現在大約只需兩分鐘。”
NAIRR和NVIDIA的影響不僅限於此。哈佛大學、斯坦福大學、科羅拉多州立大學等許多其他大學也在藉助NAIRR和NVIDIA開創科學突破。隨着科學家更廣泛地獲得AI和加速計算,創新正以前所未有的速度推動一個更安全、更健康的未來。