NAIRR科學計劃重塑科學研究,由NVIDIA AI基礎設施驅動
美國國家科學基金會的NAIRR試點專案執行兩年,支援超過700個專案,NVIDIA提供DGX節點和技術支援。專案涵蓋蛋白質預測、傳染病管理等領域,其中Polymathic AI、密歇根大學和波士頓大學的專案取得突破。
過去兩年間,美國國家科學基金會(NSF)的國家人工智慧研究資源(NAIRR)試點專案已推動美國700多個專案的創新研究,涵蓋蛋白質預測和傳染病暴發管理等領域。NVIDIA透過基於雲的資源為NAIRR試點做出貢獻,為研究人員提供至少四臺NVIDIA DGX節點的專用訪問許可權,為期至少一個月。NVIDIA還提供技術支援,幫助研究人員入駐並完成專案。
藉助NVIDIA的AI基礎設施支援和DGX參考架構提供專用資源,研究人員大幅縮短了工作流程時間,並發現了將重塑醫療、農業和能源等行業的前沿技術。以下重點介紹幾個NAIRR專案。
Polymathic AI——一個由國際科學家組成的聯盟(包括Flatiron Institute、劍橋大學和勞倫斯伯克利國家實驗室)——藉助NVIDIA GPU和NVLink互聯技術,透過其大規模資料集“Well”加強了物理流體模擬。該資料集將用於訓練迄今最大、最廣泛適用的流體行為基礎模型,名為Walrus。該模型連同其資料、程式碼和預訓練權重已公開發布。Polymathic AI的方法建立在以往物理預訓練環境的基礎上,解決了當前規模和預訓練多樣性的限制。研究小組還計劃探索擴充套件定律,以加速開發更強大的科學應用基礎模型。
密歇根大學的研究人員由航空航天工程系教授Venkat Viswanathan領導,正在開發一個模型融合框架,將特定領域的分子AI和通用大語言模型結合起來。目標是幫助計算科學家更輕鬆地探索化學空間,用自然語言提出化學相關問題,並識別下一代能源技術的有前途材料。分子基礎模型系列MIST(分子洞察SMILES變換器)專為化學空間中的發現和探索而設計。MIST模型在海量無標記分子資料集上預訓練,並使用新型分詞器Smirk更好地捕獲分子表示中的核、電子、幾何、同位素和立體化學資訊。MIST模型在400多個結構-性質關係上進行了微調,在電化學、量子化學、生理學等多個基準測試中達到或超過最先進效能。MIST是在40 GPU的NVIDIA DGX叢集和ALCF Polaris叢集上開發的,團隊使用NVIDIA NGC PyTorch容器在不同的叢集上支援可重複的GPU加速開發。將MIST與通用LLM融合,使精確的量子化學計算更易獲得,並加速實現交通電氣化(如重型和航空領域)所需的儲能和轉換系統設計。
波士頓大學Hariri計算機與新興傳染病中心正在利用NVIDIA加速計算訓練和評估LLM,透過AI管道支援名為BEACON的暴發監測專案。該LLM使用大量傳染病和流行病易發病原體的文件進行訓練,以支援BEACON的現場專家和疫情分析師。該模型將能夠分析全球範圍內新發疾病暴發的線上帖子,提取特徵進行下游分類和優先順序排序。BEACON將從多種來源(包括全球疾病追蹤平臺HealthMap、新聞和社交媒體、專家以及社群論壇或個人通訊)處理訊號,生成簡潔的疫情報告。這些全面的疫情分析可為新興傳染病的臨床實踐指南提供資訊,並識別需要進一步資料補充的缺口。國際部署的醫生、政府組織和學術研究人員已在使用BEACON模型快速識別和治療傳染病。波士頓大學Hariri研究所所長Ioannis Paschalidis表示:“在我們開發這個管道之前,傳染病專家編寫一份報告需要幾個小時,現在大約只需兩分鐘。”
NAIRR和NVIDIA的影響不僅限於此。哈佛大學、斯坦福大學、科羅拉多州立大學等許多其他大學也在藉助NAIRR和NVIDIA開創科學突破。隨著科學家更廣泛地獲得AI和加速計算,創新正以前所未有的速度推動一個更安全、更健康的未來。