SNAP-FM:面向物理約束生成模型的稀疏非線性加速投影方法
生成模型作為物理模擬的可擴展替代方案,但通常無法確保輸出符合守恆律、邊界條件等物理約束。約束採樣可以在推理時精確施加這些約束,但計算成本高昂。本文提出SNAP-FM,利用稀疏GPU非線性優化加速約束投影。通過ExaModels.jl和MadNLP.jl處理塊稀疏雅可比矩陣和KKT系統,該方法在偏微分方程基準測試上實現了更快的非線性約束投影,同時保持約束滿足。
生成模型近年來在物理模擬領域展現出巨大潛力,可以作為傳統數值求解器的可擴展替代方案。然而,這些模型在生成結果時往往無法保證滿足物理定律,如守恆律、邊界條件和非線性不變量。為了解決這一問題,約束採樣方法在推理階段直接施加這些物理約束,而無需重新訓練模型。但這一過程伴隨着高昂的計算成本,尤其是在處理非線性約束時,需要重複進行投影、校正和軌跡優化步驟。
標準的機器學習框架在處理這些約束時效率低下,因為其密集的張量代數運算和有限的稀疏求解器組合能力,難以利用物理約束自然產生的稀疏結構。常見的深度學習庫如PyTorch和TensorFlow主要針對密集計算優化,缺乏對稀疏非線性規劃的高效支持。為了突破這一瓶頸,來自研究團隊(包括Alaina Kolli等七位作者)提出了SNAP-FM(稀疏非線性加速投影方法)。該方法通過挖掘樣本批處理和局部PDE耦合在投影子問題中誘導的結構——即塊稀疏雅可比矩陣和KKT系統——利用ExaModels.jl和MadNLP.jl以及GPU稀疏分解技術,高效求解稀疏非線性規劃問題。
研究團隊將SNAP-FM應用於物理約束流匹配(Physics-Constrained Flow Matching, PCFM)框架,在線性和非線性、一維和二維的偏微分方程基準測試上進行了評估。實驗基準包括多種經典PDE問題,例如對流方程、擴散方程等。結果表明,該方法在加速非線性約束投影的同時,保持了約束滿足的精度,計算速度相比傳統方法有顯著提升。這些成果表明,稀疏GPU非線性優化可以為科學機器學習中的約束生成採樣提供實用的基礎。
該論文於2026年6月30日提交至arXiv,論文編號arXiv:2607.00095,目前DOI正在註冊中。論文涵蓋了機器學習(cs.LG)、人工智能(cs.AI)和計算工程(cs.CE)等多個領域。研究得到了來自相關機構的支持。此研究為生成模型在物理仿真中的應用提供了新的思路,有望降低推理階段的計算成本,推動物理約束生成模型在科學計算和工程仿真中的實際部署。