AI News HubLIVE
站內改寫1 分鐘閱讀

擴展熱力學AI模型

基於伊辛模型的熱力學計算設備在低功耗AI推理和邊緣計算中展現出巨大潛力,但針對此類硬件的大規模模型訓練方法仍然有限。本研究將高温吉布斯採樣伊辛系統的時間平均行為與神經網絡推理的理論對應關係轉化為一種可擴展的、純反向傳播的算法,用於訓練深度卷積網絡在伊辛機硬件上進行熱力學推理。在CIFAR-10和CIFAR-100數據集上,模型分別達到94.9%和76.0%的準確率。此外,還開發了推理成本與精度之間關係的數學理論,並給出了最優推理調度算法。最後討論了硬件開發的影響和高温熱力學AI模型的未來。

來源arXiv Machine Learning作者: Andrew G. Moore

熱力學計算設備,特別是基於伊辛模型的設備,因其在低功耗AI推理和邊緣計算方面的潛力而備受關注。然而,針對這些硬件的可擴展訓練方法一直是一個挑戰。最近,一項由Andrew G. Moore進行的研究提出了一種基於反向傳播的算法,能夠有效訓練深度卷積神經網絡,使其在伊辛機硬件上執行熱力學推理。該研究由arXiv預印本收錄(arXiv:2607.00170),提交於2026年6月30日。

該研究的關鍵創新在於將高温吉布斯採樣伊辛系統的時間平均行為與神經網絡推理之間的理論對應關係轉化為一個實用的訓練框架。通過這種方法,研究人員成功訓練了用於圖像分類的深度卷積網絡,並在CIFAR-10數據集上取得了94.9%的準確率,在CIFAR-100數據集上取得了76.0%的準確率。這些結果是在二元吉布斯採樣條件下獲得的,證明了該方法的有效性。

除了實驗結果,該研究還深入探討了推理成本與精度之間的權衡。團隊開發並實驗驗證了一個數學理論,用於關聯推理成本與精度,並控制自相關時間。此外,他們還推導了漸近結果,表明推理成本受到一個良好控制的性能權衡的約束,並提出了計算最優推理調度的算法。這些理論貢獻為熱力學AI模型的實用化提供了重要指導。

最後,該研究討論了這些發現對硬件開發的影響,以及高温熱力學AI模型的未來發展方向。這項工作為熱力學計算在低功耗、高效率AI應用中的實際部署鋪平了道路,特別是在邊緣計算環境中。隨着硬件和算法的進一步改進,熱力學AI有望成為傳統數字計算的一個有競爭力的替代方案。研究人員指出,未來的工作可以進一步優化算法以適應更復雜的網絡結構,並探索在其他類型的伊辛機上的應用。