擴充套件熱力學AI模型
基於伊辛模型的熱力學計算裝置在低功耗AI推理和邊緣計算中展現出巨大潛力,但針對此類硬體的大規模模型訓練方法仍然有限。本研究將高溫吉布斯取樣伊辛系統的時間平均行為與神經網路推理的理論對應關係轉化為一種可擴充套件的、純反向傳播的演算法,用於訓練深度卷積網路在伊辛機硬體上進行熱力學推理。在CIFAR-10和CIFAR-100資料集上,模型分別達到94.9%和76.0%的準確率。此外,還開發了推理成本與精度之間關係的數學理論,並給出了最優推理排程演算法。最後討論了硬體開發的影響和高溫熱力學AI模型的未來。
熱力學計算裝置,特別是基於伊辛模型的裝置,因其在低功耗AI推理和邊緣計算方面的潛力而備受關注。然而,針對這些硬體的可擴充套件訓練方法一直是一個挑戰。最近,一項由Andrew G. Moore進行的研究提出了一種基於反向傳播的演算法,能夠有效訓練深度卷積神經網路,使其在伊辛機硬體上執行熱力學推理。該研究由arXiv預印本收錄(arXiv:2607.00170),提交於2026年6月30日。
該研究的關鍵創新在於將高溫吉布斯取樣伊辛系統的時間平均行為與神經網路推理之間的理論對應關係轉化為一個實用的訓練框架。透過這種方法,研究人員成功訓練了用於影像分類的深度卷積網路,並在CIFAR-10資料集上取得了94.9%的準確率,在CIFAR-100資料集上取得了76.0%的準確率。這些結果是在二元吉布斯取樣條件下獲得的,證明了該方法的有效性。
除了實驗結果,該研究還深入探討了推理成本與精度之間的權衡。團隊開發並實驗驗證了一個數學理論,用於關聯推理成本與精度,並控制自相關時間。此外,他們還推導了漸近結果,表明推理成本受到一個良好控制的效能權衡的約束,並提出了計算最優推理排程的演算法。這些理論貢獻為熱力學AI模型的實用化提供了重要指導。
最後,該研究討論了這些發現對硬體開發的影響,以及高溫熱力學AI模型的未來發展方向。這項工作為熱力學計算在低功耗、高效率AI應用中的實際部署鋪平了道路,特別是在邊緣計算環境中。隨著硬體和演算法的進一步改進,熱力學AI有望成為傳統數字計算的一個有競爭力的替代方案。研究人員指出,未來的工作可以進一步最佳化演算法以適應更復雜的網路結構,並探索在其他型別的伊辛機上的應用。