扩展热力学AI模型
基于伊辛模型的热力学计算设备在低功耗AI推理和边缘计算中展现出巨大潜力,但针对此类硬件的大规模模型训练方法仍然有限。本研究将高温吉布斯采样伊辛系统的时间平均行为与神经网络推理的理论对应关系转化为一种可扩展的、纯反向传播的算法,用于训练深度卷积网络在伊辛机硬件上进行热力学推理。在CIFAR-10和CIFAR-100数据集上,模型分别达到94.9%和76.0%的准确率。此外,还开发了推理成本与精度之间关系的数学理论,并给出了最优推理调度算法。最后讨论了硬件开发的影响和高温热力学AI模型的未来。
热力学计算设备,特别是基于伊辛模型的设备,因其在低功耗AI推理和边缘计算方面的潜力而备受关注。然而,针对这些硬件的可扩展训练方法一直是一个挑战。最近,一项由Andrew G. Moore进行的研究提出了一种基于反向传播的算法,能够有效训练深度卷积神经网络,使其在伊辛机硬件上执行热力学推理。该研究由arXiv预印本收录(arXiv:2607.00170),提交于2026年6月30日。
该研究的关键创新在于将高温吉布斯采样伊辛系统的时间平均行为与神经网络推理之间的理论对应关系转化为一个实用的训练框架。通过这种方法,研究人员成功训练了用于图像分类的深度卷积网络,并在CIFAR-10数据集上取得了94.9%的准确率,在CIFAR-100数据集上取得了76.0%的准确率。这些结果是在二元吉布斯采样条件下获得的,证明了该方法的有效性。
除了实验结果,该研究还深入探讨了推理成本与精度之间的权衡。团队开发并实验验证了一个数学理论,用于关联推理成本与精度,并控制自相关时间。此外,他们还推导了渐近结果,表明推理成本受到一个良好控制的性能权衡的约束,并提出了计算最优推理调度的算法。这些理论贡献为热力学AI模型的实用化提供了重要指导。
最后,该研究讨论了这些发现对硬件开发的影响,以及高温热力学AI模型的未来发展方向。这项工作为热力学计算在低功耗、高效率AI应用中的实际部署铺平了道路,特别是在边缘计算环境中。随着硬件和算法的进一步改进,热力学AI有望成为传统数字计算的一个有竞争力的替代方案。研究人员指出,未来的工作可以进一步优化算法以适应更复杂的网络结构,并探索在其他类型的伊辛机上的应用。