AI News HubLIVE
站内改写1 分钟阅读

你确定吗?符号回归中不确定性量化的全面且易懂综述

符号回归(SR)是一种系统搜索数学函数空间以发现数据中潜在关系的方法。尽管近期取得进展,但缺乏不确定性量化(UQ)支持限制了其在实际决策中的应用。本文首次系统性地介绍了UQ概念,并回顾了SR中UQ的现有文献,主要分为频率学派、贝叶斯和模型选择三个方向。研究强调,SR中的UQ仍未被充分探索,需要进一步开发可靠的方法。

来源arXiv Machine Learning作者: Julia Reuter, Fabricio Olivetti de Franca

符号回归(Symbolic Regression,SR)是一种通过系统搜索数学函数空间来发现能够准确捕捉数据集中潜在关系模型的方法。尽管近年来该领域取得了显著进展,但缺乏对不确定性量化(Uncertainty Quantification,UQ)的支持,严重限制了其在现实世界决策过程中的广泛应用。在回归分析中,UQ能够提供关于模型可靠性的重要信息,这不仅有助于通过考虑数据中的不确定性来避免过拟合,还能为决策制定提供关键的洞察。本研究是首次明确解决这一问题的综述,旨在介绍基本的UQ概念,并系统回顾当前SR中UQ的相关文献。现有研究可大致归纳为三个方向:频率学派方法、贝叶斯方法以及模型选择方法。频率学派方法通常基于重复采样或渐近理论来估计不确定性,例如使用自助法或置信区间;贝叶斯方法则通过先验分布和后验计算来量化不确定性,能够整合先验知识;模型选择方法侧重于在多个候选模型之间进行权衡,使用诸如AIC、BIC等准则来识别最可靠的表示。尽管UQ在SR中具有重要价值,但目前仍是一个未被充分探索的领域。作者指出,现有方法在计算效率、可解释性和鲁棒性方面存在诸多挑战,例如贝叶斯方法的计算成本高、频率学派方法对样本量敏感等。这些挑战进一步激发了对可靠UQ方法的深入研究。未来的研究需要致力于开发能够无缝集成到SR流程中的UQ技术,从而推动该方法在科学发现和工程应用中的实际部署。此外,该综述还讨论了UQ在符号回归中的开放问题,包括如何处理高维数据、如何评估UQ方法的质量等。总之,这篇综述为符号回归领域的研究人员和实践者提供了宝贵的参考,指明了未来研究的重要方向。