AI News HubLIVE
站内改写1 分钟阅读

零膨胀高斯分布实现估计分布算法中的参数空间稀疏性

估计分布算法(EDA)通过概率分布采样避开手工算子设计,但此前未推广至稀疏参数空间。本文提出多变量零膨胀高斯分布(ZIG)作为EDA的采样分布,联合优化稀疏模式与活跃值,无需分层或手工阈值。理论证明参数可识别,并给出实用估计器。在Lunar Lander基准测试中,ZIG-EDA比密集高斯EDA、手工稀疏进化算法和特设稀疏EDA收敛更快、最终回报更高,且仅用少量活跃参数。

来源arXiv Machine Learning作者: Andreas Faust, Sven Nitzsche, Juergen Becker

估计分布算法(Estimation-of-Distribution Algorithms, EDA)是一类强大的黑箱优化进化方法,尤其适用于目标函数结构未知的场景。与依赖手工设计的变异和交叉算子的经典进化算法不同,EDA完全规避了算子设计:它们对当前最优个体拟合一个概率分布,然后从该分布中采样生成下一代个体。EDA在连续参数空间中已经得到充分发展,但此前未能推广至稀疏参数空间——即最优解中大多数系数恰好为零的情况。

现有的稀疏黑箱优化器因此重新引入了EDA原本试图避免的手工设计:手工稀疏算子、在支撑集和活跃值之间交替的双层方案、归零阈值以及其他内嵌假设。为了填补这一空白,本文提出将多变量零膨胀高斯(Zero-Inflated Gaussian, ZIG)分布作为EDA的采样分布。ZIG分布采用一个具有独立指示维度和数值维度的潜高斯模型,能够表示稀疏模式、活跃参数之间的相关性以及这两者之间的交互作用,从而使得稀疏模式和活跃值可以联合优化,无需任何分层结构。

作者证明了该模型的潜参数可以从观测样本中识别,这与相关缺失数据设置中的构造不同,并为此引入了实用的基于摊销逆变换的估计器。这些估计器能够准确恢复潜相关结构。在Lunar Lander基准测试中,基于ZIG的EDA(ZIG-EDA)相比密集高斯EDA、手工稀疏进化算法以及特设稀疏EDA,收敛速度更快,最终回报更高,同时仅激活少量参数即可获得高效控制器。该研究为在稀疏参数空间中应用EDA提供了一种无需手工设计的新范式,有望推动进化优化在更多实际稀疏问题中的应用。