2026-06-19站内改写1 分钟阅读更新: 2026-06-19

零膨胀高斯分布实现估计分布算法中的参数空间稀疏性

估计分布算法（EDA）通过概率分布采样避开手工算子设计，但此前未推广至稀疏参数空间。本文提出多变量零膨胀高斯分布（ZIG）作为EDA的采样分布，联合优化稀疏模式与活跃值，无需分层或手工阈值。理论证明参数可识别，并给出实用估计器。在Lunar Lander基准测试中，ZIG-EDA比密集高斯EDA、手工稀疏进化算法和特设稀疏EDA收敛更快、最终回报更高，且仅用少量活跃参数。

来源arXiv Machine Learning作者: Andreas Faust, Sven Nitzsche, Juergen Becker

估计分布算法（Estimation-of-Distribution Algorithms, EDA）是一类强大的黑箱优化进化方法，尤其适用于目标函数结构未知的场景。与依赖手工设计的变异和交叉算子的经典进化算法不同，EDA完全规避了算子设计：它们对当前最优个体拟合一个概率分布，然后从该分布中采样生成下一代个体。EDA在连续参数空间中已经得到充分发展，但此前未能推广至稀疏参数空间——即最优解中大多数系数恰好为零的情况。

现有的稀疏黑箱优化器因此重新引入了EDA原本试图避免的手工设计：手工稀疏算子、在支撑集和活跃值之间交替的双层方案、归零阈值以及其他内嵌假设。为了填补这一空白，本文提出将多变量零膨胀高斯（Zero-Inflated Gaussian, ZIG）分布作为EDA的采样分布。ZIG分布采用一个具有独立指示维度和数值维度的潜高斯模型，能够表示稀疏模式、活跃参数之间的相关性以及这两者之间的交互作用，从而使得稀疏模式和活跃值可以联合优化，无需任何分层结构。

作者证明了该模型的潜参数可以从观测样本中识别，这与相关缺失数据设置中的构造不同，并为此引入了实用的基于摊销逆变换的估计器。这些估计器能够准确恢复潜相关结构。在Lunar Lander基准测试中，基于ZIG的EDA（ZIG-EDA）相比密集高斯EDA、手工稀疏进化算法以及特设稀疏EDA，收敛速度更快，最终回报更高，同时仅激活少量参数即可获得高效控制器。该研究为在稀疏参数空间中应用EDA提供了一种无需手工设计的新范式，有望推动进化优化在更多实际稀疏问题中的应用。