2026-05-25 12:00 UTC+8站内改写2 分钟阅读更新: 2026-06-30 21:03 UTC+8

WeCon：一种高效的多目标组合优化问题权重条件神经网络求解器

现有神经求解器在处理多目标组合优化问题时，通常采用基于分解的策略，将问题转化为多个与权重向量相关的子问题。然而，这些方法往往仅在解码阶段注入一次权重，限制了权重条件上下文建模，或者主要在编码阶段注入，导致解码时权重信号稀释。此外，偏好优化方法依赖纯随机采样构建解对，训练效率低下。为此，本文提出WeCon，一种高效的权重条件神经网络求解器，通过门控残差融合（GRF）和残差融合（RF）模块增强权重与实例特征的交互，并引入高效偏好优化（EPO）构建高质量解对。实验表明，WeCon在超体积（HV）指标上与最先进的POCCO-W相当，同时推理时间减少40%。

来源arXiv Machine Learning作者: Xuan Wu, Jinbiao Chen, Yang Li, Lijie Wen, Chunguo Wu, Yuanshu Li, Yubin Xiao, Chunyan Miao, You Zhou, Di Wang

WeCon: 一种高效的多目标组合优化问题权重条件神经网络求解器

多目标组合优化问题（MOCOPs）在现实世界中无处不在，例如物流配送中的路径规划需要同时最小化成本和最大化客户满意度，生产调度则需要权衡时间、成本和资源利用率。传统的精确算法和启发式算法在处理多个冲突目标时往往力不从心，而近年来基于深度学习的神经求解器因其强大的学习能力和快速推理能力受到了广泛关注。然而，现有神经求解器在应对MOCOPs时存在明显不足：它们大多采用分解策略，将多目标问题转化为一系列与权重向量相关的单目标子问题，但在权重信息注入方式上存在两大局限。一是仅在解码阶段一次性注入权重，这限制了编码器和解码器对权重条件上下文的建模能力；二是在编码阶段过度注入权重，导致解码阶段权重信号逐渐被稀释，影响最终解的质量。此外，偏好优化方法通常依赖纯随机采样来生成用于训练的正负解对，这种方式产生的解对往往信息量不足，导致训练效率低下。

针对这些挑战，来自多所机构的研究团队提出了一种名为WeCon（Weight-Conditioned neural solver）的高效神经网络求解器。WeCon的核心贡献在于三个方面：首先，在编码器部分，研究人员设计了一个包含三个标准注意力块和一个创新的门控残差融合（Gated Residual Fusion, GRF）模块的层结构。GRF模块通过门控机制自适应地融合实例特征和权重向量，使得两者能够和谐交互，从而生成蕴含丰富权重信息的上下文表示。其次，在解码器部分，他们引入了一个即插即用的残差融合（Residual Fusion, RF）模块，该模块通过残差连接将权重信息与解码过程深度融合，有效缓解了权重信号在解码阶段的稀释问题。最后，为了提升训练效率，他们提出了高效偏好优化（Efficient Preference Optimization, EPO）方法。与传统随机采样不同，EPO通过构造高质量的解对（例如利用当前最优解与随机解的对比）来提供更有信息量的训练信号，从而加快了模型的收敛速度并提升了最终性能。

为了验证WeCon的有效性，研究团队在四种具有不同规模和问题分布模式的MOCOP变体上进行了广泛的实验。这些变体涵盖了多目标旅行商问题（MOTSP）、多目标车辆路径问题（MOVRP）等经典场景。实验采用超体积（HyperVolume, HV）作为主要评估指标，该指标综合衡量了非支配解集在目标空间中的覆盖范围和质量。结果显示，WeCon在HV指标上与当前最先进的神经求解器POCCO-W达到了相当的水平，同时推理时间大幅降低了40%。这一效率提升对于需要实时决策的应用（如动态调度）具有重要意义。进一步的消融研究分别验证了GRF、RF和EPO三个组件的贡献，证明每一个设计都不可或缺。

该论文由Xuan Wu等10位作者共同完成，于2026年5月20日提交至arXiv预印本平台。作者表示，相关代码和数据集将在后续公开发布，以促进该领域的进一步研究。WeCon的提出不仅为多目标组合优化问题提供了一种高效且有效的神经求解方案，也为未来权重条件建模和偏好优化方向的研究提供了新的思路和基准。