2026-06-03 12:00 UTC+8站内改写1 分钟阅读更新: 2026-06-30 21:03 UTC+8

测试测试：类别分割异常检测中的分数方向不稳定性

研究表明，在数据集内类别分割评估中，当保留的异常类与正常混合在表示空间重叠时，异常分数可能退化甚至反转，且最优分数方向依赖于未知的异常类。作者提出了一种免训练的“邻域类泄漏”诊断方法，并在多个数据集和特征空间上验证了其对分数方向不稳定性的预测能力。结论是，类别分割异常检测基准应被视为几何依赖的应力测试，而非无条件的检测能力证明。

来源arXiv Machine Learning作者: Alejandro Ascarate, Leo Lebrat, Rodrigo Santa Cruz, Clinton Fookes, Olivier Salvado

一项新研究揭示了当前广泛使用的异常检测评估方法中存在的根本性缺陷。该研究将于2026年国际机器学习大会（ICML）的假设检验研讨会上发表，挑战了基于数据集内类别分割评估的主流实践。

在机器学习领域，异常检测通常通过将数据集划分为若干类别，并保留其中一个类别作为“异常”，其余作为“正常”来评估模型性能。这种类分割评估被视作完全无条件的分布外异常检测的代理方法。然而，来自研究团队的新工作表明，这种协议可能根本不适定。

核心问题在于，当被保留的异常类在表示空间中与正常类的混合分布存在重叠时，异常分数可能退化，甚至出现反转。在这种几何状态下，理想情况下的高异常分数可能变得接近随机猜测，或者更糟糕的是，分数方向完全颠倒——原本应指示异常的高分数反而对应正常样本。更复杂的是，最优的分数方向依赖于未知的异常类别，这使得评估失去了客观基准。

为了解决这一困境，研究人员引入了“邻域类泄漏”（Neighborhood Class Leakage）这一简单且无需训练的诊断工具。通过在Fashion-MNIST、CIFAR-10和Imagenette数据集上的实验，该诊断方法在原始像素空间和变分自编码器（VAE）潜在空间中都成功预测了分数方向的不稳定性。

论文的作者团队来自多家机构，他们强调这些发现不应被视为对现有异常检测方法能力的否定，而是提醒社区：类分割基准应被理解为几何依赖的应力测试，而非无条件的性能证据。“当评估结果高度依赖于数据几何结构时，我们需要重新思考这些基准究竟在测量什么，”研究者在文中写道。

该研究已在arXiv预印本发布（arXiv:2606.02601），并获得了ICML 2026研讨会的接受。论文仅4页篇幅，附有1张图表，简洁而有力地指出了这一领域的关键方法论问题。对于实践者而言，这项工作的启示是：在使用类分割评估时，必须检查表示空间中的类别重叠情况，否则可能得出误导性的结论。