AI News HubLIVE
站内改写1 分钟阅读

滤波器对之间的连接可提高卷积神经网络的准确性

本文提出了一种改进卷积神经网络(CNN)的新方法:在滤波器对之间引入可学习的连接参数。传统的CNN依赖于逐点激活函数,而该方法允许网络在不同层实现不同的连接,从而更好地适应任务。实验表明,这种可学习的连接提高了模型准确性。

来源arXiv Computer Vision作者: Kathleen Anderson, Philipp Gr\"uning, Erhardt Barth

卷积神经网络(CNN)是计算机视觉领域的核心模型,但大多数现代架构仍沿用传统模式:堆叠卷积块,并通过逐点激活函数(如ReLU)分隔。然而,仅依赖逐点非线性存在固有缺陷,例如无法充分捕捉滤波器之间的相互关系。这种局限性促使研究者探索新的网络结构。

近期,来自Kathleen Anderson等人的研究提出了一种替代方案:在CNN的滤波器对之间引入连接。不同于以往使用乘法或最小值操作实现逻辑“与”连接的方法,该研究进一步推广了连接函数,使其包含可学习参数。这意味着网络能够根据不同的层和任务动态调整连接的具体形式,从而更灵活地适应数据特征。这种参数化的连接函数允许网络在训练过程中自动学习最优的滤波器间交互方式,相比固定连接(如乘法)具有更强的表达能力。

论文中,作者在多个基准数据集上验证了这一方法的有效性。实验结果显示,与传统CNN相比,引入可学习滤波器间连接的网络在图像分类等任务上取得了更高的准确率。该工作指出,这种连接机制可以作为一种通用模块集成到现有CNN架构中,无需大幅改动原有设计。此外,作者还探讨了连接参数的初始化策略和正则化方法,以确保训练稳定性和泛化能力。

这一研究成果已发表在IJCNN 2023上,并提供了详细的代码和实验复现信息。未来,研究者可探索更复杂的连接拓扑,比如滤波器组之间的连接,或将此思想扩展至其他神经网络类型(如循环神经网络或Transformer)。该工作为CNN的设计提供了新的视角,有望推动计算机视觉领域的进一步发展。