基于注意力引导的自编码器融合的无人机输电线路绝缘子缺陷检测
提出AE-YOLO框架,通过集成轻量瓶颈自编码器、CBAM和方差最大化正则化,解决无人机图像中绝缘子缺陷检测的类不平衡、尺度变化和小目标问题。在数据集上达到95.10% [email protected],超越YOLO基线5.0点。
基于无人机的输电线路巡检中,绝缘子缺陷检测面临严重的类别不平衡、尺度变化大以及缺陷目标小等挑战。现有的YOLO系列模型虽然高效,但在这些场景下性能受限。为此,研究人员提出了AE-YOLO框架,通过结合注意力引导的自编码器融合技术,显著提升了检测性能。
AE-YOLO的核心创新在于其架构设计。它在特征金字塔网络-路径聚合网络(FPN-PAN)颈部集成了轻量级瓶颈自编码器,这种设计能够有效保留多尺度特征融合过程中的异常敏感信息。同时,在骨干网络中全面应用卷积块注意力模块(CBAM),增强了特征的判别能力并抑制了背景干扰。此外,框架引入了一种方差最大化的自编码器正则化策略,鼓励模型学习多样化且对缺陷具有判别力的潜在表示。训练过程中,AE-YOLO采用统一的目标函数,结合焦点损失(Focal Loss)、完全IoU损失(CIoU Loss)和自编码器正则化,有效解决了前景-背景不平衡问题,并提升了定位精度。在推理阶段,模型使用加权框融合(WBF)技术,融合了YOLOv8、YOLOv10和YOLO11的预测结果。同时,自编码器引导的置信度提升机制增强了对罕见缺陷类别的敏感性。实验在绝缘子缺陷检测数据集上进行,AE-YOLO搭配EfficientNetV2骨干网络,实现了95.10%的[email protected]、96.40%的精度和93.80%的召回率。这一性能在[email protected]上超过最强YOLO基线5.0个百分点,召回率提升6.7个百分点。结果证实了该框架的有效性和适应性,为基于UAV的输电线路巡检提供了一种实用且可扩展的解决方案。该论文由Malak Allam等人于2026年6月3日提交,相关代码和数据已公开。未来,该方法有望集成到实际无人机巡检系统中,提高输电线路的运维效率和安全性。