本文版权为《邮电设计技术》所有,如需转载请联系《邮电设计技术》编辑部
摘 要:针对复杂场景下输电线路可视化监控中目标识别准确率不高、误检误报率较高的问题,提出了一种结合大模型的数据扩增和 YOLOv10优化算法来提升复杂场景下目标识别准确率的实现方法。首先,针对样本数据数量短缺的问题,基于Stable-diffusion大模型进行数据扩增,丰富并增加了样本数量。其次,针对训练样本数量有限的情况,对YOLOv10算法进行改进,进一步强化图片特征的提取算法,优化目标识别算法,提升复杂自然场景下的目标识别准确率及性能。最终的实验结果表明,与现有的实现方法相比,针对复杂场景的输电线路的可视化监控,对目标识别的准确率从原有的52.6%提升至54.3%。
关键词:数据扩增;目标识别;YOLO
doi:10.12045/j.issn.1007-3043.2024.09.006
概述
输电线路的可视化监控是保障电网安全运行的重要手段。通过在电力杆塔上架装智能摄像头,对输电线路的环境安全、电力作业安全等进行实时、远程和智能的监控,这种方式已经在电网运营企业中进行了大规模的应用,并取得了不错的效果,可以显著提高输电线路的安全性和运维效率。然而,由于自然场景的复杂性,现有方案存在目标识别的准确性不高和及时性不够的问题,误捡、漏检现象时有发生。例如,在复杂自然场景下,挖掘机在输电走廊附近进行作业,受树木、建筑等物体的遮挡,或者摄像头拍摄角度的影响,无法及时识别出挖掘机对输电线路安全运行造成的潜在危害。产生这种问题的原因在于,这种智能视觉实现方案通常基于 YOLO 等深度学习模型,通过大量的标注图片进行模型训练,形成最终的推理模型和算法。
国内外的许多学者对基于深度学习的电力线路监测技术都有过深入的研究,文献[1]提出了新模型YOLO-2MCS 用于输电线路走廊隐患目标检测,并使用混合数据增强策略对数据集进行有效扩充;文献[2]提出一种基于改进型目标检测算法(YOLO v3)的绝缘子异物检测方法,在实现中首先使用视频分割算法和背景替换的方式对样本数据进行了扩增;文献[3]从近10年来基于深度学习的输电线路视觉检测方法的研究进展出发,首先概述适用于输电线路巡检的深度卷积神经网络,接着重点阐述基于深度卷积神经网络的输电线路巡检图像数据的目标检测,最后指出基于深度学习的输电线路巡检图像数据视觉检测方法目前存在样本均衡性、小目标检测等方面的问题。文献[4]对基于计算机视觉和深度学习的电力线路巡检方案及数据来源问题进行了总结和回顾,提出了一种新的基于自主视觉的电力线路巡检概念。综上,在基于深度学习的电力线路监控和巡检应用中,研究人员始终面临着如下挑战:样本数据获取困难,由于电网运营安全性要求很高,管理措施也比较严格,加之这种影响电网安全的作业行为并不经常发生,所以很难获取到大量的训练样本数据来训练模型;复杂场景下的目标识别问题,包括复杂的自然场景下电力线路危害监测和预警,以及电网小目标识别问题,如绝缘子粉化、小金具锈蚀、导线断股、M销松动等。
针对训练样本数据短缺的问题,现有方案通常采用数据扩增的方法来改进[5-12]。文献[5]采用光照变换、噪声变换、旋转变换、平移变换等传统图像处理方法来对原始样本数据集进行扩充,文献[6]采用生成对抗网络技术来进行数据扩增,文献[7-8]通过图像的镜像、翻转,以及改变原始图像的大小、亮度和模糊度来扩增训练数据集;文献[9-10]通过调整图像的饱和度、曝光度和色调来生成更丰富的样本。文献[11]使用去噪扩散概率模型提取出域外数据中的背景知识,将电力设备在真实样本中的位置知识迁移到背景知识,从而生成具有较复杂背景的人工图像。
以上这些数据扩增的实现方法,总体上可以分为2类,一类是基于传统图像处理的数据扩增技术,另一类是基于深度学习网络的数据库扩增。本文将针对电力复杂场景下的目标识别问题,提出一种基于大模型内容生成技术的数据扩增方法,同时,针对这些包含真实样本数据和扩增生成数据的复杂场景下的目标识别,改进 YOLOv10 算法,从而提升了目标识别的准确性。