摘要:
针对车载影像中的道路病害尺寸差异大,小尺度病害多,导致检测精度低的问题,本文提出一种基于YOLOv5s改进的实时车载影像道路病害检测模型VRD-YOLO(Vehicle-mounted image Road Damage Detection-YOLO).首先,提出通道混合滑动Transformer模块,增强模型全局上下文建模能力,强化细粒度道路病害语义特征信息提取;其次,引入具有跨层融合和跨尺度融合特性的广义特征金字塔,扩大网络感受野,强化多尺度病害特征融合;再次,设计动态检测头,实现尺度感知、空间感知和任务感知,优化模型特征响应,进一步提升模型的检测性能;最后,构建车载影像道路病害数据集VIRDD(Vehicle-mounted Image Road Damage Dataset),扩充现有道路病害数据集数量及类型,并基于该数据集进行消融和对比实验.实验结果表明:VRD-YOLO在VIRDD数据集上的平均精度均值(mAP@0.5)为74.45%,检测速度(FPS)可达到28.56帧/s,与YOLOv5s模型相比,精确度、召回率、F1分数和mAP分别提升2.79、2.32、2.54和3.19个百分点.同时,通过与其他6种经典及主流目标检测模型比较,VRD-YOLO以最少的模型参数量(9.68×106)获得了最佳的检测精度,验证了本文方法的有效性和优越性.