基于ST-YOLOv7的无人机视角下行人及车辆识别 |
| |
作者姓名: | 郝博 谷继明 刘力维 |
| |
作者单位: | 1. 东北大学机械工程与自动化学院;2. 东北大学秦皇岛分校控制工程学院 |
| |
基金项目: | 装备预研领域基金重点项目(61409230125);;装备预先研究领域基金项目(80923020104); |
| |
摘 要: | 由于无人机视角下的背景复杂,识别的目标多为远距离小目标,因此容易导致漏检及误检问题。为了实现无人机视角下对行人及车辆高精度识别,提出了以YOLOv7网络模型为基础的ST-YOLOv7算法,主干网络中融合了Swin Transform模块,构建复杂背景与小目标的全局关系,融入SENet通道注意力机制,为不同通道的特征分配不同权重,增强小目标特征的捕捉,在头部网络中,加入了YOLOv5网络中的C3模块,增加网络的深度和感受野,提高特征提取的能力,增加了1个小目标检测层,进一步提升对小目标识别的精度。实验证明:ST-YOLOv7网络模型在自制的航拍数据集中对行人的识别精度高达83.4%,对数据集中的车辆的识别精度达到了89.3%。均优于YOLOv5和YOLOv7目标检测算法,以较小的效率损失取得了较高精度。
|
关 键 词: | 复杂背景 远距离小目标 YOLOv7 注意力机制 目标识别 |
|