基于深度强化学习的无人机实时航迹规划 |
| |
引用本文: | 舒健生,周于翔,郑晓龙,等.基于深度强化学习的无人机实时航迹规划[J].火力与指挥控制,2023,48(12):133-141.DOI:10.3969/j.issn.1002-0640.2023.12.020 |
| |
作者姓名: | 舒健生 周于翔 郑晓龙 赖晓昌 陶大甜 |
| |
作者单位: | 1.火箭军工程大学,西安 710025;2.武汉理工大学信息工程学院,武汉 430070 |
| |
摘 要: | 随着无人机技术的应用和发展,无人机执行任务的飞行环境愈发复杂多变,对无人机机动避障能力和航迹规划的实时性提出了更高的要求。基于泛化性较好、对环境依赖弱的深度强化学习算法,以雷达实时获取的障碍物地图信息为基础进行实时路径规划,针对二维航迹规划问题特点设计了连续奖励函数,解决了强化学习算法在二维平面航迹规划中奖励稀疏的问题;基于迁移学习的思想设计多个训练环境,并按任务的难易程度进行分步训练,降低了算法的训练难度,提高了训练效果,并使算法的收敛效果更加稳定。在实验中将SAC算法与目前主流的PPO和TD3算法进行对比,实验结果表明:SAC算法收敛速度快,实时性好,航迹平滑度更好。
|
关 键 词: | 无人机 SAC算法 二维平面规划 实时航迹规划 |
收稿时间: | 2022-11-27 |
修稿时间: | 2022-12-30 |
本文献已被 万方数据 等数据库收录! |
| 点击此处可从《火力与指挥控制》浏览原始摘要信息 |
|
点击此处可从《火力与指挥控制》下载全文 |
|