基于深度强化学习的无人机实时航迹规划期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于深度强化学习的无人机实时航迹规划

作者姓名：	舒健生周于翔郑晓龙赖晓昌陶大甜

作者单位：	1. 火箭军工程大学;2. 武汉理工大学信息工程学院

摘要：	随着无人机技术的应用和发展，无人机执行任务的飞行环境愈发复杂多变，对无人机机动避障能力和航迹规划的实时性提出了更高的要求。基于泛化性较好、对环境依赖弱的深度强化学习算法，以雷达实时获取的障碍物地图信息为基础进行实时路径规划，针对二维航迹规划问题特点设计了连续奖励函数，解决了强化学习算法在二维平面航迹规划中奖励稀疏的问题；基于迁移学习的思想设计多个训练环境，并按任务的难易程度进行分步训练，降低了算法的训练难度，提高了训练效果，并使算法的收敛效果更加稳定。在实验中将SAC算法与目前主流的PPO和TD3算法进行对比，实验结果表明：SAC算法收敛速度快，实时性好，航迹平滑度更好。
关键词：	无人机 SAC算法二维平面规划实时航迹规划