首页 | 本学科首页   官方微博 | 高级检索  
   检索      

基于DE-Q学习算法的移动机器人路径规划
引用本文:马泽伦,袁亮,肖文东,何丽.基于DE-Q学习算法的移动机器人路径规划[J].火力与指挥控制,2023(3):152-156+163.
作者姓名:马泽伦  袁亮  肖文东  何丽
作者单位:1. 新疆大学机械工程学院;2. 北京化工大学信息科学与技术学院
基金项目:国家自然科学基金资助项目(U1813220);
摘    要:针对使用Q学习算法对移动机器人进行路径规划时存在收敛速度较慢的问题,提出了一种基于Q学习的改进算法来选择全局路径规划的最优方案。通过方向奖惩机制与估价函数改进Q学习算法的奖励机制,提高Q学习算法的收敛效率。最后使用MATLAB对改进的Q学习算法进行了仿真实验,实验结果表明,通过设置方向奖惩机制和估价函数可以加速Q学习算法的收敛。

关 键 词:Q学习算法  方向奖惩机制  估价函数  路径规划
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号