基于DE-Q学习算法的移动机器人路径规划期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

基于DE-Q学习算法的移动机器人路径规划

引用本文：	马泽伦,袁亮,肖文东,何丽.基于DE-Q学习算法的移动机器人路径规划[J].火力与指挥控制,2023(3):152-156+163.

作者姓名：	马泽伦袁亮肖文东何丽

作者单位：	1. 新疆大学机械工程学院;2. 北京化工大学信息科学与技术学院

基金项目：	国家自然科学基金资助项目（U1813220）；

摘要：	针对使用Q学习算法对移动机器人进行路径规划时存在收敛速度较慢的问题，提出了一种基于Q学习的改进算法来选择全局路径规划的最优方案。通过方向奖惩机制与估价函数改进Q学习算法的奖励机制，提高Q学习算法的收敛效率。最后使用MATLAB对改进的Q学习算法进行了仿真实验，实验结果表明，通过设置方向奖惩机制和估价函数可以加速Q学习算法的收敛。
关键词：	Q学习算法方向奖惩机制估价函数路径规划