基于PPO的球形机器人目标跟随研究 |
| |
引用本文: | 靳一聪,应展烽,刘春政,葛昊,陈志华.基于PPO的球形机器人目标跟随研究[J].兵器装备工程学报,2024(3):280-285. |
| |
作者姓名: | 靳一聪 应展烽 刘春政 葛昊 陈志华 |
| |
作者单位: | 1. 南京理工大学瞬态物理国家重点实验室;2. 南京理工大学能源与动力工程学院 |
| |
摘 要: | 球形机器人由于其优异的运动性能、出色的地形适应能力和防侧翻的特性,被广泛应用于水下探测、岸滩巡检等需要适应复杂环境的场景。然而球形机器人系统模型具有欠驱动、非线性的特点,运动控制问题复杂,在复杂应用环境下难以可靠跟随目标。为此,提出了一种基于近端策略优化(PPO)算法的球形机器人目标跟随方法。该方法基于深度强化学习理论,在球形机器人动力学模型的基础上,设计了简单高效的动作空间和表征完善的状态空间。并且为提高目标跟随方法的鲁棒性,该方法在奖励函数中引入人工势场,以使目标始终保持在机器人视野中心。仿真结果表明,所提方法能够满足既定场景的跟随需求,球形机器人使用该方法可以对随机运动目标进行可靠跟随。
|
关 键 词: | 球形机器人 目标跟随 强化学习 PPO算法 人工势场 |
|
|