基于PPO的球形机器人目标跟随研究期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于PPO的球形机器人目标跟随研究

作者姓名：	靳一聪应展烽刘春政葛昊陈志华

作者单位：	1. 南京理工大学瞬态物理国家重点实验室;2. 南京理工大学能源与动力工程学院

摘要：	球形机器人由于其优异的运动性能、出色的地形适应能力和防侧翻的特性，被广泛应用于水下探测、岸滩巡检等需要适应复杂环境的场景。然而球形机器人系统模型具有欠驱动、非线性的特点，运动控制问题复杂，在复杂应用环境下难以可靠跟随目标。为此，提出了一种基于近端策略优化(PPO)算法的球形机器人目标跟随方法。该方法基于深度强化学习理论，在球形机器人动力学模型的基础上，设计了简单高效的动作空间和表征完善的状态空间。并且为提高目标跟随方法的鲁棒性，该方法在奖励函数中引入人工势场，以使目标始终保持在机器人视野中心。仿真结果表明，所提方法能够满足既定场景的跟随需求，球形机器人使用该方法可以对随机运动目标进行可靠跟随。
关键词：	球形机器人目标跟随强化学习 PPO算法人工势场