首页 | 本学科首页   官方微博 | 高级检索  
   检索      

基于PPO的球形机器人目标跟随研究
引用本文:靳一聪,应展烽,刘春政,葛昊,陈志华.基于PPO的球形机器人目标跟随研究[J].兵器装备工程学报,2024(3):280-285.
作者姓名:靳一聪  应展烽  刘春政  葛昊  陈志华
作者单位:1. 南京理工大学瞬态物理国家重点实验室;2. 南京理工大学能源与动力工程学院
摘    要:球形机器人由于其优异的运动性能、出色的地形适应能力和防侧翻的特性,被广泛应用于水下探测、岸滩巡检等需要适应复杂环境的场景。然而球形机器人系统模型具有欠驱动、非线性的特点,运动控制问题复杂,在复杂应用环境下难以可靠跟随目标。为此,提出了一种基于近端策略优化(PPO)算法的球形机器人目标跟随方法。该方法基于深度强化学习理论,在球形机器人动力学模型的基础上,设计了简单高效的动作空间和表征完善的状态空间。并且为提高目标跟随方法的鲁棒性,该方法在奖励函数中引入人工势场,以使目标始终保持在机器人视野中心。仿真结果表明,所提方法能够满足既定场景的跟随需求,球形机器人使用该方法可以对随机运动目标进行可靠跟随。

关 键 词:球形机器人  目标跟随  强化学习  PPO算法  人工势场
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号