首页 | 本学科首页   官方微博 | 高级检索  
     

基于深度强化学习和导航向量场的卫星规避拦截算法
作者姓名:张云飞  王宏伦  张梦华  刘一恒  吴健发
作者单位:1. 北京航空航天大学自动化科学与电气工程学院;2. 飞行器控制一体化技术国防科技重点实验室;3. 北京宇航系统工程研究所;4. 北京控制工程研究所
基金项目:国家自然科学基金(U21B6001,62203046);;中国博士后科学基金(2022M713006);
摘    要:针对在轨卫星规避拦截问题,提出了一种新的基于强化学习和三维李雅普诺夫导航向量场(3D-LGV)算法。首先,采用3D-LGV产生收敛于椭圆轨道的趋近律,保证规避拦截后能再次入轨。其次,针对拦截卫星利用扰动流体动态系统算法(IFDS)产生扰动流场,利用该扰动流场对导航向量场产生的趋近律进行修正,从而保证卫星能有效地规避拦截。由于IFDS算法中扰动流场大小和方向主要受其中反应系数和方向系数的影响,采用近端策略优化深度强化学习算法作为决策层输出反应系数和方向系数,用于指导卫星在不同场景下提供合适的对导航向量场的修正。最后,通过将IFDS算法修正后的趋近律作为卫星的最终运动方向,实现了整个规避过程。在构建的不同场景下进行了对比实验,结果表明,相较于滚动时域优化算法(RHC)、人工势场算法(APF)和传统IFDS算法,基于强化学习的算法决策时间更短、规避效果更好,在不同场景下均能实现有效规避。同时,对该算法进行蒙特卡洛仿真,统计结果显示卫星规避成功率高达98%。因此,此研究对智能方法在卫星规避拦截领域的应用具有一定价值。

关 键 词:规避拦截  李雅普诺夫导航向量场  扰动流体动态系统  近端策略优化  强化学习  智能决策
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号