多约束强化学习最优智能滑翔制导方法 |
| |
作者姓名: | 朱建文 赵长见 李小平 包为民 |
| |
作者单位: | 西安电子科技大学 空间科学与技术学院, 西安 710126;中国运载火箭技术研究院, 北京 100076;西安电子科技大学 空间科学与技术学院, 西安 710126;中国航天科技集团公司, 北京 100048 |
| |
基金项目: | 国家自然科学基金资助项目(61703409);中国博士后科学基金资助项目(2019M66364) 〖 |
| |
摘 要: | 为提升复杂飞行任务下滑翔制导的自主性,提出一种基于最优制导与强化学习的多约束智能滑翔制导策略。引入三维最优制导以满足终端经纬度、高度以及速度倾角约束。提出基于侧向正弦机动的速度控制策略,研究考虑机动飞行的终端速度解析预测方法。针对速度控制中机动幅值无法离线确定的问题,研究基于强化学习的智能调参方法。该方法基于终端速度设计状态空间,以机动幅值设计动作空间,设计综合终端速度误差与滑翔制导任务的回报函数,采用Q-Learning实现机动幅值的智能调整。仿真结果表明,智能滑翔制导方法能够高精度满足终端多种约束,并能有效提升复杂任务下的自主决策能力。
|
关 键 词: | 滑翔飞行 最优制导 智能调参 强化学习 Q-Learning |
收稿时间: | 2020-10-13 |
|
| 点击此处可从《国防科技大学学报》浏览原始摘要信息 |
|
点击此处可从《国防科技大学学报》下载全文 |
|