首页 | 本学科首页   官方微博 | 高级检索  
     

基于强化学习的多对多拦截目标分配方法
作者姓名:郭建国  胡冠杰  许新鹏  刘悦  曹晋
作者单位:1. 西北工业大学航天学院精确制导与控制研究所;2. 上海机电工程研究所
基金项目:国家自然科学基金(61973254,92271109,52272404);
摘    要:针对空中对抗环境中多对多拦截的武器目标分配问题,提出了一种基于强化学习的多目标智能分配方法。在多对多拦截交战场景下,基于交战态势评估构建了目标分配的数学模型。通过引入目标威胁程度和拦截有效程度的概念,充分反映了各目标的拦截紧迫性和各拦截器的拦截能力表征,从而全面评估了攻防双方的交战态势。在目标分配模型的基础上,将目标分配问题构建为马尔可夫决策过程,并采用基于深度Q网络的强化学习算法训练求解。依靠环境交互下的自学习和奖励机制,有效实现了最优分配方案的动态生成。通过数学仿真构建多对多拦截场景,并验证了该方法的有效性,经训练后的目标分配方法能够满足多对多拦截中连续动态的任务分配要求。

关 键 词:武器目标分配  多目标拦截  态势评估  强化学习  深度Q网络
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号