首页 | 本学科首页   官方微博 | 高级检索  
   检索      

针对无人机集群对抗的规则与智能耦合约束训练方法
引用本文:高显忠,项磊,王宝来,贾高伟,侯中喜.针对无人机集群对抗的规则与智能耦合约束训练方法[J].国防科技大学学报,2023,45(1):157-166.
作者姓名:高显忠  项磊  王宝来  贾高伟  侯中喜
作者单位:国防科技大学 空天科学学院, 湖南 长沙 410073;国防科技大学 计算机学院, 湖南 长沙 410073
基金项目:国家自然科学基金资助项目(11602298)
摘    要:基于无人机集群智能攻防对抗构想,建立了无人机集群智能攻防对抗仿真环境。针对传统强化学习算法中难以通过奖励信号精准控制对抗过程中无人机的速度和攻击角度等问题,提出一种规则与智能耦合约束训练的多智能体深度确定性策略梯度(rule and intelligence coupling constrained multi-agent deep deterministic policy gradient, RIC-MADDPG)算法,该算法采用规则对强化学习中无人机的动作进行约束。实验结果显示,基于RIC-MADDPG方法训练的无人机集群对抗模型能使得红方无人机集群在对抗中的胜率从53%提高至79%,表明采用“智能体训练—发现问题—编写规则—再次智能体训练—再次发现问题—再次编写规则”的方式对优化智能体对抗策略是有效的。研究结果对建立无人机集群智能攻防策略训练体系、开展规则与智能相耦合的集群战法研究具有一定参考意义。

关 键 词:无人机集群  MADDPG算法  智能体决策  对抗模型  规则约束
收稿时间:2021/2/20 0:00:00

Rule and intelligence coupling constraint training method for UAV swarm confrontation
GAO Xianzhong,XIANG Lei,WANG Baolai,JIA Gaowei,HOU Zhongxi.Rule and intelligence coupling constraint training method for UAV swarm confrontation[J].Journal of National University of Defense Technology,2023,45(1):157-166.
Authors:GAO Xianzhong  XIANG Lei  WANG Baolai  JIA Gaowei  HOU Zhongxi
Institution:College of Aerospace Science and Engineering, National University of Defense Technology, Changsha 410073, China;College of Computer Science and Technology, National University of Defense Technology, Changsha 410073, China
Abstract:
Keywords:UAV swarms  MADDPG algorithm  agent decision making  countermeasure model  rule-constrained
点击此处可从《国防科技大学学报》浏览原始摘要信息
点击此处可从《国防科技大学学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号