针对无人机集群对抗的规则与智能耦合约束训练方法 Rule and intelligence coupling constraint training method for UAV swarm confrontation期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

针对无人机集群对抗的规则与智能耦合约束训练方法

引用本文：	高显忠,项磊,王宝来,贾高伟,侯中喜.针对无人机集群对抗的规则与智能耦合约束训练方法[J].国防科技大学学报,2023,45(1):157-166.

作者姓名：	高显忠项磊王宝来贾高伟侯中喜

作者单位：	国防科技大学空天科学学院, 湖南长沙 410073;国防科技大学计算机学院, 湖南长沙 410073

基金项目：	国家自然科学基金资助项目(11602298)

摘要：	基于无人机集群智能攻防对抗构想，建立了无人机集群智能攻防对抗仿真环境。针对传统强化学习算法中难以通过奖励信号精准控制对抗过程中无人机的速度和攻击角度等问题，提出一种规则与智能耦合约束训练的多智能体深度确定性策略梯度(rule and intelligence coupling constrained multi-agent deep deterministic policy gradient, RIC-MADDPG)算法，该算法采用规则对强化学习中无人机的动作进行约束。实验结果显示，基于RIC-MADDPG方法训练的无人机集群对抗模型能使得红方无人机集群在对抗中的胜率从53%提高至79%,表明采用“智能体训练—发现问题—编写规则—再次智能体训练—再次发现问题—再次编写规则”的方式对优化智能体对抗策略是有效的。研究结果对建立无人机集群智能攻防策略训练体系、开展规则与智能相耦合的集群战法研究具有一定参考意义。
关键词：	无人机集群 MADDPG算法智能体决策对抗模型规则约束
收稿时间：	2021/2/20 0:00:00
Rule and intelligence coupling constraint training method for UAV swarm confrontation

GAO Xianzhong,XIANG Lei,WANG Baolai,JIA Gaowei,HOU Zhongxi.Rule and intelligence coupling constraint training method for UAV swarm confrontation[J].Journal of National University of Defense Technology,2023,45(1):157-166.

Authors:	GAO Xianzhong XIANG Lei WANG Baolai JIA Gaowei HOU Zhongxi

Institution:	College of Aerospace Science and Engineering, National University of Defense Technology, Changsha 410073, China;College of Computer Science and Technology, National University of Defense Technology, Changsha 410073, China

Abstract:

Keywords:	UAV swarms MADDPG algorithm agent decision making countermeasure model rule-constrained

	点击此处可从《国防科技大学学报》浏览原始摘要信息
	点击此处可从《国防科技大学学报》下载免费的PDF全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏