针对无人机集群对抗的规则与智能耦合约束训练方法 |
| |
作者姓名: | 高显忠 项磊 王宝来 贾高伟 侯中喜 |
| |
作者单位: | 国防科技大学 空天科学学院, 湖南 长沙 410073;国防科技大学 计算机学院, 湖南 长沙 410073 |
| |
基金项目: | 国家自然科学基金资助项目(11602298) |
| |
摘 要: | 基于无人机集群智能攻防对抗构想,建立了无人机集群智能攻防对抗仿真环境。针对传统强化学习算法中难以通过奖励信号精准控制对抗过程中无人机的速度和攻击角度等问题,提出一种规则与智能耦合约束训练的多智能体深度确定性策略梯度(rule and intelligence coupling constrained multi-agent deep deterministic policy gradient, RIC-MADDPG)算法,该算法采用规则对强化学习中无人机的动作进行约束。实验结果显示,基于RIC-MADDPG方法训练的无人机集群对抗模型能使得红方无人机集群在对抗中的胜率从53%提高至79%,表明采用“智能体训练—发现问题—编写规则—再次智能体训练—再次发现问题—再次编写规则”的方式对优化智能体对抗策略是有效的。研究结果对建立无人机集群智能攻防策略训练体系、开展规则与智能相耦合的集群战法研究具有一定参考意义。
|
关 键 词: | 无人机集群 MADDPG算法 智能体决策 对抗模型 规则约束 |
收稿时间: | 2021-02-20 |
本文献已被 万方数据 等数据库收录! |
| 点击此处可从《国防科技大学学报》浏览原始摘要信息 |
|
点击此处可从《国防科技大学学报》下载全文 |
|