期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

杨书恒张栋任智唐硕《无人系统技术》2022,(5):51-62

针对复杂动态不确定环境下的无人机集群对抗问题,基于多智能体强化学习开展了对抗决策方法的研究。首先,基于MaCA环境构建了无人机集群对抗模型;其次,引入集中训练网络的混合架构模式,改进了传统DDPG算法,设计了面向无人机集群对抗的MADDPG算法,分别采用基于规则的对抗策略和基于DQN的对抗策略对算法进行了训练,提升了对抗算法的鲁棒性、适应性和泛化性;最后,通过搭建对抗仿真环境,验证了所设计方法的有效性和可靠性。相似文献

2.

针对无人机集群对抗的规则与智能耦合约束训练方法

下载免费PDF全文

高显忠项磊王宝来贾高伟侯中喜《国防科技大学学报》2023,45(1):157-166

基于无人机集群智能攻防对抗构想,建立了无人机集群智能攻防对抗仿真环境。针对传统强化学习算法中难以通过奖励信号精准控制对抗过程中无人机的速度和攻击角度等问题,提出一种规则与智能耦合约束训练的多智能体深度确定性策略梯度(rule and intelligence coupling constrained multi-agent deep deterministic policy gradient, RIC-MADDPG)算法,该算法采用规则对强化学习中无人机的动作进行约束。实验结果显示,基于RIC-MADDPG方法训练的无人机集群对抗模型能使得红方无人机集群在对抗中的胜率从53%提高至79%,表明采用“智能体训练—发现问题—编写规则—再次智能体训练—再次发现问题—再次编写规则”的方式对优化智能体对抗策略是有效的。研究结果对建立无人机集群智能攻防策略训练体系、开展规则与智能相耦合的集群战法研究具有一定参考意义。相似文献

3.

海战仿真中的智能对抗行为建模方法研究

王成飞董亚卓苏千叶张祥林《指挥控制与仿真》2022,44(1):79-85

在海上模拟训练领域,战场仿真中兵力行为的逼真性、对抗性直接影响训练效果,兵力行为建模技术是海战仿真中的核心,随着深度强化学习在军用领域研究的逐步深入,采用规则推理与强化学习相结合的思路实现海上兵力行为建模是一条较为可行的技术途径,为构建模拟训练中智能对手提供了技术支撑. 相似文献

4.

生成对抗网络及其在无人系统中的应用

熊泽昊李杰牛轶峰《无人系统技术》2023,(1):1-13

生成对抗网络(GAN)在无人系统多个层次上的应用提高了其智能化、自主化水平,具有巨大的应用价值和发展潜力。对GAN在无人系统技术中的应用进行了综合评述并且进行了展望。首先介绍了GAN的基本概念、训练方式和传统GAN的模型结构,并且从模型结构的变动、目标损失的变化以及适用的领域等方面详细介绍了深度卷积生成对抗网络(DCGAN)、循环生成对抗网络(CylcleGAN)、生成对抗模仿学习(GAIL)、序列生成对抗网络(SeqGAN)等GAN的8种衍生模型。接着概述了与无人系统OODA回路相关的智能感知、智能判断、智能决策、人机交互等方向上GAN方法的实际应用。最后基于无人系统共性技术的发展趋势,对GAN在无人系统的单体智能、多体或群体智能以及人机混合智能等方向上的应用进行了展望。相似文献

5.

运用计算机仿真技术开展心理对抗效果评估

廖东升郭勤汪小伍《军队政工理论研究》2013,14(4)

将多智能体建模仿真技术应用于心理对抗效果评估研究领域,建立心理对抗效果评估指标体系,构建心理对抗效果评估模型,能够开发心理对抗效果评估仿真系统软件.运用仿真系统软件,通过设定仿真实验参数,观察复杂战场条件下作战对象士气状态与属性,获取心理对抗效果信息,可为心理对抗教育训练提供辅助决策支持. 相似文献

6.

对抗环境下的智能兵棋系统设计及其关键技术

孙宇祥李原百周胜赵俊杰周献中《火力与指挥控制》2024,(2):33-41

智能博弈对抗领域已成为当前研究的热门领域之一。侧重在兵棋推演系统的体系构建和模块设计,分析了兵棋推演系统的建模要素,包括兵棋要素、兵棋规则及智能接口设计,构建了智能兵棋推演系统的整体架构。通过A3C强化学习智能算法对系统设计进行可行性验证。其中,改进了强化学习训练过程的奖励设置,明确智能兵棋环境的状态输入、算法驱动过程及动作输出过程,通过自主实现的智能兵棋推演系统,验证了所提的系统理论与工作。该工作为基于强化学习的智能博弈系统的设计与实现提供了可行路径,并为以后基于强化学习的智能博弈对抗研究提供了基础平台。相似文献

7.

海空跨域协同兵棋AI架构设计及关键技术分析

苏炯铭罗俊仁陈少飞项凤涛《指挥控制与仿真》2024,(2):35-43

以深度强化学习为核心的智能博弈技术在游戏领域内的突破和进展为海空兵棋AI的研究提供了借鉴。智能体架构设计是需要解决的关键问题,良好的架构能够降低算法训练的复杂度和难度,加快策略收敛。提出基于随机博弈的海空跨域协同决策博弈模型,分析了相关的均衡解概念;在分析典型智能体框架基础上,针对海空兵棋推演决策博弈过程,提出基于多智能体分层强化学习的智能体双层架构,能够有效解决智能体间协作和维度灾难问题;从兵力协同、智能体网络设计、对手建模和训练机制共4个方面分析了关键技术。期望为海空兵棋AI设计实现提供架构指导。相似文献

8.

基于深度强化学习潜艇攻防对抗训练指挥决策研究

郭洪宇初阳刘志周玉芳《指挥控制与仿真》2022,44(1):103-111

潜艇和水面舰艇编队间的攻防对抗是潜艇作战研究的重点内容,如何确保潜艇在舰艇编队、反潜直升机等兵力的联合封锁下存活和突围,是对潜艇指挥决策的考验.为此,针对潜舰机博弈对抗场景,从深度强化学习和规则推理两个方面构建潜艇智能体,提出两种近端策略优化(Proximal Policy Optimization,PPO)算法改进机... 相似文献

9.

基于深度强化学习的兵棋推演决策方法框架

崔文华李东唐宇波柳少军《国防科技》2020,41(2)

针对兵棋推演的自动对抗问题,文章提出基于深度学习网络和强化学习模型来构建对抗策略。文章结合深度强化学习技术优势,立足多源层次化的战场态势描述,提出面向智能博弈的战场态势表示方法;将作战指挥分层分域的原则同即时策略游戏中的模块化和分层架构相结合,提出一种层次化和模块化深度强化学习方法框架,用于各决策智能体与战场环境交互的机制以及对抗策略的产生;为满足实际作战响应高实时特点,提出压缩的深度强化学习,提升模型输出速度;为改善对不同环境的适应性,提出利用深度迁移学习提升模型泛化能力。相似文献

10.

基于深度强化学习的智能对手自主空战决策技术

杨凯达杨兴昊刘钊《火力与指挥控制》2023,(10):27-33

为提升空战训练对手的智能性与自主性,提升空战训练效果。针对空战战术训练智能对手自主空战决策问题,提出一种基于深度强化学习的智能体训练方法,采用最大熵强化学习（SAC）算法平衡策略探索与利用的优势,引入自博弈和多智能体联盟训练方法提升空战智能体策略的多样性和鲁棒性。针对一对一近距格斗空战场景建立智能博弈框架及奖励函数,仿真结果表明,基于零经验训练得到的智能体能够有效自主机动决策并实施近距导弹攻击,产生较好的战术效果,证明该方法在一对一近距格斗空战智能体训练中的有效性。相似文献