基于深度强化学习的智能对手自主空战决策技术期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

基于深度强化学习的智能对手自主空战决策技术

引用本文：	杨凯达,杨兴昊,刘钊.基于深度强化学习的智能对手自主空战决策技术[J].火力与指挥控制,2023(10):27-33.

作者姓名：	杨凯达杨兴昊刘钊

作者单位：	1. 解放军95808部队;2. 中国航空研究院

摘要：	为提升空战训练对手的智能性与自主性，提升空战训练效果。针对空战战术训练智能对手自主空战决策问题，提出一种基于深度强化学习的智能体训练方法，采用最大熵强化学习（SAC）算法平衡策略探索与利用的优势，引入自博弈和多智能体联盟训练方法提升空战智能体策略的多样性和鲁棒性。针对一对一近距格斗空战场景建立智能博弈框架及奖励函数，仿真结果表明，基于零经验训练得到的智能体能够有效自主机动决策并实施近距导弹攻击，产生较好的战术效果，证明该方法在一对一近距格斗空战智能体训练中的有效性。
关键词：	自主空战决策智能对手强化学习 SAC