基于深度强化学习的智能对手自主空战决策技术 |
| |
作者姓名: | 杨凯达 杨兴昊 刘钊 |
| |
作者单位: | 1. 解放军95808部队;2. 中国航空研究院 |
| |
摘 要: | 为提升空战训练对手的智能性与自主性,提升空战训练效果。针对空战战术训练智能对手自主空战决策问题,提出一种基于深度强化学习的智能体训练方法,采用最大熵强化学习(SAC)算法平衡策略探索与利用的优势,引入自博弈和多智能体联盟训练方法提升空战智能体策略的多样性和鲁棒性。针对一对一近距格斗空战场景建立智能博弈框架及奖励函数,仿真结果表明,基于零经验训练得到的智能体能够有效自主机动决策并实施近距导弹攻击,产生较好的战术效果,证明该方法在一对一近距格斗空战智能体训练中的有效性。
|
关 键 词: | 自主空战决策 智能对手 强化学习 SAC |
|
|