基于强化学习的一对多雷达干扰资源分配策略研究 |
| |
引用本文: | 尚熙,杨革文,戴少怀,蒋伊琳.基于强化学习的一对多雷达干扰资源分配策略研究[J].空天防御,2022(1):94-101. |
| |
作者姓名: | 尚熙 杨革文 戴少怀 蒋伊琳 |
| |
作者单位: | 1. 哈尔滨工程大学信息与通信工程学院;2. 上海机电工程研究所 |
| |
摘 要: | 针对干扰机一对多情形下的干扰突防问题,提出了一种基于强化学习的一对多干扰情形下的干扰资源分配方法,引入干扰辐射能量比和突防距离比作为评价指标,并对DQN(deep Q network)和Dueling-DQN算法引入动态调整的奖励值以增强算法的收敛能力。结合一对多干扰突防场景,对两种算法进行了验证,实验结果验证了两种算法的可行性及差异性,实现了对于干扰资源在干扰功率、时长、干扰样式及干扰雷达选取的资源分配能力,满足了一对多情形下的干扰资源实时、动态的分配需求。
|
关 键 词: | 干扰资源分配 强化学习 干扰辐射能量 最大突防距离 动作分配 |
|
|