摘 要: | 针对火力分配决策维度高,并且参战各方都有不同的战略目标,各方存在着相互耦合、复杂的作用关系,战场态势瞬息万变,传统DQN算法收敛速度慢的问题,提出一种基于Dueling DQN与博弈论相结合的火力分配优化方法。首先,构建二人零和博弈状态下的火力分配模型。其次,建立了同时为对抗双方进行火力分配决策的Dueling DQN算法框架,提出ε-Nash-Boltzmann策略选取动作,以敌我双方的期望收益差作为奖励函数。实验结果表明,该算法能根据战场状态以最快速度求解得到保卫我方目标的最佳策略,具备在博弈情形下求解高维度的火力分配问题的优势。
|