二人零和博弈情形下基于Dueling DQN的火力分配方法期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

二人零和博弈情形下基于Dueling DQN的火力分配方法

作者姓名：	邱少明黄昕晨刘良玉俄必聪

作者单位：	大连大学通信与网络重点实验室

基金项目：	中央军委装备发展部领域基金项目 6140002010101,6140001030111

摘要：	针对火力分配决策维度高,并且参战各方都有不同的战略目标,各方存在着相互耦合、复杂的作用关系,战场态势瞬息万变,传统DQN算法收敛速度慢的问题,提出一种基于Dueling DQN与博弈论相结合的火力分配优化方法。首先,构建二人零和博弈状态下的火力分配模型。其次,建立了同时为对抗双方进行火力分配决策的Dueling DQN算法框架,提出ε-Nash-Boltzmann策略选取动作,以敌我双方的期望收益差作为奖励函数。实验结果表明,该算法能根据战场状态以最快速度求解得到保卫我方目标的最佳策略,具备在博弈情形下求解高维度的火力分配问题的优势。
关键词：	火力分配二人零和博弈 Dueling DQN 纳什均衡