基于课程强化学习的联合海空博弈决策模型训练方法 |
| |
引用本文: | 林泽阳,赖俊,陈希亮,王军.基于课程强化学习的联合海空博弈决策模型训练方法[J].火力与指挥控制,2023(3):25-34+42. |
| |
作者姓名: | 林泽阳 赖俊 陈希亮 王军 |
| |
作者单位: | 陆军工程大学指挥控制工程学院 |
| |
基金项目: | 国家自然科学基金资助项目(61806221); |
| |
摘 要: | 针对多智能体深度强化学习在解决联合海空作战战术博弈决策模型难以训练优化问题,结合多智能体深度强化学习在智能化指挥决策问题中的应用性优势,以及课程学习在复杂问题研究中的改进优势,构建基于马尔可夫决策过程的联合海空战术决策过程模型,提出基于复杂度指数函数的任务复杂性度量方法,建立基于值分解网络算法的求解模型。针对一个典型联合海空作战战术决策场景,构建从易到难的课程学习任务和模型求解框架,设计针对任务的决策模型训练方法,在兵棋推演仿真系统上,对模型训练方法的可行性进行了验证。
|
关 键 词: | 课程学习 作战环境 联合海空作战 智能博弈 深度强化学习 |
|
|