基于深度强化学习的兵棋推演决策方法框架 |
| |
引用本文: | 崔文华,李东,唐宇波,柳少军. 基于深度强化学习的兵棋推演决策方法框架[J]. 国防科技, 2020, 41(2) |
| |
作者姓名: | 崔文华 李东 唐宇波 柳少军 |
| |
摘 要: | 针对兵棋推演的自动对抗问题,文章提出基于深度学习网络和强化学习模型来构建对抗策略。文章结合深度强化学习技术优势,立足多源层次化的战场态势描述,提出面向智能博弈的战场态势表示方法;将作战指挥分层分域的原则同即时策略游戏中的模块化和分层架构相结合,提出一种层次化和模块化深度强化学习方法框架,用于各决策智能体与战场环境交互的机制以及对抗策略的产生;为满足实际作战响应高实时特点,提出压缩的深度强化学习,提升模型输出速度;为改善对不同环境的适应性,提出利用深度迁移学习提升模型泛化能力。
|
关 键 词: | 兵棋推演;深度强化学习;态势表示;压缩学习方法;深度迁移学习 |
Framework of wargaming decision-making methods based on deep reinforcement learning |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 CNKI 等数据库收录! |
| 点击此处可从《国防科技》浏览原始摘要信息 |
|
点击此处可从《国防科技》下载全文 |
|