对抗环境下的智能兵棋系统设计及其关键技术 |
| |
作者姓名: | 孙宇祥 李原百 周胜 赵俊杰 周献中 |
| |
作者单位: | 1. 南京大学控制科学与智能工程系;2. 南京大学智能装备新技术研究中心 |
| |
基金项目: | 国家自然科学青年基金(62306135); |
| |
摘 要: | 智能博弈对抗领域已成为当前研究的热门领域之一。侧重在兵棋推演系统的体系构建和模块设计,分析了兵棋推演系统的建模要素,包括兵棋要素、兵棋规则及智能接口设计,构建了智能兵棋推演系统的整体架构。通过A3C强化学习智能算法对系统设计进行可行性验证。其中,改进了强化学习训练过程的奖励设置,明确智能兵棋环境的状态输入、算法驱动过程及动作输出过程,通过自主实现的智能兵棋推演系统,验证了所提的系统理论与工作。该工作为基于强化学习的智能博弈系统的设计与实现提供了可行路径,并为以后基于强化学习的智能博弈对抗研究提供了基础平台。
|
关 键 词: | 智能博弈 智能兵棋 强化学习 系统设计 |
|
|