海空跨域协同兵棋AI架构设计及关键技术分析 |
| |
引用本文: | 苏炯铭,罗俊仁,陈少飞,项凤涛.海空跨域协同兵棋AI架构设计及关键技术分析[J].指挥控制与仿真,2024(2):35-43. |
| |
作者姓名: | 苏炯铭 罗俊仁 陈少飞 项凤涛 |
| |
作者单位: | 国防科技大学智能科学学院 |
| |
基金项目: | 国家自然科学基金(61806212、62376280); |
| |
摘 要: | 以深度强化学习为核心的智能博弈技术在游戏领域内的突破和进展为海空兵棋AI的研究提供了借鉴。智能体架构设计是需要解决的关键问题,良好的架构能够降低算法训练的复杂度和难度,加快策略收敛。提出基于随机博弈的海空跨域协同决策博弈模型,分析了相关的均衡解概念;在分析典型智能体框架基础上,针对海空兵棋推演决策博弈过程,提出基于多智能体分层强化学习的智能体双层架构,能够有效解决智能体间协作和维度灾难问题;从兵力协同、智能体网络设计、对手建模和训练机制共4个方面分析了关键技术。期望为海空兵棋AI设计实现提供架构指导。
|
关 键 词: | 海空兵棋 跨域协同 兵棋推演 多智能体 智能博弈 模型架构 分层强化学习 |
|
|