海空跨域协同兵棋AI架构设计及关键技术分析期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

海空跨域协同兵棋AI架构设计及关键技术分析

作者姓名：	苏炯铭罗俊仁陈少飞项凤涛

作者单位：	国防科技大学智能科学学院

基金项目：	国家自然科学基金(61806212、62376280)；

摘要：	以深度强化学习为核心的智能博弈技术在游戏领域内的突破和进展为海空兵棋AI的研究提供了借鉴。智能体架构设计是需要解决的关键问题，良好的架构能够降低算法训练的复杂度和难度，加快策略收敛。提出基于随机博弈的海空跨域协同决策博弈模型，分析了相关的均衡解概念；在分析典型智能体框架基础上，针对海空兵棋推演决策博弈过程，提出基于多智能体分层强化学习的智能体双层架构，能够有效解决智能体间协作和维度灾难问题；从兵力协同、智能体网络设计、对手建模和训练机制共4个方面分析了关键技术。期望为海空兵棋AI设计实现提供架构指导。
关键词：	海空兵棋跨域协同兵棋推演多智能体智能博弈模型架构分层强化学习