基于强化学习的通信受限环境多无人机协同策略期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

基于强化学习的通信受限环境多无人机协同策略

作者姓名：	程进胡寒栋江业帆张一博丁季时雨

作者单位：	1.航天科工集团智能科技研究院有限公司100144;2.航天防务智能系统与技术科研重点实验室100144;3.中国航天科工集团第二研究院100854;

基金项目：	基础科研项目(JCKY2020603B010)；国家自然科学基金(62103386,52202452)。

摘要：	随着人工智能技术的发展,空域无人作战正由“单平台遥控”向“多平台协同”转变。多无人机协同作战任务具有非完全信息、通信受限、高实时、强动态等特点,给协同决策生成带来巨大挑战。针对通信受限环境中的多无人机协同决策问题,提出一种基于动态层级网络通信架构的通信强化学习协同策略,该策略能够显著减少无人机集群间的通信次数,同时准确传递其决策需要的信息,从而得到较优协同策略。针对多无人机协同围捕的典型任务场景,基于OpenAI平台对所提出的算法进行了仿真验证。结果表明,与传统强化学习算法相比,提出的通信强化学习策略可以显著减少无人机间的通信次数,同时在一定程度上避免潜在的信息欺骗问题。完成任务需要的平均通信次数相比于传统两两通信结构减少约77%,为实现通信受限环境中的多无人机协同任务提供技术支撑。
关键词：	强化学习通信受限无人系统集群多智能体协同人工智能
本文献已被维普等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏