首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
针对陆军装甲分队博弈对抗决策问题,在分析深度强化学习方法在构建智能博弈对抗决策模型适用性基础上,对基于马尔科夫决策过程的陆军装甲分队博弈对抗过程模型进行了形式化描述,提出了基于元深度强化学习的博弈对抗决策模型,给出了分队战术平台下基于元深度强化学习的智能博弈对抗策略生成与优化框架.研究成果可为智能博弈对抗问题的解决提供一种思路.  相似文献   

2.
针对多智能体深度强化学习在解决联合海空作战战术博弈决策模型难以训练优化问题,结合多智能体深度强化学习在智能化指挥决策问题中的应用性优势,以及课程学习在复杂问题研究中的改进优势,构建基于马尔可夫决策过程的联合海空战术决策过程模型,提出基于复杂度指数函数的任务复杂性度量方法,建立基于值分解网络算法的求解模型。针对一个典型联合海空作战战术决策场景,构建从易到难的课程学习任务和模型求解框架,设计针对任务的决策模型训练方法,在兵棋推演仿真系统上,对模型训练方法的可行性进行了验证。  相似文献   

3.
基于规则推理的海战仿真实体决策方法   总被引:3,自引:0,他引:3  
研究在海军战术仿真中应用基于规则推理的方法实现作战实体的自主决策行为,该方法用决策规则描述作战实体决策时所依据的军事决策知识,通过对决策规则的推理实现决策作战实体的决策推理过程.分别介绍了作战实体的决策模型、决策规则的知识表示方法以及决策模型的决策推理方法.基于规则推理的海战仿真实体决策方法推理机制接近人类的思维方式,结构逻辑容易为军事人员所掌握,易于理解和维护,便于实现.  相似文献   

4.
在基于复杂自适应系统的多Agent的作战仿真实验过程中,由于行为、规则、属性构成了复杂的局势,目前还未能构建一种有效的决策支持模型.应用灰色局势决策的方法建立了战术Agent决策模型,对于解决战术试验当中的战术Agent决策问题,具有一定的意义.在分析灰色局势决策的相关概念及步骤的基础上,结合作战实例,说明了该模型的合理可行性.  相似文献   

5.
如何对复杂装备体系进行有效的认知决策,一直以来都是联合作战研究领域中的热点与难点,采用一种具有较强适应性的决策算法,对于应对战场突发状况具有重要意义.通过结合近端策略优化和分层强化学习,提出了一种基于分层强化学习的联合作战仿真作战决策算法,以空地一体化联合作战为背景进行作战想定,结合自主设计的作战原型系统,分析了武器装备体系作战决策流程,对分层强化学习的层次结构、奖励函数的设计、决策网络结构和训练方法进行了详细说明.通过自主开发的仿真平台对算法的有效性进行验证,为联合作战中指挥决策的适应性机制问题提供较为有效的解决方法和辅助参考价值.  相似文献   

6.
为解决战场上作战实体的自主感知与决策问题,构建了一种基于深度强化学习的智能感知与决策框架,主要包括态势数据预处理、态势感知、行动优化和知识库4个模块,并通过单智能体无人机突防实验验证其应用效果,为解决作战实体的自主感知与决策问题提供了一种可行的技术途径。  相似文献   

7.
作战辅助决策模型是在复杂战场态势下,辅助指挥人员科学、高效决策的重要工具.针对当前辅助决策模型功能分散、可信性不足、缺乏工程化设计与管理等问题,从系统工程角度出发,开展作战辅助决策模型构建与评估通用方法的研究,提出辅助决策模型工程化设计与评估分级的一般流程与方法,并结合实例进行说明.  相似文献   

8.
以智能无人战车在未来作战中的应用为背景,从目前研究情况出发,分析了当前无人战车的作战应用范围、前景和未来无人作战的趋势;并根据执行作战任务的不同,着重论述了未来无人战车在防空作战中的应用所具备的能力,以及未来无人防空战车将演变为以通用无人平台为载体,上装防空武器接口模块化设计,集成为不同作战区域的防空武器平台,构建成远程、中程、近程和末端防空拦截段的无人战车作战网;后续不断加快对智能无人战车的研究将是打赢未来无人信息化战争的关键。  相似文献   

9.
随着武器装备智能化发展的速度加快,传统武器装备的训练方法已经无法满足大规模现代战争的训练需求。在近十年中深度强化学习等人工智能方法在棋类以及电子竞技游戏中取得了极大突破,证明了人工智能方法在面对大搜索空间博弈问题的优势,能够有效解决军事对抗问题中的形势预判和临机调整问题。基于此背景,依托海军舰艇对空方面作战,开展了深度强化学习的方法研究。首先通过并行场景建模技术以及空中威胁决策行为建模技术实现深度学习模型的构建,之后通过单机突防场景的对抗迭代学习,得到收敛的突防策略。验证了深度强化学习方法在空中威胁行为构建场景的可行性,为后续深入开展编队联合防空训练场景构建提供支撑。  相似文献   

10.
针对兵棋推演的自动对抗问题,文章提出基于深度学习网络和强化学习模型来构建对抗策略。文章结合深度强化学习技术优势,立足多源层次化的战场态势描述,提出面向智能博弈的战场态势表示方法;将作战指挥分层分域的原则同即时策略游戏中的模块化和分层架构相结合,提出一种层次化和模块化深度强化学习方法框架,用于各决策智能体与战场环境交互的机制以及对抗策略的产生;为满足实际作战响应高实时特点,提出压缩的深度强化学习,提升模型输出速度;为改善对不同环境的适应性,提出利用深度迁移学习提升模型泛化能力。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号