首页 | 本学科首页   官方微博 | 高级检索  
   检索      

基于改进DDPG的空战行为决策方法
引用本文:殷宇维,王凡,吴奎,胡剑秋.基于改进DDPG的空战行为决策方法[J].指挥控制与仿真,2022,44(1):97-102.
作者姓名:殷宇维  王凡  吴奎  胡剑秋
作者单位:江苏自动化研究所,江苏 连云港 222061
摘    要:针对空战中飞机如何根据实时态势进行快速智能决策问题,提出基于改进DDPG算法的空战行为决策框架(Air Combat Behavior Decision-making Framework on Improve DDPG,ACBDF_DDPG).框架中的主要改进如下:1.设计一种针对动态目标的嵌入式人工经验奖励机制,缓解...

关 键 词:深度强化学习  深度确定性策略梯度  空战行为决策  动态目标  嵌入式人工经验奖励机制

Research on Air Combat Behavior Decision-making Method Based on Improved DDPG
YIN Yu-wei,WANG Fan,WU Kui,HU Jian-qiu.Research on Air Combat Behavior Decision-making Method Based on Improved DDPG[J].Command Control & Simulation,2022,44(1):97-102.
Authors:YIN Yu-wei  WANG Fan  WU Kui  HU Jian-qiu
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号