首页 | 本学科首页   官方微博 | 高级检索  
   检索      

基于逆强化学习的空战态势评估函数优化方法
引用本文:李银通,韩统,孙楚,魏政磊.基于逆强化学习的空战态势评估函数优化方法[J].火力与指挥控制,2019,44(8).
作者姓名:李银通  韩统  孙楚  魏政磊
作者单位:空军工程大学航空工程学院,西安,710038;解放军94019部队,新疆 和田,848099
基金项目:航空科学基金;陕西省自然科学基金
摘    要:为提高无人作战飞机(UCAV)自主决策效能,提出基于逆强化学习的空战态势评估函数优化方法。以现有的正例与反例两类空战数据为样本训练一个RBF网络,采用逆强化学习得到不同态势下的态势值,实现了对现有空战数据的知识提取;利用Sigmoid函数的压缩作用,降低了整体态势值,加快了UCAV学习的收敛速度;采用自适应粒子群算法求解优化了态势评估函数中的权重参数,提升了对复杂空战态势的适应能力;仿真结果表明该方法能够优化态势评估函数,提高机动决策的收敛速度,在UCAV自主决策中具有一定现实意义。

关 键 词:态势评估  自主决策  逆强化学习  自适应粒子群算法
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号