首页 | 本学科首页   官方微博 | 高级检索  
   检索      

基于逆向强化学习的舰载机甲板调度优化方案生成方法
引用本文:李耀宇,朱一凡,杨峰,贾全.基于逆向强化学习的舰载机甲板调度优化方案生成方法[J].国防科技大学学报,2013,35(4):171-175.
作者姓名:李耀宇  朱一凡  杨峰  贾全
作者单位:国防科技大学 信息系统与管理学院,国防科技大学 信息系统与管理学院,国防科技大学 信息系统与管理学院,国防科技大学 信息系统与管理学院
基金项目:国家自然科学基金项目(面上项目,重点项目,重大项目)
摘    要:针对计算机辅助指挥调度舰载机甲板作业的决策过程无法脱离人参与这一特点,引入基于逆向学习的强化学习方法,将指挥员或专家的演示作为学习对象,通过分析舰载机的甲板活动,建立舰载机甲板调度的马尔可夫决策模型(MDP)框架;经线性近似,采用逆向学习方法计算得到回报函数,从而能够通过强化学习方法得到智能优化策略,生成舰载机甲板调度方案。经仿真实验验证,本文所提方法能够较好地学习专家演示,结果符合调度方案优化需求,为形成辅助决策提供了基础。

关 键 词:逆向强化学习  强化学习  舰载机甲板调度  优化方案生成
收稿时间:2012/10/25 0:00:00

Inverse reinforcement learning based optimal schedule generation approach for carrier aircraft on flight deck
LI Yaoyu,ZHU Yifan,YANG Feng and JIA Quan.Inverse reinforcement learning based optimal schedule generation approach for carrier aircraft on flight deck[J].Journal of National University of Defense Technology,2013,35(4):171-175.
Authors:LI Yaoyu  ZHU Yifan  YANG Feng and JIA Quan
Institution:College of Information and System and Management, National University of Defense Technology, Changsha 410073, China;College of Information and System and Management, National University of Defense Technology, Changsha 410073, China;College of Information and System and Management, National University of Defense Technology, Changsha 410073, China;College of Information and System and Management, National University of Defense Technology, Changsha 410073, China
Abstract:
Keywords:inverse reinforcement learning  reinforcement learning  aircraft scheduling on flight deck  optimal schedule generation
本文献已被 CNKI 等数据库收录!
点击此处可从《国防科技大学学报》浏览原始摘要信息
点击此处可从《国防科技大学学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号