基于逆向强化学习的舰载机甲板调度优化方案生成方法 Inverse reinforcement learning based optimal schedule generation approach for carrier aircraft on flight deck期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

基于逆向强化学习的舰载机甲板调度优化方案生成方法

引用本文：	李耀宇,朱一凡,杨峰,贾全.基于逆向强化学习的舰载机甲板调度优化方案生成方法[J].国防科技大学学报,2013,35(4):171-175.

作者姓名：	李耀宇朱一凡杨峰贾全

作者单位：	国防科技大学信息系统与管理学院,国防科技大学信息系统与管理学院,国防科技大学信息系统与管理学院,国防科技大学信息系统与管理学院

基金项目：	国家自然科学基金项目（面上项目，重点项目，重大项目）

摘要：	针对计算机辅助指挥调度舰载机甲板作业的决策过程无法脱离人参与这一特点,引入基于逆向学习的强化学习方法,将指挥员或专家的演示作为学习对象,通过分析舰载机的甲板活动,建立舰载机甲板调度的马尔可夫决策模型(MDP)框架;经线性近似,采用逆向学习方法计算得到回报函数,从而能够通过强化学习方法得到智能优化策略,生成舰载机甲板调度方案。经仿真实验验证,本文所提方法能够较好地学习专家演示,结果符合调度方案优化需求,为形成辅助决策提供了基础。
关键词：	逆向强化学习强化学习舰载机甲板调度优化方案生成
收稿时间：	2012/10/25 0:00:00
Inverse reinforcement learning based optimal schedule generation approach for carrier aircraft on flight deck

LI Yaoyu,ZHU Yifan,YANG Feng and JIA Quan.Inverse reinforcement learning based optimal schedule generation approach for carrier aircraft on flight deck[J].Journal of National University of Defense Technology,2013,35(4):171-175.

Authors:	LI Yaoyu ZHU Yifan YANG Feng and JIA Quan

Institution:	College of Information and System and Management, National University of Defense Technology, Changsha 410073, China;College of Information and System and Management, National University of Defense Technology, Changsha 410073, China;College of Information and System and Management, National University of Defense Technology, Changsha 410073, China;College of Information and System and Management, National University of Defense Technology, Changsha 410073, China

Abstract:

Keywords:	inverse reinforcement learning reinforcement learning aircraft scheduling on flight deck optimal schedule generation
本文献已被 CNKI 等数据库收录！
	点击此处可从《国防科技大学学报》浏览原始摘要信息
	点击此处可从《国防科技大学学报》下载免费的PDF全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏