基于层次情节性元强化学习的对抗行为评估 |
| |
作者姓名: | 聂凯 孟庆海 |
| |
作者单位: | 中国人民解放军91550部队,辽宁 大连 116023 |
| |
摘 要: | 基于强化学习的敌方对抗行为评估能够提高仿真推演的智能化水平,强化学习算法的训练速度成为制约其实际军事应用的关键.为了加快强化学习速度,首先将敌方对抗行为评估建模为多任务强化学习,并将环境知识和经验集成到学习算法,提出基于层次情节性元强化学习(Hierarchical Episodic Meta?Deep Reinfor...
|
关 键 词: | 仿真推演 行为评估 强化学习 元学习 情节性深度强化学习 层次 |
本文献已被 万方数据 等数据库收录! |
|