柔性作业车间调度问题的课程强化学习算法 |
| |
作者姓名: | 卢超 肖洋 张彪 高亮 |
| |
作者单位: | 中国地质大学(武汉) 计算机学院, 湖北 武汉 430078;聊城大学 计算机学院, 山东 聊城 252000;华中科技大学 智能制造装备与技术全国重点实验室, 湖北 武汉 430074 |
| |
基金项目: | 国家自然科学基金资助项目(52175490,51805495,52175490);湖北省重点研发计划资助项目(2022BAD121) |
| |
摘 要: |  针对深度强化学习在柔性作业车间调度问题上泛化能力不足的问题,提出结合课程学习和深度强化学习的方法。通过动态调整训练实例难度,重点增强最难实例的训练,以适应不同数据分布,避免学习过程中的遗忘问题。仿真测试结果表明,算法在未经训练的大规模问题和基准数据集上保持了不错的性能。 在2种人造分布的4个未训练大规模问题上取得了更好的性能表现。相较于精确方法和元启发式方法,对于计算量较大的问题实例,能快速地获得质量不错的解。同时算法可以适应不同的数据分布的柔性作业车间调度问题,具有较快收敛速度和较好泛化能力。

|
关 键 词: | 柔性作业车间调度 深度强化学习 课程学习 |
收稿时间: | 2024-01-04 |
|
| 点击此处可从《国防科技大学学报》浏览原始摘要信息 |
|
点击此处可从《国防科技大学学报》下载免费的PDF全文 |
|