排序方式: 共有3条查询结果,搜索用时 0 毫秒
1
1.
近年来,基于深度强化学习的机器学习技术突破性进展为智能博弈对抗提供了新的技术发展方向。针对智能对抗中异构多智能体强化学习算法训练收敛速度慢,训练效果差异大等问题,提出了一种先验知识驱动的多智能体强化学习博弈对抗算法PK-MADDPG,构建了双重Critic框架下的MADDPG模型。该模型使用了经验优先回放技术来优化先验知识提取,在博弈对抗训练中取得显著的效果。论文成果应用于MaCA异构多智能体博弈对抗全国竞赛,将PK-MADDPG算法与经典规则算法的博弈对抗结果进行比较,验证了所提算法的有效性。 相似文献
2.
3.
注重完善机制是建设学习型党委的重要保证.从激发动力入手,健全理念内化机制,在深化认识中提升学习起点;以增强实效出发,健全成果转化机制,在解决问题中增强实践能力;以促进常态着眼,健全考评约束机制,在规范运行中提高建设质量. 相似文献
1