共查询到20条相似文献,搜索用时 312 毫秒
1.
针对智能小车行走过程中的全局路径规划和路障规避问题,提出了一种基于神经网络Q-learning强化学习算法,采用RBF(Radial Basis Function)网络对Q学习算法的动作值函数进行逼近,基于MATLAB环境开发了智能小车全局路径规划和路障规避仿真系统。与传统的以及基于势场的Q学习算法相比,所采用的算法能更加有效地完成智能小车在行驶环境中的路径规划和路障规避。仿真结果表明:算法具有更好的收敛速度,可增强智能小车的自导航能力。 相似文献
2.
针对无人机的自主空战机动决策问题,设计了基于路径-博弈混合策略的决策算法。首先根据无人机飞行控制过程中,水平机动和垂直机动可以解耦的原理,提出了相解耦的自主决策机制,使用路径规划实现水平机动决策,使用博弈理论实现垂直机动决策。为提升决策环境的灵活性,设计了能够自适应调整规划范围和分辨率的动态栅格环境。基于QL算法设计路径规划模型,并使用双Q表学习机制改进算法,有效提升了路径规划质量。基于纳什均衡理论构建垂直机动算法模型,根据不同的态势环境设计了代价计算函数,实现了无人机的垂直机动决策。最后,针对一对一空战对抗情景开展仿真验证,验证了算法的有效性,相对于传统基于三维规划空间下的机动决策,可有效缩短规划耗时,提升规划品质。 相似文献
3.
4.
5.
随着无人机技术的应用和发展,无人机执行任务的飞行环境愈发复杂多变,对无人机机动避障能力和航迹规划的实时性提出了更高的要求。基于泛化性较好、对环境依赖弱的深度强化学习算法,以雷达实时获取的障碍物地图信息为基础进行实时路径规划,针对二维航迹规划问题特点设计了连续奖励函数,解决了强化学习算法在二维平面航迹规划中奖励稀疏的问题;基于迁移学习的思想设计多个训练环境,并按任务的难易程度进行分步训练,降低了算法的训练难度,提高了训练效果,并使算法的收敛效果更加稳定。在实验中将SAC算法与目前主流的PPO和TD3算法进行对比,实验结果表明:SAC算法收敛速度快,实时性好,航迹平滑度更好。 相似文献
6.
针对局部可观测多智能体学习环境下,智能体与环境频繁交互造成环境不稳定,导致智能体无法使用经验回放机制(experience replay)的问题,采用了一种基于异环境重要性采样的回放经验利用机制。并结合该机制再深度强化学习算法,深度分布式循环Q网络(DDRQN)基础上进行了改进,提出一种增强型的深度分布式循环Q网络。通过对Deep Mind的Py SC2平台Defeat Roaches局部可观测多智能体学习环境实验结果对比分析表明,增强型的深度分布式循环Q网络相比于DDRQN网络,具有良好的学习性能,稳定性、收敛速度均具有显著提升。 相似文献
7.
针对不同类型威胁体存在的战场环境中无人车辆战术机动路径规划问题,提出了一种基于威胁代价地图的粒子群优化(Particle Swarm Optimization,PSO)方法。借助极坐标系中关键点的极角进行路径描述,并使用分段3次Hermite插值方法形成光滑路径,将路径规划问题转化为关键点极角的参数优化问题。针对基本PSO(BPSO)算法存在的早熟收敛和后期迭代效率低的缺陷,借鉴以群集方式生活的物种按照不同任务对种群进行分工的机制,提出了一种基于多任务子群协同的改进粒子群优化(Particle Swarm Optimization based on the Multi—tasking Subpopu—lation Cooperation,PSO-MSC)算法。借助该算法的快速收敛和全局寻优特性实现了最优路径规划。实验结果表明:该算法可以快速有效地实现战场环境下无人车辆的战术机动路径规划,且规划路径安全、平滑。 相似文献
8.
针对全局静态环境下传统蚁群算路径规划时,易陷入局部最优、前期路径有效性差等问题,提出了基于改进人工势场局部搜索和改进蚁群算法全局搜索的机器人路径规划算法.在地图环境栅格化基础上,算法首先利用有效障碍物检测和临时中间目标点改进人工势场算法,以优化其死锁和欠优问题,通过改进人工势场优化蚁群算法的初始路径搜索,避免其早期的交叉等问题,同时构建与收敛相关的负反馈通道,调节全局与局部信息素的自适应更新,以平衡算法的收敛速度与全局搜索能力.简单环境与复杂环境的仿真实验结果表明,所提算法具有较好的全局搜索能力,收敛速度和搜索能力优于已有改进蚁群算法,验证了算法的有效性. 相似文献
9.
10.
11.
《火力与指挥控制》2015,(9)
现代战争中装备保障路径规划中路径网络节点多和要优化的制约因素等问题成为装备保障仿真的难点,传统的蚁群算法寻找最优解,往往找不到满意的解。为了提高寻优效率,尽量减少装备保障中待保障装备战斗力恢复等待总时间,对基本蚁群算法进行改进。首先建立装备保障路径规划模型,然后基于基本蚁群算法,重新设计了启发信息的计算方法和信息素的更新函数,对路径节点的选择方法进行改进,最后通过一个具体的装备保障路径规划问题对传统的和改进的算法进行算例分析。计算结果表明,所采用的改进的蚁群算法可以更好地解决装备保障路径规划问题,有效减少待保障装备恢复战斗力之前等待的时间和保障分队经过的总路程。 相似文献
12.
13.
14.
15.
16.
17.
18.
首先对BP网络的结构和算法进行了分析,针对BP网络收敛速度慢,容易陷入局部极小等问题,提出了一种改进的BP网络模型,并对该模型算法进行了改进,通过激活函数的选择,网络的初始化,学习率的调整和训练样本数据的处理等方法,可实现加快网络的收敛速度,并且较好的解决局部最优问题. 相似文献
19.
针对不返回起始点、多个待救援点的应急救援路径规划问题,提出了一种应急救援路径规划的改进蚁群算法,设计了一种新的路径构造方法,为蚁群算法求解该类问题打下了基础。为提高收敛性,改进了信息素更新规则,构造了一种与蚁群算法有效结合的局部搜索算法,提高了算法快速寻优的能力。仿真结果表明:改进蚁群算法能够快速找到一条从救援中心到多个待救援点的优化路径,且收敛速度和最短路径较同类算法更优。 相似文献