排序方式: 共有5条查询结果,搜索用时 0 毫秒
1
1.
2.
针对策略未知逃逸无人机环境中多无人机协同追捕对抗任务,提出P3C-MADDPG算法的多无人机协同追捕对抗策略。首先,为解决多智能体深度确定性策略梯度(Multi-Agent Deep Deterministic Policy Gradient, MADDPG)算法训练速度慢和Q值高估问题,在MADDPG算法中分别采用基于树形结构储存的优先经验回放机制(Prioritized Experience Replay, PER)和设计的3线程并行Critic网络模型,提出P3C-MADDPG算法。然后基于构建的无人机运动学模型,设计追逃无人机的状态空间、稀疏奖励与引导式奖励相结合的奖励函数、加速度不同的追逃动作空间等训练要素。最后基于上述训练要素,通过P3C-MADDPG算法生成策略未知逃逸无人机环境中多无人机协同追捕对抗策略。仿真实验表明,P3C-MADDPG算法在训练速度上平均提升了11.7%,Q值平均降低6.06%,生成的多无人机协同追捕对抗策略能有效避开障碍物,能实现对策略未知逃逸无人机的智能追捕。 相似文献
3.
信息接入网络问题是后勤装备信息化的突出问题之一,对装备进行嵌入式改造是实现军队后勤装备信息化的重要途径.提出了用"信息贴片"的方式改造后勤装备的方法,并给出了一种"信息贴片"的软硬件设计对该方法进行验证."信息贴片"以"挂"、"贴"、"粘"等方式吸附于后勤装备上,将非数字化后勤装备模拟成数字化装备,提高后勤装备源头信息采集自动化水平.试验结果表明了用"信息贴片"改造后勤装备的可行性和有效性. 相似文献
4.
为解决自适应最小均方误差(least mean squares,LMS)滤波算法难以平衡稳态误差和收敛速度的问题,提出了基于对称非线性函数的变步长LMS自适应滤波算法。通过自变量取绝对值、叠加非线性拉伸量改进Sigmoid函数,构造一个对称非线性函数用于刻画步长因子与稳态误差的非线性关系。该对称非线性函数具有能够根据误差动态调整步长、更快达到收敛状态的特点。根据构造的对称非线性函数和输入信号功率生成归一化变步长因子,解决噪声逐级放大的问题,进一步提高算法的滤波效果同时,加速收敛。实验表明:该算法在低信噪比、信噪比变化、信号频率变化、滤波器阶数变化、延迟采样点数变化条件下均具有更好的滤波效果、更优的稳定性和更快的收敛速度。 相似文献
5.
传感器网络中基于LQI均值的功率控制方法 总被引:1,自引:0,他引:1
邻近图的功率控制方法是传感器网络拓扑控制中的一个重要研究方向。对比分析了PRR,RSSI和LQI等几种链路质量衡量指标的优劣,将LQI均值作为邻近图中邻节点的距离度量,构造链路质量邻近图LQPG,并对所构造的链路质量邻近图进行了仿真实验。结果表明,LQPG有着较低的平均节点度,在链路变化情况下,网络有着较低的平均功率,从而有效地延长了网络的生存期。 相似文献
1