排序方式: 共有4条查询结果,搜索用时 0 毫秒
1
1.
针对弹道导弹中段突防后飞行弹道与标准弹道产生较大偏离的弹道机动调整问题,建立了机动调整时机策略最优化模型。设计了机动调整逆序Q学习算法,采用Tile coding逼近器编码状态特征空间,并对其进行线性逼近。构建了Q学习算法与蒙特卡罗方法相结合的逆序更新策略机制,以对导弹机动调整最优时机进行训练。仿真测试分析结果表明,在给定场景参数下,通过10 000代强化学习算法训练得到的策略能够可靠地使用最少机动次数控制导弹突防后飞行弹道的调整决策,验证了方法的有效性。 相似文献
2.
3.
4.
预警反击作战是我军未来的重要作战样式之一,是增强战略威慑力和提高积极防御能力的有效军事战略活动。针对预警反击装备体系能力贡献率评估问题,构建了置信规则库(Believe Rule Base,BRB)参数优化模型,提出了基于差分进化算法(Differential Evolution Algorithm,DEA)的置信规则库参数优化方法,通过优化参数后的置信规则库分析,提出了能力对体系贡献率评估过程和步骤。以国外已有预警反击装备体系为基础,开展贡献率评估示例分析验证所提出方法的有效性。该方法基于作战需求和实际应用,可为能力的优先发展提供决策支撑,研究成果具有理论意义和应用价值。 相似文献
1