排序方式: 共有84条查询结果,搜索用时 31 毫秒
61.
基于强化学习的无人机自主机动决策方法 总被引:1,自引:0,他引:1
提出了一种基于连续动作集强化学习的无人机机动决策方法。通过Actor-Critic强化学习构架下的NRBF神经网络输出状态真实效用值与连续动作控制变量,效用值与动作控制变量的输出层共用隐层以简化网络结构。结合相对熵理论设计隐层节点的自适应调整方法,有效减少了隐层节点数目。对输出动作控制变量,采用基于高斯分布的连续动作选择策略,并依据训练次数调整随机动作控制变量的概率分布,提升了网络对未知策略的探索能力。在3种不同空战态势下的仿真验证了该方法的有效性,结果表明该方法生成的策略鲁棒性较强,动作控制量更加精确。 相似文献
62.
63.
64.
赵辉 《军械工程学院学报》2011,(4):56-60
针对一类存在短时延的非线性网络控制系统,提出了一种基于观测器的传感器失效完整性控制方法。首先利用模糊T-S模型对系统进行模糊建模,在此基础上,提出模糊控制器与模糊观测器的协同设计方法,然后应用李亚普诺夫函数法和线性矩阵不等式(LMI)法,给出了闭环模糊系统在传感器故障时具有完整性的充分条件。数值仿真算例表明,该方法是可行和有效的。 相似文献
65.
66.
近年来,辽宁省军区锦州第二干休所党委在贯彻落实科学发展观的过程中.坚持“以老干部为本”,精益求精地解决老干部最直接、最关心和最现实的利益问题.在细致上想招法、在深入上挖心思、在扎实上加力度,服务质量明显提高,老干部称赞干休所党委班子“五好”:团结最好、创收最好、服务最好、营院面貌最好、精神状态最好。干休所连续三年被省军区评为“先进干休所”。 相似文献
67.
68.
69.
70.