共查询到20条相似文献,搜索用时 109 毫秒
1.
2.
为提升复杂飞行任务下滑翔制导的自主性,提出一种基于最优制导与强化学习的多约束智能滑翔制导策略。引入三维最优制导以满足终端经纬度、高度以及速度倾角约束。提出基于侧向正弦机动的速度控制策略,研究考虑机动飞行的终端速度解析预测方法。针对速度控制中机动幅值无法离线确定的问题,研究基于强化学习的智能调参方法。该方法基于终端速度设计状态空间,以机动幅值设计动作空间,设计综合终端速度误差与滑翔制导任务的回报函数,采用Q-Learning实现机动幅值的智能调整。仿真结果表明,智能滑翔制导方法能够高精度满足终端多种约束,并能有效提升复杂任务下的自主决策能力。 相似文献
3.
在分析任务特点和卫星约束的基础上给出了多星协同任务规划问题的数学模型.引入约束惩罚算子和多星联合惩罚算子对卫星Agent原始的效用值增益函数进行改进,在此基础上提出了一种多卫星Agent强化学习算法以求解多星协同任务分配策略,设计了基于黑板结构的多星交互方式以降低学习交互过程中的通信代价.通过仿真实验及分析证明该方法能... 相似文献
4.
5.
为了对无人作战飞机自主空战战术动作进一步探索,提出了一种基于模糊逻辑推理和时间匹配原则的分层战术动作识别方案。该方案以基本动作序列来衔接基本动作识别层和组合动作识别层。通过模糊逻辑推理方法对基本动作进行识别,将识别的结果以基本动作序列的形式输出;输入组合动作识别层,将时间自动机提取后的组合动作形态与组合动作匹配库进行匹配,确定组合动作的类型。仿真结果表明,分层战术动作识别方案能够有效地识别出无人作战飞机自主空战战术动作。 相似文献
6.
7.
针对在初始的部署条件下不可定位的无线传感器网络,提出一种分布式的面向定位的网络调整方法。该方法通过节点所处的路径信息判别确定该节点的调整策略,从而使初始状况下不可定位的网络达到可定位条件,该方法仅需调整约11%节点就能够将稀疏的网络调整至可定位,比当前最好的网络调整方法减少了约40%。此外,该方法采用分布式执行策略,从而将定位所产生的通信负载和能耗均衡到网络中的多个节点,克服了先前集中式方法的可扩展性限制。大量的仿真实验结果表明,该方法较现有方法而言具有更高的执行效率。 相似文献
8.
将一种求解最优控制问题的新方法—高斯伪谱法( Gauss Pseudospectral Method-GPM)和传统的直接打靶法有效结合,对月球着陆器定点软着陆轨道快速优化问题做出了研究.推导了高精度模型下着陆动力学方程.针对优化方法各自的特点和多约束条件下最优月球软着陆轨道设计的难点,提出了问题求解的串行优化策略:将控制变量和终端时间一同作为优化变量,同时离散控制变量与状态变量,取较少的Gauss节点,利用GPM求解初值,初值的求解采用从可行解到最优解的串行优化策略;在Gauss节点上离散控制变量,利用直接打靶法求解精确最优解.仿真结果表明,本文提出的轨道优化方法具有较强的鲁棒性和快速收敛性. 相似文献
9.
针对极限学习机(Extreme Learning Machine,ELM)的性能必须依赖于大量隐层节点的问题,提出了基于改进烟花算法(Improved Fireworks Algorithm,IFWA)的ELM分类模型。用改进的烟花算法进行迭代搜索,求得N个最优的烟花;选择ELM测试数据集的RMSE作为改进烟花算法的适应度值函数,来优化ELM每个隐层节点的输入权值和偏置,使得节点的决策水平提高,从而使ELM的决策性能显著提高;采用KDD99数据集验证表明:改进烟花算法的极限学习机(IFWAELM)能够以较少的隐层节点得到更高的测试平均正确率,提高了极限学习机的泛化性能。5种同类算法性能对比实验也表明IFWAELM是效果最优的。 相似文献
10.
对一种新型的神经网络——GAL(Grow and Learn)神经网络给出一种改进训练算法,与未改进的网络在训练时间、识别时间及识别准确率等方面进行比较,证明该网络结构简单、隐层节点易调整、运算量小,且识别准确率并未降低。 相似文献
11.
研究了基于多级神经网络的类型融合方法。这种多级神经网络分为传感器子网和融合子网两部分。传感器子网是一种基于专家规则的模糊神经网络,根据专家规则确定网络结构,网络节点和传递函数都有明确的意义,避免了普通神经网络层数和隐层节点数难以确定的缺点。经过训练的传感器子网能够实现各目标类型的置信度分配,然后用融合子网对多个传感器子网输出结果进行融合,得到目标类型的最终判决。在融合子网中,加入了各传感器的可信度,使融合结果更可靠。仿真结果表明,此方法鲁棒性强,识别率高。 相似文献
12.
周晓磊 《国防科技大学学报》2014,36(3)
摘要:本文针对在初始的部署条件下不可定位的无线传感器网络,提出了一种分布式的面向定位的网络调整方法,称为LODA方法。该方法通过节点所处的路径信息判别确定该节点的调整策略,从而使得初始状况下不可定位的网络达到可定位条件。LODA方法仅需调整约11%节点就能够将稀疏的网络调整至可定位,较当前最好的网络调整方法减少了约40%。此外,本文所提出的方法采用分布式的执行策略,从而将定位所产生的通信负载和能耗均衡到网络中的多个节点,克服了先前集中式方法的可扩展性限制。大量的仿真实验结果表明,LODA方法较现有方法而言具有更高的执行效率。 相似文献
13.
本文研究了节点负载处理能力异质条件下的无标度网络交通动力学过程,提出了一种基于节点资源利用率的全局动态路由策略。该策略利用网络中节点资源利用率构建了一种全局代价函数,选择使该代价函数最小的路径来传输负载。实验结果表明该路由策略在略微增加平均路径长度的情况下成倍地提高了网络负载传输能力,与有效路由策略的比较进一步验证了该策略的有效性。 相似文献
14.
15.
针对陆军装甲分队博弈对抗决策问题,在分析深度强化学习方法在构建智能博弈对抗决策模型适用性基础上,对基于马尔科夫决策过程的陆军装甲分队博弈对抗过程模型进行了形式化描述,提出了基于元深度强化学习的博弈对抗决策模型,给出了分队战术平台下基于元深度强化学习的智能博弈对抗策略生成与优化框架.研究成果可为智能博弈对抗问题的解决提供一种思路. 相似文献
16.
智能博弈对抗领域已成为当前研究的热门领域之一。侧重在兵棋推演系统的体系构建和模块设计,分析了兵棋推演系统的建模要素,包括兵棋要素、兵棋规则及智能接口设计,构建了智能兵棋推演系统的整体架构。通过A3C强化学习智能算法对系统设计进行可行性验证。其中,改进了强化学习训练过程的奖励设置,明确智能兵棋环境的状态输入、算法驱动过程及动作输出过程,通过自主实现的智能兵棋推演系统,验证了所提的系统理论与工作。该工作为基于强化学习的智能博弈系统的设计与实现提供了可行路径,并为以后基于强化学习的智能博弈对抗研究提供了基础平台。 相似文献
17.
提出了基于网络图论模型的威胁态势分析方法;定义了图中邻接点的攻击代价;给出了计算其效用值的公式,以及计算最大威胁路径、节点的方法。针对某局域网,分析了目标节点的威胁程度及威胁路径。结果表明:不同路径对目标节点的攻击代价各不相同;存在最大和最小威胁路径。 相似文献
18.
19.
针对无人机路径规划中传统算法面对未知情况时适应程度低、在线求解效率低、计算量大等问题,基于深度强化学习DDPG算法,提出了一种无人机路径规划方法.采用策略网络和评价网络的双网络结构,拟合无人机路径规 划决策函数和状态动作函数,根据状态空间、动作空间和网络结构设计了 DDPG算法模型.通过仿真验证了所提出的路径规划方法的... 相似文献
20.
针对批量学习的网络异常检测模型存在内存资源消耗大、无法在线更新的问题,利用自组织增量神经网络(self-organizing incremental neural network, SOINN)的增量学习特性,提出一种增量自编码器构建方式,将改进SOINN的输出神经元作为自动编码器的输入,使得模型在不破坏已有学习成果的基础上,具备增量更新能力。针对SOINN算法获胜神经元邻居节点学习率固定,不利于区分其与输入样本的相似性的问题,提出一种学习率自适应调整方法,来提升获胜神经元邻居节点的学习效率,使得算法输出神经元更能代表样本特性。针对反馈更新样本中正常样本纯度不高的问题,提出一种基于距离度量的样本标签筛选机制,通过计算反馈样本与神经元的距离来对正常样本进行筛选,使得反馈样本中正常样本比例更高,以此来提升模型的在线检测效果。在NSL-KDD数据集上开展了相关实验,实验证明所提方法具备增量学习能力,且改进SOINN的增量学习效果优于原始算法,有效节省了模型的运算和存储开销,通过基于距离的样本标签筛选机制,模型的在线检测能力有效提升。 相似文献