全文获取类型
收费全文 | 207篇 |
免费 | 18篇 |
国内免费 | 18篇 |
出版年
2024年 | 13篇 |
2023年 | 19篇 |
2022年 | 11篇 |
2021年 | 12篇 |
2020年 | 15篇 |
2019年 | 4篇 |
2017年 | 2篇 |
2016年 | 4篇 |
2015年 | 5篇 |
2014年 | 10篇 |
2013年 | 15篇 |
2012年 | 22篇 |
2011年 | 20篇 |
2010年 | 7篇 |
2009年 | 16篇 |
2008年 | 12篇 |
2007年 | 8篇 |
2006年 | 9篇 |
2005年 | 8篇 |
2004年 | 6篇 |
2003年 | 4篇 |
2002年 | 5篇 |
2001年 | 3篇 |
2000年 | 3篇 |
1999年 | 1篇 |
1998年 | 2篇 |
1997年 | 3篇 |
1996年 | 1篇 |
1994年 | 1篇 |
1991年 | 1篇 |
1990年 | 1篇 |
排序方式: 共有243条查询结果,搜索用时 15 毫秒
41.
42.
43.
针对弹道导弹中段突防后飞行弹道与标准弹道产生较大偏离的弹道机动调整问题,建立了机动调整时机策略最优化模型。设计了机动调整逆序Q学习算法,采用Tile coding逼近器编码状态特征空间,并对其进行线性逼近。构建了Q学习算法与蒙特卡罗方法相结合的逆序更新策略机制,以对导弹机动调整最优时机进行训练。仿真测试分析结果表明,在给定场景参数下,通过10 000代强化学习算法训练得到的策略能够可靠地使用最少机动次数控制导弹突防后飞行弹道的调整决策,验证了方法的有效性。 相似文献
44.
随着经济社会的发展和形势任务的变化,海防民兵哨所建设面临着生存发展和转型发展的双重压力。必须以科学发展观为指导,以有效履行使命任务为目标,聚焦合力抓建设,着眼长远谋发展,努力解决制约哨所建设发展的重点和难点问题,在维护海防安全、促进经济社会发展中发挥积极作用。 相似文献
45.
本文对某重载车辆扭力轴轴头的堆焊修复加激光强化工艺进行了试验研究.优选了激光强化的工艺参数;分析了堆焊及激光强化层的组织;并进行了硬度及接触疲劳试验.试验结果表明:堆焊加激光强化层的硬度高,其接触疲劳性能比原材料高频淬火略有提高;堆焊加激光强化修复扭力轴轴头具有较高的经济效益. 相似文献
46.
针对可靠性强化试验的全轴随机振动环境的超高斯幅值分布特性开展其疲劳强化机理研究。首先通过理论分析表明RS机振动激励下试件应力仍保持超高斯分布,然后证明了同等量级下的超高斯分布比高斯分布随机应力具有更高的疲劳强化效能,从而揭示RS机全轴随机振动环境超高斯幅值分布特性的疲劳强化机理。 相似文献
47.
面向多无人机协同空战任务规划方法性能验证的需求,开发了一种基于VR-Forces仿真引擎的多无人机协同空战任务规划仿真系统,对该仿真系统的总体架构、红方子系统、蓝方子系统、白方子系统和强化学习算法训练子系统进行了设计。对算法库、强化学习算法训练和人机交互等关键技术提出了针对性的解决方案,提升了该仿真系统的稳定性、可扩展性和功能性。利用该仿真系统对多无人机协同空战目标分配、重决策算法等典型任务规划方法进行了测试和仿真实验。结果表明,所开发的仿真系统可以很好地支持多无人机协同空战任务规划方法的测试和验证。 相似文献
48.
近年来,基于深度强化学习的机器学习技术突破性进展为智能博弈对抗提供了新的技术发展方向。针对智能对抗中异构多智能体强化学习算法训练收敛速度慢,训练效果差异大等问题,提出了一种先验知识驱动的多智能体强化学习博弈对抗算法PK-MADDPG,构建了双重Critic框架下的MADDPG模型。该模型使用了经验优先回放技术来优化先验知识提取,在博弈对抗训练中取得显著的效果。论文成果应用于MaCA异构多智能体博弈对抗全国竞赛,将PK-MADDPG算法与经典规则算法的博弈对抗结果进行比较,验证了所提算法的有效性。 相似文献
49.
针对可疑用户可能利用无线通信危害公共安全的问题,通过智能反射面和无人机组合的方法来帮助合法监视器监听可疑链路。首先,考虑了无人机与地面用户以及地面用户之间复杂的信道交互,构建了一个合法监视器监听速率最大的优化问题。其次,为了解决这个复杂的非凸优化问题,采用深度强化学习技术,将无人机的轨迹规划和智能反射面的相移变化问题建模为马尔可夫决策过程,设计了相应的奖励函数,并基于最大熵的深度强化学习算法实现无人机和智能反射面相移设计的联合优化。最后,从仿真结果看,与无智能反射面的优化方案相比,有智能反射面的优化方案不仅提高了合法监视器的监听速率,还降低了无人机的能耗,另外智能反射面反射单元的不同数量也会对监听速率产生影响。同时,相较于近端策略优化,基于最大熵的深度强化学习算法的优化策略拥有更稳定的训练过程和更快的收敛速度。 相似文献
50.
将马尔可夫判决过程和智能强化学习算法相结合,给出了异构无线网络环境下用户业务偏好评估模型的技术框架。为动态环境下用户需求的感知、量化和适配特征的研究提供了基本的数学描述,对解决用户体验的评价问题和业务与业务环境的适配问题提供了新的研究思路。仿真结果表明所构建的MDP模型能够在多状态条件下学习用户偏好,根据用户需求智能选择业务。 相似文献