期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	12篇
免费	41篇
国内免费	5篇

出版年

2024年	2篇
2023年	2篇
2022年	2篇
2021年	1篇
2020年	1篇
2019年	1篇
2018年	1篇
2017年	2篇
2016年	3篇
2015年	7篇
2014年	3篇
2013年	6篇
2012年	4篇
2011年	2篇
2010年	2篇
2009年	2篇
2006年	2篇
2005年	1篇
2003年	2篇
2002年	2篇
2001年	1篇
2000年	2篇
1999年	1篇
1998年	1篇
1997年	1篇
1996年	1篇
1993年	1篇
1992年	1篇
1991年	1篇

排序方式： 共有58条查询结果，搜索用时 15 毫秒

[首页] « 上一页 [1] 2 [3] [4] [5] [6] 下一页 » 末页»

11.

基于并行模拟的多核集群系统性能预测和分析

下载免费PDF全文

徐传福车永刚王正华《国防科技大学学报》2010,32(5):62-68

针对多核集群系统所表现出的新的性能特征,提出了面向多核集群系统消息传递应用程序的并行模拟模型并设计、实现了一个并行模拟器MCPSim(Multi-core Cluster Parallel Simulator),MCPSim在功能模型和性能模型上体现了片内核间、结点内片间以及结点间等三个层次上消息通信的特点,同时支持对应用的消息数量、通信量等的百分比分布的profiling功能,采用PRIMEJ、acobi3D、NPB IS以及HPL等Benchmark程序对MCPSim进行了测试,结果表明MCPSim性能预测的精度优于BigSim,同时能够广泛应用于针对多核集群系统消息传递应用程序的性能分析中。相似文献

12.

一种面向移动Agent的多任务并行计算模型及算法

韩国栋王嘉祯《军械工程学院学报》2006,18(4):64-66

介绍了一种面向移动Agent的并行计算模型,给出了采用十标度策略解决任务排序,采用满射策略解决任务映射的算法。该模型允许多个计算任务在异构主机构成的分布式环境下同时进行计算,并且通过算法优化,降低移动Agent之间的通信成本,减少网络流量。相似文献

13.

基于栅格分层的逐栅格汇流算法并行化研究 总被引：2，自引：2，他引：0

下载免费PDF全文

刘军志朱阿兴刘永波秦承志陈腊娇吴辉杨琳《国防科技大学学报》2013,35(1):123-129

分布式水文模型中的逐栅格汇流算法计算量大,需要借助并行计算以满足大流域长历时模拟的要求。针对目前鲜有对基于隐式有限差分的逐栅格汇流算法进行并行计算研究的情况,基于栅格分层的思想提出一种适用于共享内存并行计算环境的逐栅格汇流并行算法。该算法首先根据流向进行栅格分层,使同一层中栅格的计算相互独立,然后将同一层中栅格的计算任务分配到多个计算单元并行计算。采用C++编程语言与OpenMP并行编程库实现了该算法,并选择河北省清水河流域为实验区,在不同数据规模(30m、90m、270m分辨率)、不同核数(2～20个)以及不同栅格分层方法的情况下对算法性能进行了测试。实验结果表明本文提出的并行算法具有较好的加速比和并行效率,且并行效率随数据规模的增大而增大。栅格分层方法对算法并行性能有明显影响,从上到下的分层方法比从下到上的方法具有更高的并行效率。相似文献

14.

液体火箭发动机非线性燃烧不稳定过程的并行仿真

下载免费PDF全文

赵文涛庄逢辰聂万胜《国防科技大学学报》2002,24(4):5-8

采用计算燃烧学方法对火箭发动机非线性燃烧不稳定工作过程进行了并行数值模拟。气相控制方程组用欧拉坐标系下的Navier Stokes方程组描述 ,液相控制方程组在Lagrangian坐标系下进行描述。气、液两相作用通过方程组的源项互相耦合。编制了串行和并行程序 ,并在并行计算环境下进行了测试。从计算结果可以看出并行计算的效率较高。相似文献

15.

位置信息与替换概率相结合的多核共享Cache管理机制

下载免费PDF全文

徐金波庞征斌李琰《国防科技大学学报》2016,38(5):32-38

多核系统中末级Cache是影响整体性能的关键。为了提出一种细粒度、低延迟、低代价的末级共享Cache资源管理机制,将系统性能目标转换为每个内核当前占用Cache资源的替换概率,以决定每个内核能够提供的被替换资源的数量;对某个需要增加Cache资源的内核,从可提供被替换资源的候选内核中选出距离较近且替换概率较高的一个内核,并以Cache块为粒度进行替换,从而实现Cache资源在不同内核间的动态划分。与传统以相联度为粒度的粗粒度替换机制相比,以Cache块为单位的替换机制具有更细的替换粒度,灵活性更高。另外,通过将位置信息和替换概率结合,保证了Cache资源与相应内核在物理布局上的收敛,降低了访问延迟。同时,所提出的方法只需要增加极少的硬件代价。实验结果表明,根据实验场景和对比对象的不同,所提方法与其他已有研究成果相比,可以实现从6.8%到22.7%的性能提升。相似文献

16.

流化H.264编码的数据并行方法

下载免费PDF全文

文梅任巨伍楠苏华友荀长庆张春元《国防科技大学学报》2011,33(3):66-71

流模型是一种源于媒体处理的新型并行计算模型.然而H.264编码作为媒体处理领域中的重要应用,在与流模型适配时,却出现重要障碍,主要是由于相关性问题极大地限制了流化过程中数据级并行的开发.针对这个问题,首先根据编码算法分析了编码过程中遇到的相关性问题,然后为各主要编码模块分别提出解除相关性限制的数据并行编码方法.采用这些... 相似文献

17.

多核数字信号处理器并行矩阵转置算法优化

下载免费PDF全文

裴向东王庆林廖林玉李荣春梅松竹刘杰庞征斌《国防科技大学学报》2023,45(1):57-66

矩阵转置是矩阵运算的基本操作,广泛应用于信号处理、科学计算以及深度学习等各种领域。随着国防科技大学自主研制的飞腾异构多核数字信号处理器(digital signal processor, DSP)在各种领域中的推广应用,对高性能矩阵转置实现提出了强烈需求。针对飞腾异构多核DSP的体系结构特征与矩阵转置操作的特点,提出了一种适配不同数据位宽(8 B、4 B以及2 B)矩阵的并行矩阵转置算法ftmMT。该算法基于DSP中向量处理单元的Load/Store部件实现了向量化,同时基于矩阵分块实现了多个DSP核的并行处理,通过隐式乒乓设计实现了片上向量化转置与片外访存的重叠以及访存性能的大幅提升。实验结果表明,ftmMT能够显著加快矩阵转置操作,与CPU上的开源转置库HPTT相比,可获得高达8.99倍的性能加速。相似文献

18.

多GPU的可压缩湍流并行计算

下载免费PDF全文

曹文斌《国防科技大学学报》2015,37(3)

利用CUDA Fortran语言发展了一种基于GPU的计算流体力学可压缩湍流求解器。该求解器基于结构网格有限体积法,空间离散采用AUSMPW 格式,湍流模型为k-ω SST两方程模型,采用MPI实现并行计算。针对最新的GPU架构,讨论了通量计算的优化方法及GPU计算与PCIe数据传输、MPI通信重叠的多GPU并行算法。进行了超声速进气道及空天飞机等算例的数值模拟以验证GPU在大网格量情况下的加速性能。计算结果表明相对于Intel Xeon E5-2670 CPU单一核心的计算时间,单块NVIDIA GTX Titan Black GPU可获得107至125倍的加速比。利用四块GPU实现了复杂外形1.34亿网格的快速计算,并行效率为91.6%。相似文献

19.

矢量多边形并行栅格化数据划分方法

下载免费PDF全文

周琛李满春陈振杰姜朋辉陈东《国防科技大学学报》2015,37(5):21-28

针对多边形并行栅格化中的负载不均衡问题提出一种新的数据划分方法,主要包括:迭代计算划分线的位置,在每次迭代中保证分块间的计算量大致均衡,完成数据划分、实现负载均衡;提出基于二叉树的划分结果融合策略,以解决跨边界多边形的融合问题。在多核CPU环境下实现并行算法,选用多个典型土地利用现状数据集进行测试。结果表明:针对不同类型多边形数据集,所提方法较传统方法可获得更高的并行加速比和更好的负载均衡;针对大数据量数据集,以多边形节点数为度量标准可更精确地估算分块计算量,从而更好地实现负载均衡。相似文献

20.

弹道导弹诸元与弹道并行计算方法

徐晓东赵建亭许春雷《火力与指挥控制》2014,(2):350-352

变射点、动基座和机动发射是现代导弹武器系统发展的主要方向。为提高武器的快速反应能力,在现有硬件计算条件下降低弹道导弹诸元与弹道计算时间,结合弹道导弹诸元与弹道模型的特点,利用并行计算技术,建立了相应的并行计算模型,采用MPI设计研究了诸元和弹道并行计算的实现方法,通过仿真验证,证明该方法能有效提高弹道计算速度,得到较高的加速比。相似文献

[首页] « 上一页 [1] 2 [3] [4] [5] [6] 下一页 » 末页»