首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 134 毫秒
1.
在并行离散事件仿真系统中实现仿真模型间的互操作机制需要引入类似HLA中定义的声明管理(DM)和数据分发管理(DDM)服务.我们开发的KD-PADSE高性能并行离散事件仿真环境采用谓词断言和对象代理方法在面向对象的并行离散事件仿真系统中实现了基于平行结构和事件调度机制的声明管理(DM)和数据分发管理(DDM)服务.在以千兆以太网互联的10节点Linux集群计算机上,采用DDM机制后仿真模型每秒(物理时间)可以进行1万次属性更新,是没有采用DDM机制时的20倍,在功能性和性能上验证了该DDM机制在并行离散事件仿真系统中的适用性.  相似文献   

2.
一种面向多核处理器的高效并行PCA-SIFT算法   总被引:1,自引:0,他引:1       下载免费PDF全文
提出一种面向多核处理器的并行PCA-SIFT算法,采用数据级并行方法实现并行的特征提取和特征点匹配,将计算任务分配到各个DSP核并行处理,充分开发多核处理器的多级并行性.实验结果表明,并行PCA-SIFT算法对各种不同图像形变的图像具有良好的适应性,具有接近串行PCA-SIFT算法的图像匹配能力,平均加速比达3.12.  相似文献   

3.
为了加快卷积神经网络模型的计算速度,便于大规模神经网络模型在嵌入式微处理器中的实现,以FT-matrix2000向量处理器体系结构为研究背景,通过对多核向量处理器体系结构的分析和对卷积神经网络算法的深入研究,提出将规模较小的卷积核数据置于标量存储体,尺寸较大的卷积矩阵置于向量存储体的数据布局方案。针对矩阵卷积中数据难以复用的问题,提出根据卷积核移动步长的不同动态可配置的混洗模式,通过对所取卷积矩阵元素进行不同的移位操作,进而大幅提高卷积矩阵数据的复用率。针对二维矩阵卷积由于存在数据相关性进而难以多核并行的问题,提出将卷积矩阵多核共享,卷积核矩阵多核独享的多核并行方案。设计了卷积核尺寸不变、卷积矩阵规模变化和卷积矩阵尺寸不变、卷积核规模变化的两种计算方式,并在主流CPU、GPU、TI6678、FT-matrix2000平台进行了性能对比与分析。实验结果表明:FT-matrix2000相比CPU最高可加速238倍,相比TI6678可加速21倍,相比GPU可加速663 805倍。  相似文献   

4.
为了在分布式存储的大规模数据图上进行快速图模式匹配,提出了基于局部评估的分布式图模式匹配算法disGPM-PE。首先各计算节点并行地执行本地匹配,然后协调器节点收集局部匹配结果、计算边界点的匹配状态并发送给相应的计算节点,接着计算节点根据边界点的匹配状态确定与边界点相连的节点的匹配情况,最后协调器节点组合得出最大匹配集。实验结果表明:与已有的分布式图模式匹配算法相比,disGPM-PE算法都能够在不显著增加通信量的前提下避免数据片段间的依赖关系对执行时间的影响,减少了图模式匹配的时间。  相似文献   

5.
基于现有时域平面波(PWTD)算法,提出了一种对时域标量场平面波算法的改进方法。此方法将现有算法中的插值计算改为制表查询,并给出了其最大误差。另外,还将现有算法中转移算子中对时间求导提到算法最外层,将原先所需的(K 1)(2K 1)次FFT和IFFT计算减少为一次FFT和IFFT计算。最后算例证明当算法选取适当参数值时,可获得需要的计算精度,并验证了改进算法所需计算时间远少于现有算法。  相似文献   

6.
为了在分布式存储的大规模数据图上进行快速图模式匹配,提出利用局部评估的分布式图模式匹配算法。各计算节点并行地执行本地匹配;协调器节点收集局部匹配结果、计算边界点的匹配状态并发送给相应的计算节点;计算节点根据边界点的匹配状态确定与边界点相连的节点的匹配情况;协调器节点组合得出最大匹配集。实验结果表明:与已有的分布式图模式匹配算法相比,dis GPM-PE算法都能够在不显著增加通信量的前提下避免数据片段间的依赖关系对执行时间的影响,从而减少图模式匹配的时间。  相似文献   

7.
智能训练是利用机器学习算法对神经网络智能体模型进行训练优化的过程,智能体模型通过不断试错的训练方式实现智能提升。大规模训练数据是智能训练的必要条件,通常难以从现实世界中直接获取,如何通过仿真的方式生成大量有效的训练数据,是智能训练的重要研究方向。对此提出一种基于仿真实验的智能并行训练方法,利用仿真实验管理可快速生成批量仿真实验想定,并支持节点自动部署和运行,通过合理的训练架构设计和有效训练流程设计实现智能并行训练。通过实际案例展示了智能训练的仿真实验管理过程,并结合训练效果证明了给出的方法提高了智能训练效率和智能体泛化性。  相似文献   

8.
为保证新一代移动无线网络能够根据实时覆盖情况动态地调节小区天线参数,需要实现高效且准确的无线覆盖预测。传统的求解方法通过精确的场强预测判断天线参数的优劣,虽然精度很高但需要大量的计算资源,无法满足5G和后5G移动网络通过实时覆盖预测进行射频参数动态调整的实际需求。现采用基于深度神经网络的算法对给定天线参数的覆盖效果进行预测,以取代对目标区域的精确场强预测。数值结果表明:该方法能够在保持计算准确性的同时显著减少计算量,为5G动态网络规划提供基础性参考数据。  相似文献   

9.
针对国防科技大学自主研发的异构多核数字信号处理(digital signal processing, DSP)芯片的特征以及卷积算法自身特点,提出了一种面向多核DSP架构的高性能多核并行卷积实现方案。针对1×1卷积提出了特征图级多核并行方案;针对卷积核大于1的卷积提出了窗口级多核并行优化设计,同时提出了逐元素向量化计算的核内并行优化实现。实验结果表明,所提并行优化方法实现单核计算效率最高能达到64.95%,在带宽受限情况下,多核并行扩展效率可达到48.36%~88.52%,在典型网络ResNet50上的执行性能与E5-2640 CPU相比,获得了5.39倍性能加速。  相似文献   

10.
为保证新一代移动无线网络能够根据实时覆盖情况动态地调节小区天线参数,需要实现高效且准确的无线覆盖预测。传统的求解方法通过精确的场强预测来判断天线参数的优劣,虽然精度很高但需要大量的计算资源,无法满足5G和后5G移动网络通过实时覆盖预测进行射频参数动态调整的实际需求。现采用基于深度神经网络的算法对给定天线参数的覆盖效果进行预测,以取代对目标区域的精确场强预测。数值结果表明,该方法能够在保持计算准确性的同时显著减少计算量,为5G动态网络规划提供基础性参考数据。  相似文献   

11.
随着计算机多核处理器的高速发展,多核并行计算在各领域发展研究的重要性已逐渐突显,分析了当前典型的并行编程模型,在PCAM设计过程的基础上提出了多核并行算法的设计过程,运用OpenMP编程模型完成了一种目标分配算法的多核并行化设计,通过实验及性能分析,验证了并行目标分配算法相较于传统串行算法在计算效率上的优势。  相似文献   

12.
RNA二级结构预测是生物信息学领域重要的研究方向,基于最小自由能模型的Zuker算法是目前该领域最典型使用最广泛的算法之一。本文基于CPU GPU的混合计算平台实现了对Zuker算法的并行和加速。根据CPU和GPU计算性能的差异,通过合理的任务分配策略,实现二者之间的并行协作计算和处理单元间的负载平衡;针对CPU和GPU的不同硬件特性,对Zuker算法在CPU和GPU上的实现分别采取了不同的并行优化方法,提高了混合加速系统的计算性能。实验结果表明,CPU处理单元在混合系统中承担了14%以上的计算任务,与传统的多核CPU并行方案相比,采用混合并行加速方法可获得15.93的全局加速比;与最优的单纯GPU加速方案相比,可获得16%的性能提升,并且该混合计算方案可用于对其它生物信息学序列分析应用的并行和加速。  相似文献   

13.
针对多边形并行栅格化中的负载不均衡问题提出一种新的数据划分方法,主要包括:迭代计算划分线的位置,在每次迭代中保证分块间的计算量大致均衡,完成数据划分、实现负载均衡;提出基于二叉树的划分结果融合策略,以解决跨边界多边形的融合问题。在多核CPU环境下实现并行算法,选用多个典型土地利用现状数据集进行测试。结果表明:针对不同类型多边形数据集,所提方法较传统方法可获得更高的并行加速比和更好的负载均衡;针对大数据量数据集,以多边形节点数为度量标准可更精确地估算分块计算量,从而更好地实现负载均衡。  相似文献   

14.
栅格数据处理中邻域型算法的并行优化方法   总被引:1,自引:1,他引:0       下载免费PDF全文
随着并行计算的成熟,众多数据密集型的栅格处理算法亟需利用并行计算来缩减执行时间.针对其中一类邻域型算法,构建了用于估计是时间代价的串行/并行时域模型,分析了各个组成的代价影响因素,提出了降低数据I/O代价的并行I/O方法和降低数据通信代价的光圈预测方法.实验证明,所提的两个优化方法可以使邻域型栅格处理算法的并行程序更加充分地利用并行计算资源,进而在一般并行化的基础上进一步提升其并行性能.  相似文献   

15.
分布式并行地形分析中数据划分机制研究   总被引:1,自引:0,他引:1       下载免费PDF全文
数据粒度是海量空间数据并行计算的重要问题之一。通过对不同性质的并行算法的对比分析,提出空间数据粒度模型,量化地反映并行地形分析中数据划分的规模,建立并行数据粒度评价模型。通过研究集群环境下不同算法的数据并行数据粒度问题,提出基于并行数据粒度评价模型的优化数据粒度调度算法。通过计算每一次并行计算的时间与数据粒度效率,从而实现对计算数据粒度动态更新以追求更高的加速比。经过实验验证,该算法较之传统算法,可提供更高的任务执行效率并具有更好的可移植性。  相似文献   

16.
双二体模型是求解地月转移轨道的重要基础。与传统的采用月球影响球入口点经纬度的描述方式不同,本文提出一种基于飞行轨道面参数来描述地月转移轨道的双二体模型几何表达方式,结合一维非线性方程求根算法Brent算法和Lambert原理,将原始三维球面搜索算法降维成为二维圆上的搜索算法,可以高效求解地月转移轨道的形状参数。为避免重复计算,将转移轨道窗口计算的轨道多变量搜索问题解耦分解成两个子问题——转移轨道形状参数求解问题和转移轨道面空间定向问题,降低了问题的求解维度。形成两级并行计算算法,充分发挥多核计算机算力,加速计算过程。仿真结果表明,基于提出的并行圆锥曲线几何切面法,可以成功应用于计算天梯地月转移轨道分析。  相似文献   

17.
高性能计算机的快速发展为数值模拟提供了必需的硬件环境,数值模拟领域对网格的需求已高达数十亿到数百亿量级,而网格生成作为数值模拟的重要一环,其发展则相对滞后,很难满足并行数值模拟求解器对大规模网格的需求。本文面向复杂几何模型提出一种多级并行四面体网格生成算法,该算法首先基于模型的几何特征建立网格的尺寸场,并基于尺寸场和几何实体间的邻接关系对几何实体进行分组,将分组后的几何实体分配到不同的计算节点,在计算节点间采用前沿推进法实现三角形面网格的并行生成,然后在计算节点内对三角形面网格进行二级区域分解,将分解后的子网格分配到各进程中,最后在进程内采用多线程并行方法实现四面体网格的并行生成。通过实际应用三峡大坝模型进行验证,该算法具有良好的并行效率和可扩展性,可以在数千处理器核上实现十亿规模高质量四面体网格的并行生成。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号