首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
本文给出了多处理机环境对系统程序的要求,阐述了系统程序并行化研制过程中遇到的问题和解决办法,给出了实现临界段互斥的三种处理方法及其性能评价。  相似文献   

2.
面向 MPP Fortran 的程序自动并行化初探   总被引:3,自引:0,他引:3       下载免费PDF全文
MPPFortran是由Cray公司推出的一种较有代表性的数据并行语言,本文首先介绍了MPPFortran的主要特点,然后,以该语言为例,对面向MPP系统程序自动并行化的主要内容进行了初步的探讨。  相似文献   

3.
并行面向对象数据库中的查询优化   总被引:1,自引:0,他引:1       下载免费PDF全文
为了在开发并行性的同时,进一步提高查询处理的效率,本文针对并行面向对象数据库的异步并行查询执行模型的特点,提出了三种并行查询优化策略:(1)数据子集预选策略;(2)信息流延迟策略;(3)信息流消减策略。它们既适用于单查询处理,又适用于多查询处理,测试结果表明它们是实用有效的并行查询优化策略。  相似文献   

4.
影响应用I/O性能的关键因素主要有三个层次:包括应用的I/O接口实现、体系结构和文件系统组件的性能以及应用的I/O参数配置。从应用I/O配置优化的视角,分析了大规模集群并行I/O的配置调优空间,在此基础上,给出了一套大规模集群并行I/O性能特征测试分析方法。基于该方法,在某国产超级计算集群上开展了一系列I/O测试分析来刻画系统的I/O性能特征,进而指导并行应用程序的I/O配置优化。基于优化后的配置参数,在两类典型的并行I/O场景中,针对某类生产应用程序,8192进程下的重启动数据写操作时间下降了15%,4096核的程序作业加载时间从10 min缩短到了5 s。  相似文献   

5.
近年来,大规模并行场景下的I/O性能越来越受到应用科学家的关注。影响应用I/O性能的关键因素主要有三个层次:包括应用的I/O接口实现、体系结构和文件系统组件的性能以及应用的I/O参数配置。本文从应用I/O配置优化的视角,分析了大规模集群并行I/O的配置调优空间,在此基础上,给出了一套大规模集群并行I/O性能特征测试分析方法,基于该方法,在某国产超级计算集群上开展了一系列I/O测试分析来刻画系统的I/O性能特征,进而指导并行应用程序的I/O配置优化。基于优化后的配置参数,在两类典型的并行I/O场景中,针对某类生产应用程序,8192进程下的重启动数据写操作时间下降了15%,4096核的程序作业加载时间从10分钟缩短到了5s。本文提出的I/O配置调优空间及优化方法,可以推广应用到其它同类系统平台,对于大规模集群上的用户层并行I/O配置调优具有借鉴意义。  相似文献   

6.
改进的光滑粒子方法在模拟激光对树脂基复合材料的辐照效应时具有明显优势,但串行计算通常难以满足需求。为了提高程序的运行效率,基于消息传递界面并行编程环境实现了串行程序的并行化。将个人电脑完成的串行计算结果与峰值5万亿次的计算机集群完成的并行计算结果进行了比较,并对并行程序的加速比和并行效率进行了测试。数值计算表明,并行计算结果与串行计算结果一致,且并行效果显著,说明基于消息传递界面的并行化是成功的。  相似文献   

7.
针对国防科技大学自主研发的异构多核数字信号处理(digital signal processing, DSP)芯片的特征以及卷积算法自身特点,提出了一种面向多核DSP架构的高性能多核并行卷积实现方案。针对1×1卷积提出了特征图级多核并行方案;针对卷积核大于1的卷积提出了窗口级多核并行优化设计,同时提出了逐元素向量化计算的核内并行优化实现。实验结果表明,所提并行优化方法实现单核计算效率最高能达到64.95%,在带宽受限情况下,多核并行扩展效率可达到48.36%~88.52%,在典型网络ResNet50上的执行性能与E5-2640 CPU相比,获得了5.39倍性能加速。  相似文献   

8.
并行计算机是计算机科学发展的必然趋势,当前研究并行计算机在网络系统中实现资源共享,推广并行计算机的应用是一个非常粗意义的课题。本论文介绍并行加速机网络操作系统的研究成果。该操作系统已经成功地实现了基于Transputer的PA-100并行加速机的在局网上,支持多用户的作业级并行处理和任务级并行处理。  相似文献   

9.
针对在绘制具有真实感的图形中光照处理模块串行处理速度慢的问题,提出多光源光照算法的并行化,采用负载均衡的并行策略,重新优化计算模型,单独计算环境光、散射光、镜面光及衰减因子后叠加在一起。计算不同的PE(处理单元)个数使用了不同的分配方案来提高处理速度。实验结果表明,将多光源光照算法并行化,可充分利用资源,发挥多核处理器的处理能力,提高了资源利用率。  相似文献   

10.
针对多核集群系统所表现出的新的性能特征,提出了面向多核集群系统消息传递应用程序的并行模拟模型并设计、实现了一个并行模拟器MCPSim(Multi-core Cluster Parallel Simulator),MCPSim在功能模型和性能模型上体现了片内核间、结点内片间以及结点间等三个层次上消息通信的特点,同时支持对应用的消息数量、通信量等的百分比分布的profiling功能,采用PRIMEJ、acobi3D、NPB IS以及HPL等Benchmark程序对MCPSim进行了测试,结果表明MCPSim性能预测的精度优于BigSim,同时能够广泛应用于针对多核集群系统消息传递应用程序的性能分析中。  相似文献   

11.
对计算流体力学(CFD)程序CNS提出一种Offload模式下基于内外子区域划分的异构并行算法,结合结构化网格下有限差分计算和四阶龙格库塔方法的特点,引入ghost网格点区域,设计了一种ghost区域收缩计算策略,显著降低了异构计算资源之间的数据传输开销,负载均衡时CPU端的计算与MPI通信完全和加速器端的计算重叠,提高了异构协同并行性。推导了保证计算正确性的ghost区域的参数,分析了负载均衡的条件。在“CPU(Intel Haswell Xeon E5-2670 12 cores ×2)+加速器(Xeon Phi 7120A ×2)”的服务器上测得该算法较直接将任务子块整体迁至加速器端计算的异构算法性能平均提升5.9倍,较MPI/OpenMP两级并行算法使用24个纯CPU核的性能,该算法使用单加速器时加速1.27倍,使用双加速器加速1.45倍。讨论和分析了性能瓶颈与存在的问题。  相似文献   

12.
对计算流体力学(Computational Fluid Dynamics, CFD)程序CNS提出一种Offload模式下对任务内外子区域划分的异构并行算法,结合结构化网格下有限差分计算和四阶龙格-库塔方法的特点,引入ghost网格点区域,设计了一种ghost区域收缩计算策略,显著降低了异构计算资源之间的数据传输开销,负载均衡时CPU端的计算与MPI通信完全和加速器端的计算重叠,提高了异构协同并行性。推导了保证计算正确性的ghost区域的参数,分析了负载均衡的条件。在"CPU(Intel Haswell Xeon E5-2670 12 cores×2)+加速器(Xeon Phi 7120A×2)"的服务器上测得该算法较直接将任务子块整体迁至加速器端计算的异构算法性能平均提升至5.9倍,较MPI/OpenMP两级并行算法使用24个纯CPU核的性能,该算法使用单加速器时加速至1.27倍,使用双加速器加速至1.45倍。讨论和分析了性能瓶颈与存在的问题。  相似文献   

13.
文中对YH-1标量线性代数库进行并行算法研究:改造串行算法,挖掘其中的向量成份,实行并行计算。根据并行机的特点采取有效的程序优化措施,设计出银河机向量线性代数库。该库采用各种直接解法的并行算法求解各类线性代数问题,精度好,运行速度快(当n=300时,向量库运行速度平均为标量库的13倍)。  相似文献   

14.
随着线路传输速率的快速提高,报文线速转发面临极大挑战。基于并行处理技术,提出分布式并行转发引擎结构,实现高速报文转发。针对并行转发引擎负载分配问题,设计AHDA(Adaptive Hashing DispatchAlgorithm)算法,该算法为综合考虑负载均衡和报文保序提供支持。模拟结果表明,AHDA算法均匀分配负载,保证很低的报文乱序率,对网络处理器规模具有良好的可扩展性。  相似文献   

15.
An n-component parallel system is subjected to a known load program. As time passes, components fail in a random manner, which depends on their individual load histories. At any time, the surviving components share the total load according to some rule. The system's life distribution is studied under the linear breakdown rule and it is shown that if the load program is increasing, the system lifetime is IFR. Using the notion of Schur convexity, a stochastic comparison of different systems is obtained. It is also shown that the system failure time is asymptotically normally distributed as the number of components grows large. All these results hold under various load-sharing rules; in fact, we show that the system lifetime distribution is invariant under different load-sharing rules.  相似文献   

16.
在大规模并行处理系统中,通讯开销是影响程序性能的一个重要因素。本文提出了一种MPPFortran程序中串行循环的优化技术:在串行循环中加入同步控制、将串行循环转换成共享循环。该技术能减少通讯开销、提高程序的性能。  相似文献   

17.
基于有限体积方法、TVD差分格式和显式Runge-Kutta迭代方法的框架,针对超声速/高超声速飞行器绕流流场,在超级并行计算机上完成了2~64个CPU并行数值计算工作。通过测试程序在超级计算机上的并行效率,并将并行程序应用于航天飞机绕流流场计算,检验了计算程序进行大规模并行计算的性能。结果表明,在负载平衡的条件下,程序在该超级并行计算机上达到了不同程度的超线性加速比,并行效率最高达到了126%,远远高于微机Cluster并行平台上的结果,适合复杂流场的大规模并行计算。  相似文献   

18.
本文介绍并实现了一种如何把一个顺序执行的任务集,根据其子任务之间潜在的并行性,划分成若干个可并发执行的任务子集,并把每个子集分配给一个处理机,使各处理机之间的数据通信量尽可能地少,同时兼顾各处理机之间负载平衡的算法。最后给出了几个典型例题的试算结果,为了满足用户的不同要求,文章还提出了几点改进方法。  相似文献   

19.
创建安装程序是一件很简单的事,Vs.net提供了创建安装程序的向导,开发人员能够轻松地创建一个便于用户使用的安装程序。而按向导创建的安装程序没有为用户提供相应的卸载程序或快捷方式,为用户带来许多不便。以示例的形式详细介绍如何在Vs.net集成环境下创建带卸载的安装程序。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号