排序方式: 共有98条查询结果,搜索用时 15 毫秒
61.
本文介绍并实现了一种如何把一个顺序执行的任务集,根据其子任务之间潜在的并行性,划分成若干个可并发执行的任务子集,并把每个子集分配给一个处理机,使各处理机之间的数据通信量尽可能地少,同时兼顾各处理机之间负载平衡的算法。最后给出了几个典型例题的试算结果,为了满足用户的不同要求,文章还提出了几点改进方法。 相似文献
62.
我军军转民呈现明显的阶段性:起点阶段、发展阶段、调整阶段。每一阶段出台的政策和措施的侧重点均有所不同。研究这些阶段以及相应的政策和措施,对今后的军转民发展有着十分重要的指导意义。 相似文献
63.
64.
传统Voronoi图对大量点集进行Voronoi划分时会产生Voronoi单元格数过多的现象,导致难以适用于地理信息系统、生物医学等诸多领域.为了解决这个问题,提出一种自适应基于密度的聚类算法(Density-Based Spatial Clustering of Applications with Noise,DBS... 相似文献
65.
66.
今年以来,各单位深入贯彻总部后勤正规化管理研讨会精神,在正规化管理上做文章,基层中队后勤正规化管理水平有了提高,但还存在着敷衍了事、做表面文章、搞短期行为等问题。笔者根据自己的调查了解和切身感受,认为抓好基层后勤正规化管理要进行“四治”。 相似文献
67.
68.
69.
对计算流体力学(CFD)程序CNS提出一种Offload模式下基于内外子区域划分的异构并行算法,结合结构化网格下有限差分计算和四阶龙格库塔方法的特点,引入ghost网格点区域,设计了一种ghost区域收缩计算策略,显著降低了异构计算资源之间的数据传输开销,负载均衡时CPU端的计算与MPI通信完全和加速器端的计算重叠,提高了异构协同并行性。推导了保证计算正确性的ghost区域的参数,分析了负载均衡的条件。在“CPU(Intel Haswell Xeon E5-2670 12 cores ×2)+加速器(Xeon Phi 7120A ×2)”的服务器上测得该算法较直接将任务子块整体迁至加速器端计算的异构算法性能平均提升5.9倍,较MPI/OpenMP两级并行算法使用24个纯CPU核的性能,该算法使用单加速器时加速1.27倍,使用双加速器加速1.45倍。讨论和分析了性能瓶颈与存在的问题。 相似文献
70.
GPU体系结构的革新和相应开发平台的发展使得GPU广泛地应用于科学计算领域.通过深入地分析GPU体系结构和存储层次的优缺点以及GPU上的关键性能特征,阐明了GPU体系结构、编程模型和存储层次之间的关系.针对GPU异构系统上的应用映射提出三种基本负载均衡优化策略:预取、流化、任务划分.试验结果揭示了不同的优化因子与优化效率之间的具体关联. 相似文献