排序方式: 共有106条查询结果,搜索用时 15 毫秒
101.
对计算流体力学(Computational Fluid Dynamics, CFD)程序CNS提出一种Offload模式下对任务内外子区域划分的异构并行算法,结合结构化网格下有限差分计算和四阶龙格-库塔方法的特点,引入ghost网格点区域,设计了一种ghost区域收缩计算策略,显著降低了异构计算资源之间的数据传输开销,负载均衡时CPU端的计算与MPI通信完全和加速器端的计算重叠,提高了异构协同并行性。推导了保证计算正确性的ghost区域的参数,分析了负载均衡的条件。在"CPU(Intel Haswell Xeon E5-2670 12 cores×2)+加速器(Xeon Phi 7120A×2)"的服务器上测得该算法较直接将任务子块整体迁至加速器端计算的异构算法性能平均提升至5.9倍,较MPI/OpenMP两级并行算法使用24个纯CPU核的性能,该算法使用单加速器时加速至1.27倍,使用双加速器加速至1.45倍。讨论和分析了性能瓶颈与存在的问题。 相似文献
102.
采用五阶精度显式混合加权紧致非线性格式求解雷诺平均NS方程;利用多块对接结构网格技术,对30P-30N多段翼型进行网格收敛性研究。在不考虑转捩的情况下,采用SA一方程湍流模型研究混合加权紧致非线性格式与二阶精度MUSCL格式对该翼型压力分布和典型站位速度型的影响,并与实验结果进行对比分析。采用混合加权紧致非线性格式和SA一方程湍流模型模拟梯形翼高升力构型低速复杂流场,通过对总体气动特性和压力分布的分析,探讨五阶精度显式混合加权紧致非线性格式在低速复杂外形流动中的应用能力。结果表明,对30P-30N三段翼型,采用全湍流模拟方法可以得到较好的压力分布;对梯形翼高升力构型,在附着流和边界层小分离情况下混合加权紧致非线性格式有较好的模拟能力。 相似文献
103.
104.
对计算流体力学(CFD)程序CNS提出一种Offload模式下基于内外子区域划分的异构并行算法,结合结构化网格下有限差分计算和四阶龙格库塔方法的特点,引入ghost网格点区域,设计了一种ghost区域收缩计算策略,显著降低了异构计算资源之间的数据传输开销,负载均衡时CPU端的计算与MPI通信完全和加速器端的计算重叠,提高了异构协同并行性。推导了保证计算正确性的ghost区域的参数,分析了负载均衡的条件。在“CPU(Intel Haswell Xeon E5-2670 12 cores ×2)+加速器(Xeon Phi 7120A ×2)”的服务器上测得该算法较直接将任务子块整体迁至加速器端计算的异构算法性能平均提升5.9倍,较MPI/OpenMP两级并行算法使用24个纯CPU核的性能,该算法使用单加速器时加速1.27倍,使用双加速器加速1.45倍。讨论和分析了性能瓶颈与存在的问题。 相似文献
105.
针对深空探测中常规点数的FFT无法对极微弱信号进行精确的频率引导,而超长点数的FFT无法用现有器件实现,提出一种基于数字信道化的并行FFT频率引导方法.接收信号先经过数字信道化处理,均匀划分为若干窄带信号,然后分别对各子带信号进行FFT运算,最后通过对各子带有效谱线的联合检测完成载波频率的精确估计.在等效219点FFT的频率引导模块FPGA实现中,通过FFT模块的复用节约了硬件资源开销.测试结果表明:在8MHz采样率下该模块的测频精度小于10Hz. 相似文献
106.