排序方式: 共有43条查询结果,搜索用时 15 毫秒
41.
对计算流体力学(CFD)程序CNS提出一种Offload模式下基于内外子区域划分的异构并行算法,结合结构化网格下有限差分计算和四阶龙格库塔方法的特点,引入ghost网格点区域,设计了一种ghost区域收缩计算策略,显著降低了异构计算资源之间的数据传输开销,负载均衡时CPU端的计算与MPI通信完全和加速器端的计算重叠,提高了异构协同并行性。推导了保证计算正确性的ghost区域的参数,分析了负载均衡的条件。在“CPU(Intel Haswell Xeon E5-2670 12 cores ×2)+加速器(Xeon Phi 7120A ×2)”的服务器上测得该算法较直接将任务子块整体迁至加速器端计算的异构算法性能平均提升5.9倍,较MPI/OpenMP两级并行算法使用24个纯CPU核的性能,该算法使用单加速器时加速1.27倍,使用双加速器加速1.45倍。讨论和分析了性能瓶颈与存在的问题。 相似文献
42.
针对深空探测中常规点数的FFT无法对极微弱信号进行精确的频率引导,而超长点数的FFT无法用现有器件实现,提出一种基于数字信道化的并行FFT频率引导方法.接收信号先经过数字信道化处理,均匀划分为若干窄带信号,然后分别对各子带信号进行FFT运算,最后通过对各子带有效谱线的联合检测完成载波频率的精确估计.在等效219点FFT的频率引导模块FPGA实现中,通过FFT模块的复用节约了硬件资源开销.测试结果表明:在8MHz采样率下该模块的测频精度小于10Hz. 相似文献
43.