基于内外子区域划分的高阶精度CFD程序异构并行算法 |
| |
作者姓名: | 王巍 徐传福 车永刚 |
| |
作者单位: | 国防科技大学计算机学院量子信息研究所兼高性能计算国家重点实验室,国防科技大学计算机学院量子信息研究所兼高性能计算国家重点实验室,国防科技大学计算机学院量子信息研究所兼高性能计算国家重点实验室 |
| |
基金项目: | 国家重点研发计划项目(2017YFB0202403);国防基础科研项目;国家自然科学基金项目(61561146395, 61772542) |
| |
摘 要: | 对计算流体力学(CFD)程序CNS提出一种Offload模式下基于内外子区域划分的异构并行算法,结合结构化网格下有限差分计算和四阶龙格库塔方法的特点,引入ghost网格点区域,设计了一种ghost区域收缩计算策略,显著降低了异构计算资源之间的数据传输开销,负载均衡时CPU端的计算与MPI通信完全和加速器端的计算重叠,提高了异构协同并行性。推导了保证计算正确性的ghost区域的参数,分析了负载均衡的条件。在“CPU(Intel Haswell Xeon E5-2670 12 cores ×2)+加速器(Xeon Phi 7120A ×2)”的服务器上测得该算法较直接将任务子块整体迁至加速器端计算的异构算法性能平均提升5.9倍,较MPI/OpenMP两级并行算法使用24个纯CPU核的性能,该算法使用单加速器时加速1.27倍,使用双加速器加速1.45倍。讨论和分析了性能瓶颈与存在的问题。
|
关 键 词: | 高精度CFD 程序 四阶龙格库塔法 异构并行算法 内外子区域划分 性能分析 |
收稿时间: | 2019-10-10 |
修稿时间: | 2019-12-03 |
|
| 点击此处可从《国防科技大学学报》浏览原始摘要信息 |
|
点击此处可从《国防科技大学学报》下载全文 |
|