排序方式: 共有7条查询结果,搜索用时 15 毫秒
1
1.
2.
曹文斌 《国防科技大学学报》2015,37(3)
利用CUDA Fortran语言发展了一种基于GPU的计算流体力学可压缩湍流求解器。该求解器基于结构网格有限体积法,空间离散采用AUSMPW 格式,湍流模型为k-ω SST两方程模型,采用MPI实现并行计算。针对最新的GPU架构,讨论了通量计算的优化方法及GPU计算与PCIe数据传输、MPI通信重叠的多GPU并行算法。进行了超声速进气道及空天飞机等算例的数值模拟以验证GPU在大网格量情况下的加速性能。计算结果表明相对于Intel Xeon E5-2670 CPU单一核心的计算时间,单块NVIDIA GTX Titan Black GPU可获得107至125倍的加速比。利用四块GPU实现了复杂外形1.34亿网格的快速计算,并行效率为91.6%。 相似文献
3.
4.
一种利用CUDA技术实现雷达余辉效果的方法 总被引:1,自引:0,他引:1
雷达PPI显示器余辉效果的好坏直接影响雷达模拟器的逼真程度,从而影响受训人员的训练效果。为实现高度逼真的雷达余辉效果,克服余辉模拟中坐标变换及余辉计算对运算速度需求较高的问题,利用新近出现的CUDA并行处理技术将在CPU上处理耗时较多的坐标变换及余辉计算搬移到GPU上来实现,克服了传统雷达余辉模拟方法中存在的不足。同时,传统余辉模拟方法中无法实现的高转速扫描余辉模拟,以及由于目标数据致使天线转速不稳等问题也得以解决,使用该方法可以实现导航等多型雷达的高转速扫描线余辉模拟。利用该方法研制的雷达训练模拟器已装备到某训练基地,用于雷达兵实际的教学、训练和考核,取得了良好的效果。 相似文献
5.
在CPU/GPU异构体系结构计算集群上,建立了基于MPI+CUDA的异构并行可压缩流求解器。讨论了异构结构上的可压缩流并行算法的并行模式,在CPU上执行计算密集度低、指令复杂的计算任务,在GPU上执行计算密集度高、指令单一的计算任务。通过数个算例,对比了异构并行计算和传统CPU并行计算计算结果和计算效率。将该算法运用于高超声速流动的数值模拟中,数值结果显示,基于MPI+CUDA的异构并行可压缩流求解器鲁棒性好,计算效率较CPU同构并行计算提高10倍以上。 相似文献
6.
7.
利用CUDA Fortran语言发展了基于图形处理器(GPU)的计算流体力学可压缩湍流求解器。该求解器基于结构网格有限体积法,空间离散采用AUSMPW+格式,湍流模型为k-ωSST两方程模型,采用MPI实现并行计算。针对最新的GPU架构,讨论了通量计算的优化方法及GPU计算与PCIe数据传输、MPI通信重叠的多GPU并行算法。进行了超声速进气道及空天飞机等算例的数值模拟以验证GPU在大网格量情况下的加速性能。计算结果表明:相对于Intel Xeon E5-2670 CPU单一核心的计算时间,单块NVIDIA GTX Titan Black GPU可获得107~125倍的加速比。利用四块GPU实现了复杂外形1.34亿网格的快速计算,并行效率为91.6%。 相似文献
1