共查询到19条相似文献,搜索用时 109 毫秒
1.
曹文斌 《国防科技大学学报》2015,37(3)
利用CUDA Fortran语言发展了一种基于GPU的计算流体力学可压缩湍流求解器。该求解器基于结构网格有限体积法,空间离散采用AUSMPW 格式,湍流模型为k-ω SST两方程模型,采用MPI实现并行计算。针对最新的GPU架构,讨论了通量计算的优化方法及GPU计算与PCIe数据传输、MPI通信重叠的多GPU并行算法。进行了超声速进气道及空天飞机等算例的数值模拟以验证GPU在大网格量情况下的加速性能。计算结果表明相对于Intel Xeon E5-2670 CPU单一核心的计算时间,单块NVIDIA GTX Titan Black GPU可获得107至125倍的加速比。利用四块GPU实现了复杂外形1.34亿网格的快速计算,并行效率为91.6%。 相似文献
2.
利用CUDA Fortran语言发展了基于图形处理器(GPU)的计算流体力学可压缩湍流求解器。该求解器基于结构网格有限体积法,空间离散采用AUSMPW+格式,湍流模型为k-ωSST两方程模型,采用MPI实现并行计算。针对最新的GPU架构,讨论了通量计算的优化方法及GPU计算与PCIe数据传输、MPI通信重叠的多GPU并行算法。进行了超声速进气道及空天飞机等算例的数值模拟以验证GPU在大网格量情况下的加速性能。计算结果表明:相对于Intel Xeon E5-2670 CPU单一核心的计算时间,单块NVIDIA GTX Titan Black GPU可获得107~125倍的加速比。利用四块GPU实现了复杂外形1.34亿网格的快速计算,并行效率为91.6%。 相似文献
3.
在CPU/GPU异构体系结构计算集群上,建立了基于MPI+CUDA的异构并行可压缩流求解器。讨论了异构结构上的可压缩流并行算法的并行模式,在CPU上执行计算密集度低、指令复杂的计算任务,在GPU上执行计算密集度高、指令单一的计算任务。通过数个算例,对比了异构并行计算和传统CPU并行计算计算结果和计算效率。将该算法运用于高超声速流动的数值模拟中,数值结果显示,基于MPI+CUDA的异构并行可压缩流求解器鲁棒性好,计算效率较CPU同构并行计算提高10倍以上。 相似文献
4.
RNA二级结构预测是生物信息学领域重要的研究方向,基于最小自由能模型的Zuker算法是目前该领域最典型使用最广泛的算法之一。本文基于CPU GPU的混合计算平台实现了对Zuker算法的并行和加速。根据CPU和GPU计算性能的差异,通过合理的任务分配策略,实现二者之间的并行协作计算和处理单元间的负载平衡;针对CPU和GPU的不同硬件特性,对Zuker算法在CPU和GPU上的实现分别采取了不同的并行优化方法,提高了混合加速系统的计算性能。实验结果表明,CPU处理单元在混合系统中承担了14%以上的计算任务,与传统的多核CPU并行方案相比,采用混合并行加速方法可获得15.93的全局加速比;与最优的单纯GPU加速方案相比,可获得16%的性能提升,并且该混合计算方案可用于对其它生物信息学序列分析应用的并行和加速。 相似文献
5.
6.
7.
为仿真前视红外导引头实时匹配导引过程,完成目标实时跟踪性判断,针对限制对比度自适应直方图均衡和归一化互相关算法开展加速策略研究,提出基于统一计算设备架构(Compute Unified Device Architecture, CUDA)的雾霭图像实时处理加速方案,并进行设计参数寻优,得出线程块、线程网格设计参数存在最优尺寸,需实验测定的结论。实验结果表明,引入CUDA加速优化后,较未进行CUDA加速前时间指标提高5~20倍,能够满足目标跟踪实时性要求,可为红外导引头目标实时跟踪系统设计提供参考。 相似文献
8.
9.
通过分析小波变换的多相表示和GPU通用计算模型,结合现代GPU的多纹理和多渲染目标特性,提出了一种基于GPU与多相表示的二维离散小波变换计算方法,该方法使小波变换的计算形式完全适合GPU的SIMD结构,同时大幅减少了纹理访问次数,充分利用了GPU的矢量运算和二维寻址能力,实验表明该方法在处理速度上有大幅的提高。 相似文献
10.
11.
提出了一种基于图形处理单元(graphic processing unit, GPU)的5G软件无线电准循环低密度奇偶校验(low density parity check, LDPC)码译码器,为了节省片上和片下带宽,采用码字缩短和打孔技术、两级量化和数据打包方案,以提升数据带宽的利用率。实验基于Nvidia RTX 2080Ti GPU平台实现了高码率情况下的最小和近似译码算法的并行译码,通过分析GPU上的最优线程设置,将码率为5/6的(2 080,1 760) LDPC算法的译码吞吐率提升至1.38 Gbit/s,译码吞吐率性能优于现有其他基于GPU的LDPC译码器。 相似文献
12.
针对低信噪比条件下弱目标检测跟踪问题,提出一种拟蒙特卡罗智能粒子滤波检测前跟踪算法(Quasi-Monte Carlo Intelligent Particle Filter Track Before Detect,QIPF-TBD)。首先,该算法采用拟蒙特卡罗技术改善探测空间中粒子分布的均匀性;其次,通过对更新阶段的粒子进行交叉变异等操作,提高粒子重采样之后的多样性。与同类算法的仿真分析表明,所提方法能有效改善低信噪比目标的检测概率和跟踪精度。 相似文献
13.
红外警戒系统点目标检测距离理论分析 总被引:1,自引:0,他引:1
给出了红外警戒系统点目标探测距离的计算模型与公式,分析了影响点目标探测距离的参数间关系,并得出有关目标提取算法及传感器参数选择的几点重要结论. 相似文献
14.
针对宽带高距离分辨全极化雷达体制,提出了一种基于实时递归神经网络算法的飞机目标自动识别方法,实现了全极化下五类飞机目标的自动识别。实验结果表明,递归神经网络用于飞机目标识别是有效可行的。 相似文献
15.
基于DSP的复杂背景下瞄准分划探测与识别 总被引:1,自引:1,他引:0
为解决嵌入式模拟射击训练系统中瞄准分划自动探测与识别的问题,以ADSP-BF533数字视频处理系统为平台,利用瞄准分划的灰度和形状特征,综合运用边缘检测、数学形态学和模板匹配等算子,提出了一种复杂背景下瞄准分划探测与识别算法,成功实现了对瞄准分划的自动探测和识别。 相似文献
16.
针对超音速隐身飞机难以探测的问题,仿真分析了F-22飞机在不同运动特征下的动态RCS,并对其频率响应和极化响应特性做进一步的研究。首先设定飞行航迹,并考虑实际中随机抖动的影响,获取时变的雷达视线姿态角;其次应用物理光学并结合等效电磁流的方法,计算分析了飞机以不同的速度沿不同航迹飞行时的动态RCS。对于使飞机动态RCS变化最明显的运动特征,仿真计算了其在不同频段、不同极化下的动态RCS。仿真结果表明:在不同航迹下,飞机速度对其动态RCS的影响程度不同,且当飞机沿小航路捷径低速或者高速飞行时,其RCS值减小最为明显,利用极化响应和频率响应特性可以有效地削弱这一影响。研究成果对于超音速隐身飞机目标的预警探测具有重要意义。 相似文献
17.
作为红外自寻的制导、搜索跟踪和预警等领域的一项关键技术,红外弱小目标检测与跟踪成了红外图像处理领域中的一项重要研究课题。本文采用了"先检测后跟踪(DBT)"的思想对红外小目标进行检测与跟踪,首先采用基于各向异性偏微分方程的背景抑制技术对单帧图像进行抑制,再用最大绝对对比度阈值对红外图像进行分割,最后采用形心跟踪法对小目标点坐标定位。试验证明本文算法应用于目标检测的可行性和有效性。 相似文献
18.
19.
基于Gram-Schmidt正交化算法的水下目标回波检测 总被引:2,自引:1,他引:1
提出了一种基于Gram-Schmidt正交化算法的水下目标回波检测方法.该方法利用Gram-Schmidt正交化算法实现对干扰背景的预白化,通过归一化匹配滤波器可完成对水下目标回波的检测.对仿真数据和实验数据的处理验证了该方法的有效性. 相似文献