期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

梁海军王玄夏正洪《火力与指挥控制》2017,42(7)

基于摄像机的航空器识别是机场场面监视的重要工具。针对多摄像机场面航空器识别算法存在的计算效率低等缺点,提出基于GPU CUDA的加速算法。利用CUDA线程并行处理能力与GPU计算能力,对算法进行了重新设计与优化。通过实地对多路场面视频监视数据进行了多次实验,验证了在NVIDIA Geforce 8800GTS显卡上可实现10倍以上的加速性能,提高了航空器目标识别效率,可以满足机场场面监视中对航空器识别与跟踪的实时性要求。相似文献

2.

多GPU的可压缩湍流并行计算

下载免费PDF全文

曹文斌《国防科技大学学报》2015,37(3)

利用CUDA Fortran语言发展了一种基于GPU的计算流体力学可压缩湍流求解器。该求解器基于结构网格有限体积法,空间离散采用AUSMPW 格式,湍流模型为k-ω SST两方程模型,采用MPI实现并行计算。针对最新的GPU架构,讨论了通量计算的优化方法及GPU计算与PCIe数据传输、MPI通信重叠的多GPU并行算法。进行了超声速进气道及空天飞机等算例的数值模拟以验证GPU在大网格量情况下的加速性能。计算结果表明相对于Intel Xeon E5-2670 CPU单一核心的计算时间,单块NVIDIA GTX Titan Black GPU可获得107至125倍的加速比。利用四块GPU实现了复杂外形1.34亿网格的快速计算,并行效率为91.6%。相似文献

3.

基于GPU的SAR成像层次化并行处理研究

李东生何余洪雍爱霞《火力与指挥控制》2015,(6)

针对SAR成像处理具有的内在并行性,提出了一种基于GPU的SAR成像层次化并行处理方法。首先分析了SAR成像处理过程中信号的并行性,对任务进行了层次化分解与组合,设计了层次化并行的CS成像算法;然后通过CUDA编程将并行成像算法映射到CPU+GPUs系统平台上,实现了层次化并行成像处理;为了检验并行处理效果,采用原始数据进行了SAR成像处理实验。实验结果表明,在几乎没有损失图像质量的情况下,层次化并行处理获得了较高的加速比。相似文献

4.

一种利用CUDA技术实现雷达余辉效果的方法 总被引：1，自引：0，他引：1

王金波察豪刘峰《海军工程大学学报》2012,24(3):103-106

雷达PPI显示器余辉效果的好坏直接影响雷达模拟器的逼真程度,从而影响受训人员的训练效果。为实现高度逼真的雷达余辉效果,克服余辉模拟中坐标变换及余辉计算对运算速度需求较高的问题,利用新近出现的CUDA并行处理技术将在CPU上处理耗时较多的坐标变换及余辉计算搬移到GPU上来实现,克服了传统雷达余辉模拟方法中存在的不足。同时,传统余辉模拟方法中无法实现的高转速扫描余辉模拟,以及由于目标数据致使天线转速不稳等问题也得以解决,使用该方法可以实现导航等多型雷达的高转速扫描线余辉模拟。利用该方法研制的雷达训练模拟器已装备到某训练基地,用于雷达兵实际的教学、训练和考核,取得了良好的效果。相似文献

5.

基于MPI+CUDA的异构并行可压缩流求解器

下载免费PDF全文

刘枫李桦田正雨潘沙《国防科技大学学报》2014,36(1):6-10

在CPU/GPU异构体系结构计算集群上,建立了基于MPI+CUDA的异构并行可压缩流求解器。讨论了异构结构上的可压缩流并行算法的并行模式,在CPU上执行计算密集度低、指令复杂的计算任务,在GPU上执行计算密集度高、指令单一的计算任务。通过数个算例,对比了异构并行计算和传统CPU并行计算计算结果和计算效率。将该算法运用于高超声速流动的数值模拟中,数值结果显示,基于MPI+CUDA的异构并行可压缩流求解器鲁棒性好,计算效率较CPU同构并行计算提高10倍以上。相似文献

6.

基于波导干涉条纹的目标距离特征量提取方法

何青海李长军于雪泳《火力与指挥控制》2015,(7)

浅海波导中目标辐射噪声LOFAR谱图存在明暗相间的干涉条纹,从中可以提取出目标距离特征量信息,它反映了目标运动过程中的距离变化率。低信噪比情况下,条纹特征不够清晰,提取的距离特征量值精度会降低。提出了一种边缘定向增强型偏微分方程去噪方法,对LOFAR谱图进行处理,使条纹特征更加明显。海试数据处理结果表明,去噪处理后提取出的距离特征量精度明显提高。为满足实时性需要,提出了基于CUDA的距离特征量实时处理方法,实验结果表明能大幅提高算法运行速度。相似文献

7.

应用多GPU的可压缩湍流并行计算

下载免费PDF全文

曹文斌李桦谢文佳张冉《国防科技大学学报》2015,37(3):78-83

利用CUDA Fortran语言发展了基于图形处理器(GPU)的计算流体力学可压缩湍流求解器。该求解器基于结构网格有限体积法,空间离散采用AUSMPW+格式,湍流模型为k-ωSST两方程模型,采用MPI实现并行计算。针对最新的GPU架构,讨论了通量计算的优化方法及GPU计算与PCIe数据传输、MPI通信重叠的多GPU并行算法。进行了超声速进气道及空天飞机等算例的数值模拟以验证GPU在大网格量情况下的加速性能。计算结果表明:相对于Intel Xeon E5-2670 CPU单一核心的计算时间,单块NVIDIA GTX Titan Black GPU可获得107~125倍的加速比。利用四块GPU实现了复杂外形1.34亿网格的快速计算,并行效率为91.6%。相似文献