首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 750 毫秒
1.
二维 DFT 和 DCT 的 Systolic 阵列   总被引:1,自引:0,他引:1       下载免费PDF全文
超级计算中一个活跃的研究领域是将某些有限和,如离散富里叶变换(DFT)、离散余弦变换(DCT),映射到多处理机阵列上。本文首先通过二维DFT的行列分解算法流程图,给出了计算二维DFT的二种Systolic阵列:一种是由N_1个处理器组成的线性阵列,所花时间步为O(N_1N_2)(设二维DFT为N_1×N_2长的),与行列分解算法在单处理机上顺序执行所花时间相比,加速比为O(N)(设N_1=N_2=N)。这一结果无论是在时间消耗,还是在PE数量上都是目前最优的。另一种是由N_1×N_2个处理器组成的矩形阵列,所需时间为O(N_1+N_2),与行列算法在单处理机上顺序运行所花时间相比,加速比为O(N~2)(这里仍假定N_1=N_2=N)。本文还给出了二维DCT的与二维DFT相似的Systoilc阵列结构。不难将上述阵列推广到多维的情况。  相似文献   

2.
本文把长为N=N_1N_2(N_1为奇数)的离散Hartley变换(DHT)分解成N_1个长N_2的DHT及一些附加运算,附加运算也可以变成N_2个长N_1的DHT。由此得到计算它的一种MIMD并行算法,若用N_1台处理机并行计算,只需(?)个乘法步和(?)个加法步,这里M(N_2)和A(N_2)分别表示计算一个长N_2的DHT所需的乘法数及加法数。并行机的有效利用率接近于1。  相似文献   

3.
通过对有约束的Hartley域自适应算法、频域自适应算法及时域自适应算法用于自适应降噪系统的计算机仿真研究 ,认为在自适应通信降噪中采用基于Hartley变换的自适应算法较频域自适应算法及时域自适应算法性能更优、降噪效果更好 ,并在高速信号处理器TMS32 0C30上开发实现了该算法 .实验结果表明 ,将Hartley域自适应算法应用于通信降噪系统 ,方法实际可行  相似文献   

4.
为解决传统图像匹配算法计算量大,运算速度慢,难以满足图像匹配实时性要求的不足,提出基于离散哈特莱变换(DHT)的快速图像匹配算法,通过采用二维实函数的离散哈特莱变换和互相关运算,减少数据运算量和存储量,达到保持图像匹配精度,缩短图像匹配时间,提高匹配效率的效果。实验结果表明,该算法图像匹配精度高,匹配速度快,实时性好,有效提高了图像匹配的时效性。  相似文献   

5.
本文通过对离散富里叶变换(Discrete Fourier Transform,简记作DFT)矩阵的分解与FFT 算法相结合,提出了一个计算DFT 的新算法。由对矩阵的分解把求N=2~t 点的DFT 问题化为求16个N/16阶方阵与相应列向量相乘的问题(N≥16)。从而减少了乘法运算次数,且还具有良好的并行运算性质。  相似文献   

6.
本文讨论了二维离散余弦变换(DCT)的快速计算。借助于下标分解,我们将一个N1×N2点二维DCT分解为四个N1/2×N2/2点二维DCT,从而导出了二维DCT的一种快速递归分解算法。对N1×N2点二维实DCT的计算,其算术复杂性为O(N1N2log2N1N2)。与文[6]提供的混合算法类同,乘法量比行列算法减少约25%。  相似文献   

7.
二维离散余弦/反余弦变换是图像处理算法的核心。基于DSP处理器或软件实现速度较低,以及ASIC实现芯片的面积和功耗都较大,本文研究了一种基于行列分解结构的二维DCT/IDCT变换,在两级一维DCT/IDCT变换之间插入双RAM结构,通过乒乓操作保证了前后级DCT/IDCT运算的并行性,提高了运算速度。电路结构在QuartusII中进行了逻辑综合,通过Modelsim编写激励对逻辑功能进行了仿真验证,并将仿真结果与Mat—lab仿真结果进行了比较。结果表明该模块功能正确,能够为图像处理提供良好的处理性能。  相似文献   

8.
在分析多光谱图像小波变换后系数特点的基础上,提出了一种基于整数小波变换的3维集合分裂嵌入块编码(3D SPECK)压缩方法。该方法将小波变换压缩技术中的零树编码推广到多光谱图像压缩中,采用整数小波变换去除空间冗余,对单波段图像,采用2D SPECK编码,对多波段图像,谱域上构成的小波矢量采用离散余弦变换(DCT)进行变换,对变换后的系数进行3D SPECK编码。实验结果表明,该方法硬件实现简单,编码解码时间快,对内存要求低。  相似文献   

9.
本文利用快速多项式变换(FPT)计算N×M 型二维DFT(M=2~m,N=2~(m-r+1),1≤r≤m),所需的乘法及加法次数(复乘及复加)分别为M_u=1/2NMlog_2M-3/2NM+N~2+N(1+log_2M-log_2N)A_d=NMlog_2NM,与通常的以2为基的二维FFT 比较,加法次数相同,乘法次数减少约30—40%,从而提高了计算精度。本算法还适用于并行算法。  相似文献   

10.
研究利用神经网络实现超分辨雷达成像。该方法首先根据Tuff的前后向线性预测(FBLP)方程用神经网络得到样本序列的AR模型参数,然后利用神经网络作线性预测外推,再用神经网络对外推后的数据作离散哈特来变换(DHT)。从哈特来变换可以方便地得到外推数据的离散傅里叶变换,从而得到距离-多普勒超分辨雷达像。利用微波暗室数据对这一方法进行了数字仿真,结果表明这种方法是可行的,即使在低信噪比下也有较好的性能。  相似文献   

11.
大尺寸滑动窗口的应用在数据输入速度与处理速度之间存在较大差距.为了缩短差距,提出了一种并行计算模型,使用尽可能少的存储资源与尽可能简单的存储器读写控制逻辑实现了尽可能高的数据重用性与并行性.该模型将不同滑动窗口之间的并行处理与单个窗口内不同数据之间的并行处理结合起来:对于不同窗口,按列进行分组并映射到多个处理单元上并行...  相似文献   

12.
神经计算机及其研究进展   总被引:1,自引:0,他引:1       下载免费PDF全文
本文分析比较了神经计算机与传统计算机的联系与区别。在软件实现、虚拟实现和全硬件实现三个方面,综述了近年来国际神经计算机的研究进展。最后,在就神经网络的兴衰原因提出自己的不同看法后,对神经计算机的发展方向作了展望。  相似文献   

13.
空时自适应处理(STAP)权值计算有数据域和均方域两种方法,分别以QR分解和样本协方差矩阵求逆(SMI)方法为代表.QR分解方法可以映射到脉动阵上并行实现,但实现复杂且设计成本较高;SMI方法实现则相对简单,但需要对样本协方差矩阵直接求逆.首先考察了不同矩阵求逆方法的内在并行性,基于DSP支持的片内并行技术,提出并实现了SMI方法的单DSP分块并行处理,进一步给出了数值稳定性分析和改善方法,实验结果证明了方法的有效性.  相似文献   

14.
遥感图像自动配准的串行与并行策略研究   总被引:1,自引:1,他引:1       下载免费PDF全文
面对数据量呈指数增长的全球遥感图像,研究快速、有效、高精度的自动图像配准算法成为遥感领域迫切需要解决的问题。综述了遥感图像自动配准算法的研究现状和关键技术,且从新的角度分类总结了已有算法的特点及适用情况,并给出了综合的解决方案;同时研究并提出了三种新的并行策略,获得了较好的实验结论。由于算法采用粗粒度的数据并行方法,因此可扩展性和可移植性较好,无论在理论上还是在实践上都能为实际的遥感应用提供有益的指导和借鉴。最后提出了有待进一步研究的问题。  相似文献   

15.
在设计高实时性的系统时,针对基于DSP、单片机等串行运算方式的单核控制器无法实现高实时性的问题,利用FPGA的并行运行优点构建了基于DSP+FPGA的双核控制器,以达到提高系统实时性的目的。通过分析系统总体结构,主要设计完成了系统总线构架、DA电路、CAN总线和PROM电路,然后通过软件编程来验证硬件设计。经调试分析,该系统各部分运行正常,可为研究设计高实时性的控制器提供参考和借鉴。  相似文献   

16.
针对单站光测图像,提出一种基于目标形状特征的三维姿态测量方法。在已知飞机外形尺寸、光测设备成像参数以及飞机与光测设备之间距离的情况下,根据飞机参考平面(水平机翼所在平面)与成像平面平行和不平行时成像尺寸的差异,可以估计出飞机参考平面相对于成像平面的位置关系,从而得到飞机相对于摄像坐标系的三维姿态,再通过坐标转换即可得到飞机相对于大地坐标系的三维姿态。该方法充分利用了目标和成像设备的先验知识,避免了复杂的模型匹配过程,具有较好的准确度和实时性,对目标的精确控制和跟踪具有重要意义。  相似文献   

17.
随着计算机多核处理器的高速发展,多核并行计算在各领域发展研究的重要性已逐渐突显,分析了当前典型的并行编程模型,在PCAM设计过程的基础上提出了多核并行算法的设计过程,运用OpenMP编程模型完成了一种目标分配算法的多核并行化设计,通过实验及性能分析,验证了并行目标分配算法相较于传统串行算法在计算效率上的优势。  相似文献   

18.
针对国防科技大学自主研发的异构多核数字信号处理(digital signal processing, DSP)芯片的特征以及卷积算法自身特点,提出了一种面向多核DSP架构的高性能多核并行卷积实现方案。针对1×1卷积提出了特征图级多核并行方案;针对卷积核大于1的卷积提出了窗口级多核并行优化设计,同时提出了逐元素向量化计算的核内并行优化实现。实验结果表明,所提并行优化方法实现单核计算效率最高能达到64.95%,在带宽受限情况下,多核并行扩展效率可达到48.36%~88.52%,在典型网络ResNet50上的执行性能与E5-2640 CPU相比,获得了5.39倍性能加速。  相似文献   

19.
运用树网结构可以完成矩阵的并行快速求逆,其中迭代法是一种非常重要的方法。本文给出了一种新的迭代格式,对任意非奇异矩阵A,运用新的迭代格式对A求逆相对于经典牛顿迭代法,在同样精度要求下,时间可减少一半。  相似文献   

20.
并行面向对象数据库中的查询优化   总被引:1,自引:0,他引:1       下载免费PDF全文
为了在开发并行性的同时,进一步提高查询处理的效率,本文针对并行面向对象数据库的异步并行查询执行模型的特点,提出了三种并行查询优化策略:(1)数据子集预选策略;(2)信息流延迟策略;(3)信息流消减策略。它们既适用于单查询处理,又适用于多查询处理,测试结果表明它们是实用有效的并行查询优化策略。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号