共查询到10条相似文献,搜索用时 31 毫秒
1.
提出一种基于融合乘加指令加速FFT计算的向量化方法,通过变换FFT的蝶形单元运算流程,将传统计算方式中独立的乘法和加法操作组合成次数更少的融合乘加操作,使得DIT基2 FFT算法的蝶形单元计算的实数浮点操作由原来的10次乘(加)操作减少到6次融合乘加操作,DIT基4 FFT算法的蝶形单元计算的实数浮点操作由原来的34次乘(加)操作减少到24次融合乘加操作;优化了蝶形因子的向量访问,减少存储开销。实验结果表明,提出的方法能够显著加速FFT的计算,取得高效的计算性能和效率。 相似文献
2.
融合乘加指令加速快速傅里叶变换计算的向量化方法,通过变换快速傅里叶变换的蝶形单元运算流程,将传统计算方式中独立的乘法和加法操作组合成次数更少的融合乘加操作,使得时间抽取法基2快速傅里叶变换算法的蝶形单元计算的实数浮点操作由原来的10次乘(加)操作减少到6次融合乘加操作,时间抽取法基4快速傅里叶变换算法的蝶形单元计算的实数浮点操作由原来的34次乘(加)操作减少到24次融合乘加操作;优化了蝶形因子的向量访问,减少存储开销。实验结果表明,提出的方法能够显著加速快速傅里叶变换的计算,取得高效的计算性能和效率。 相似文献
3.
针对定点FFT处理器精度不高的缺点,提出了浮点格式FFT处理器的FPGA硬件实现方案。详细阐述了FFT处理器的自定制浮点格式确定、算法选择和浮点加法实现等关键技术。该处理器已投入使用,工作性能稳定,系统时钟80MHz,完成1024点FFT IFFT运算只需64μs,误差小于-80dB。 相似文献
4.
在部分低精度浮点运算应用中,需要流水的浮点倒数近似值运算。本文基于SRT-4算法设计并实现了一种流水的浮点倒数近似值运算部件。该部件采用6级流水线结构,运算结果精度至少为8位有效尾数。为了支持对非规格化浮点数的硬件处理,还设计并实现了改进版,有利于进一步提高浮点倒数近似值运算的性能。改进版采用8级流水线结构,新增了源操作数预规格化和结果后规格化功能模块,可以实现对非规格化浮点数的硬件处理。经过逻辑综合评估,改进版的硬件开销是面积在合理范围内增加19.23%,且对时序没有明显影响,可以满足预期的1.6 GHz频率设计目标。 相似文献
5.
6.
黄新民 《国防科技大学学报》1982,(4):165-177
本文通过对离散富里叶变换(Discrete Fourier Transform,简记作DFT)矩阵的分解与FFT 算法相结合,提出了一个计算DFT 的新算法。由对矩阵的分解把求N=2~t 点的DFT 问题化为求16个N/16阶方阵与相应列向量相乘的问题(N≥16)。从而减少了乘法运算次数,且还具有良好的并行运算性质。 相似文献
7.
8.
9.
提出了一种基于DFT系数极值的单频信号频率的高精度迭代估计方法,该方法根据DFT谱线使用截弦法解算DFT系数极值所在谱线的位置,进而估计单频信号频率。在估计过程中,直接对DFT幅度最大的谱线进行小数频移以获得新的谱线,从而减少频率采样间隔提高估计精度;同时通过迭代估计消除频率依赖性,提高估计性能。仿真结果表明该方法的频率估计精度在任意频率处均接近于克拉美罗下限,其运算量为Nlog2N+4N次复乘法运算,仅比传统的基于DFT插值的估计算法增加4N次复乘法运算,其中N为DFT运算时所采用的数据点数。 相似文献
10.
为解决传统选星算法在定位精度与运算复杂度之间的矛盾,提出了一种基于行列式值的改进选星算法,并从运算量的复杂度、消耗时间的长短、定位精度的高低3个方面与传统最小几何精度因子(GDOP)算法相比较。仿真结果表明:改进选星算法80%以上的GDOP相对比值小于10%,所需计算时间明显小于传统最小GDOP方法,且避免了大量的矩阵乘法和求逆运算,证明了该改进选星算法具有计算复杂度低、耗时短、精度较高的优点。 相似文献