共查询到18条相似文献,搜索用时 31 毫秒
1.
矩阵转置是矩阵运算的基本操作,广泛应用于信号处理、科学计算以及深度学习等各种领域。随着国防科技大学自主研制的飞腾异构多核数字信号处理器(digital signal processor, DSP)在各种领域中的推广应用,对高性能矩阵转置实现提出了强烈需求。针对飞腾异构多核DSP的体系结构特征与矩阵转置操作的特点,提出了一种适配不同数据位宽(8 B、4 B以及2 B)矩阵的并行矩阵转置算法ftmMT。该算法基于DSP中向量处理单元的Load/Store部件实现了向量化,同时基于矩阵分块实现了多个DSP核的并行处理,通过隐式乒乓设计实现了片上向量化转置与片外访存的重叠以及访存性能的大幅提升。实验结果表明,ftmMT能够显著加快矩阵转置操作,与CPU上的开源转置库HPTT相比,可获得高达8.99倍的性能加速。 相似文献
2.
随着计算机体系结构的发展,高速缓存(cache)的引入,分块方法成为矩阵计算中性能优化的主要方法,而矩阵主维对分块算法的性能影响很大。本文分析了矩阵主维影响性能的原因以及如何选取主维来改善性能,并与拷贝方法进行了比较。最后用矩阵乘法和LU分解进行了试算,取得了满意的结果 相似文献
3.
余品能 《工程兵工程学院学报》1996,11(1):72-76
借助于快速付里叶变换,本文给出求两r-循环阵之乘积阵的一种快速算法,其算术复杂性为0(Nlog2N),其中N为r-循环阵的阶。特别地,分别取r=1和-1,我们便得到有关求循环阵、斜循环阵之积的快速算法。 相似文献
4.
由于计算误差等因素的影响,致使滤波协方差阵不对称或负定,从而导致滤波器发散,影响滤波算法的收敛速度和稳定性。在机动加速度\"当前\"统计自适应卡尔曼滤波算法的基础上,引入了基于Q-R矩阵分解的自适应卡尔曼滤波算法。将协方差阵分解为两个矩阵的乘积,来保证协方差矩阵的正定性。仿真结果表明,该算法可以较好地跟踪机动目标,具有精度高、稳定好、收敛快等特点。 相似文献
5.
基于对火控系统命中函数的考察,提出了一种将简单迭代法、改进迭代法和快速迭代法相结合的改进算法。仿真结果表明,该方法能明显提高解算精度,减小计算量,缩短迭代时间。 相似文献
6.
余品能 《工程兵工程学院学报》1998,13(2):82-88
一些实际应用表明,对实序列数据处理Hartley变换比富反变换更有效更经济。本文首先从代数角度出发,给出离散Hartley变换(DHT)系列阵的一种块分解式,籍此导出计算N=2^t点实序列DHT的一种快速递归算法,其算术复杂性为M=1/2Nlog2N+O(N)个实乘和A=11/2Nlog2N+O(N)个实加。显然该递归算法属目前复杂性最低的一类算法。 相似文献
7.
为解决当样本数据不断增加时,利用传统方法反复计算样本协方差迹耗时多的缺点,提出了一种快速递推算法。理论分析和仿真试验都表明,算法的时间复杂度比传统的方法降低了一个数量级,从而大大减少了计算时间。 相似文献
8.
9.
本文指出文献(1)中关于矩阵幂级数ΣK=0 A^K收敛的一个错误命题,给出ΣK=0 A^K收敛的一个有重要理论与实用价值的定理,并讨论一般矩阵幂级数ΣK=0 akA^k收敛的必要以及充分条件。 相似文献
10.
提出了一种行之有效的执行算法——换顶算法,对无向图权值矩阵的数据进行有效处理,通过交换顶点来寻找一条较优Hamilton圈。在整个过程中,权值矩阵的上三角数据为有效数据,只需要按一定的顶点交换规则对这部分数据进行调整就可以达到优化Hamilton圈的目的。提出了交换规则的思想,且通过选择适当的规则,先判定可行性再执行交换算法,节省了大量的运算时间,降低了算法的时间复杂性。该算法也适用于Hamilton链的情况。 相似文献
11.
为了解决坦克驾驶训练中因操作状态难以保留、操作细节难以再现而无法实现对训练成果深入分析与客观评价的不足,以坦克驾驶训练数字化记录与评判系统总体设计为切入点,基于基础驾驶动作的分解与组合以及车辆状态信息获取设计了驾驶动作记录仪,实现了坦克驾驶训练过程中动作状态信息的采集与数字化存储,并应用矩阵变换理论,提出了一种基于关键性动作参数查找与判断的方法,对基础驾驶动作进行了过程识别与效果评判。分析表明:该系统的技术能对坦克驾驶动作状态进行数字化记录,而基于状态矩阵变换的方法能实现基本驾驶过程的识别与评判。 相似文献
12.
空时自适应处理(STAP)权值计算有数据域和均方域两种方法,分别以QR分解和样本协方差矩阵求逆(SMI)方法为代表.QR分解方法可以映射到脉动阵上并行实现,但实现复杂且设计成本较高;SMI方法实现则相对简单,但需要对样本协方差矩阵直接求逆.首先考察了不同矩阵求逆方法的内在并行性,基于DSP支持的片内并行技术,提出并实现了SMI方法的单DSP分块并行处理,进一步给出了数值稳定性分析和改善方法,实验结果证明了方法的有效性. 相似文献
13.
不同增强体镁基复合材料的阻尼性能 总被引:4,自引:0,他引:4
研究了短切碳纤维、碳化硅晶须、硼酸铝晶须为增强体的镁基复合材料在外加载荷下的阻尼性能,测量了它们的力学性能与断口特性。研究表明:增强体不同的镁基复合材料,阻尼性能不同;在所研究的几种增强体复合材料中,以短切碳纤维增强镁基复合材料的阻尼效果最好;短切碳纤维增强铁基复合材料界面对内耗有明显的影响。 相似文献
14.
讨论了快擦写存储器典型位元结构及其存储信息原理,详细论述了目前广泛使用的或非和与非两种结构的快擦写存储矩阵的结构组成和工作原理。 相似文献
15.
武警部队开进路线问题的蚂蚁算法研究 总被引:1,自引:0,他引:1
王周缅 《武警工程学院学报》2010,(2):8-11
部队开进路线问题是类似于TSP的NP问题。本文将蚂蚁算法应用于部队开进路线问题中,在综合考量每条路径的通行条件、隐蔽性、迂回道路数量基础上,通过层次分析法求出每条路径的权值,进而运用蚂蚁算法原理对问题设计算法。算法用Delphi实现,通过对实际部队开进路线问题的测试,得到较好结果。相对于传统的经验选择路径方法,此方法更少依赖选择主体的主观性,从而更具客观性与可重复性。 相似文献
16.
采样协方差矩阵求逆是空时抗干扰算法的基本运算单元,但由于其运算量随时域抽头个数急剧增长,直接限制了空时抗干扰技术在卫星导航接收机中的应用。针对该问题,提出了基于块Toeplitz矩阵快速求逆的空时抗干扰方法。通过采用新的协方差矩阵近似计算方法,使得该矩阵同时为块Toeplitz矩阵与Hermite矩阵,并运用块Toeplitz矩阵的快速求逆算法,将时域抽头个数为K的计算复杂度从O[K3]降至O[K2]。理论分析和仿真结果表明,在阵元数为4、时域抽头为15的典型情况下,相比现有矩阵求逆方法,该算法的抗干扰性能损耗小于1d B,但计算量可降低约2/3。 相似文献
17.
为满足航天大容量存储系统对高速存储及数据完整的需求,实现了一个基于NAND型内存的高性能控制器,提出了一种实现于NAND型内存芯片内部的流水编程机制,以及一种可以保证数据无缝连接的坏块处理机制。介绍了存储控制器的各个模块设计,并分析了不同情况编程机制所需的时间计算方法,建立仿真模型,利用蒙特卡洛方法仿真并讨论了流水编程机制的性能优化效果。在实际硬件平台验证了流水编程机制和坏块处理机制,结果表明该大容量存储系统的存储速率可达100MB/s,读取数据与存入数据保持一致,数据无乱序无丢失。 相似文献
18.
运用树网结构可以完成矩阵的并行快速求逆,其中迭代法是一种非常重要的方法。本文给出了一种新的迭代格式,对任意非奇异矩阵A,运用新的迭代格式对A求逆相对于经典牛顿迭代法,在同样精度要求下,时间可减少一半。 相似文献