排序方式: 共有21条查询结果,搜索用时 13 毫秒
1.
针对SMP机群,探讨了分别利用单机优化、OpenMP与MPI从指令级、共享存储级与分布主存级三个层次上改善矩阵并行乘Fox算法性能的方法。并通过调用数学函数库与混合编程的方式,在深腾6800上进行了实验,取得了相当满意的数值效果。 相似文献
2.
采用基于列交换的Gauss-Jordan并行算法来解决空气动力学中超音速高阶面元法的稠密矩阵求逆问题,该方法采取了块循环数据分配方式,尤其对超立方体结构的并行机系统来说具有通讯优势。在4台SGI工作站构成的2×2网格上进行的实验表明,对秩为1000左右的矩阵可得到57%~64%的效率。 相似文献
3.
本文针对对称矩阵A建立起性态数的并行计算公式,并通过数值试验得到了矩阵性态数变化对方程组Ax=b的解的误差影响,同时进行了向量和标量计算,计算结果表明:当x大于等于300时,向量计算速度比标量计算速度快17倍。 相似文献
4.
运用树网结构可以完成矩阵的并行快速求逆,其中迭代法是一种非常重要的方法。本文给出了一种新的迭代格式,对任意非奇异矩阵A,运用新的迭代格式对A求逆相对于经典牛顿迭代法,在同样精度要求下,时间可减少一半。 相似文献
5.
本文介绍了巨型机通用数学库软件的概念和意义,指出了巨型机数学软件开发的技术途径与发展趋势,讨论了并行算法在其中的关键性作用,结合实例分析了巨型机通用数学库软件研制中的并行算法设计与实现。 相似文献
6.
超级计算中一个活跃的研究领域是将某些有限和,如离散富里叶变换(DFT)、离散余弦变换(DCT),映射到多处理机阵列上。本文首先通过二维DFT的行列分解算法流程图,给出了计算二维DFT的二种Systolic阵列:一种是由N_1个处理器组成的线性阵列,所花时间步为O(N_1N_2)(设二维DFT为N_1×N_2长的),与行列分解算法在单处理机上顺序执行所花时间相比,加速比为O(N)(设N_1=N_2=N)。这一结果无论是在时间消耗,还是在PE数量上都是目前最优的。另一种是由N_1×N_2个处理器组成的矩形阵列,所需时间为O(N_1+N_2),与行列算法在单处理机上顺序运行所花时间相比,加速比为O(N~2)(这里仍假定N_1=N_2=N)。本文还给出了二维DCT的与二维DFT相似的Systoilc阵列结构。不难将上述阵列推广到多维的情况。 相似文献
7.
关于对称三对角矩阵特征值问题,本文提出一种新的分治算法。新算法以二分法、割线法迭代为基础。不同于Cuppen’s方法和Laguerre迭代法。理论分析和数值实验的结果表明:新算法的收敛速度明显比文[1]中的Laguere迭代法快。在相同的精度要求下,当问题规模较大时,使用新算法能减少40%以上的计算时间 相似文献
8.
解题环境旨在最大限度地方便用户求解问题。ELLPACK是求解椭圆型偏微分方程的解题环境。本文分析了它的内部机制,并为它增加了一个线性方程识别器。 相似文献
9.
讨论了多维 DCT和多维 DWT的并行行列算法和并行多项式变换算法 ,并用 Log P模型对算法进行了分析。在仔细分析一维和二维离散小波变换与小波包变换计算结构的基础上 ,提出了它们的并行算法。算法只需相对较少的通信时间 ;适合大规模并行机 ( MPP)和工作站或微机机群系统 ;方法也适合信号处理中的各种塔式分解过程。用 Fortran语言和 PVM编制了算法的程序。在机群系统和大规模并行机上的实验表明 ,算法是正确的且具有较高的加速比。 相似文献
10.
本文对一维、二维椭圆型方程建立了Chebyshev拟谱区域分解格式,对这种拟谱区域分解格式给出了一种等价的广义变分形式。 相似文献