首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   1篇
  免费   20篇
  2006年   1篇
  2004年   1篇
  2002年   1篇
  2001年   1篇
  2000年   2篇
  1997年   3篇
  1996年   2篇
  1994年   1篇
  1993年   2篇
  1992年   1篇
  1991年   1篇
  1990年   1篇
  1989年   2篇
  1986年   1篇
  1985年   1篇
排序方式: 共有21条查询结果,搜索用时 86 毫秒
1.
利用混合编程改善SMP机群上并行矩阵乘法的性能   总被引:1,自引:1,他引:0       下载免费PDF全文
针对SMP机群,探讨了分别利用单机优化、OpenMP与MPI从指令级、共享存储级与分布主存级三个层次上改善矩阵并行乘Fox算法性能的方法。并通过调用数学函数库与混合编程的方式,在深腾6800上进行了实验,取得了相当满意的数值效果。  相似文献   
2.
采用基于列交换的Gauss-Jordan并行算法来解决空气动力学中超音速高阶面元法的稠密矩阵求逆问题,该方法采取了块循环数据分配方式,尤其对超立方体结构的并行机系统来说具有通讯优势。在4台SGI工作站构成的2×2网格上进行的实验表明,对秩为1000左右的矩阵可得到57%~64%的效率。  相似文献   
3.
本文针对对称矩阵A建立起性态数的并行计算公式,并通过数值试验得到了矩阵性态数变化对方程组Ax=b的解的误差影响,同时进行了向量和标量计算,计算结果表明:当x大于等于300时,向量计算速度比标量计算速度快17倍。  相似文献   
4.
运用树网结构可以完成矩阵的并行快速求逆,其中迭代法是一种非常重要的方法。本文给出了一种新的迭代格式,对任意非奇异矩阵A,运用新的迭代格式对A求逆相对于经典牛顿迭代法,在同样精度要求下,时间可减少一半。  相似文献   
5.
本文介绍了巨型机通用数学库软件的概念和意义,指出了巨型机数学软件开发的技术途径与发展趋势,讨论了并行算法在其中的关键性作用,结合实例分析了巨型机通用数学库软件研制中的并行算法设计与实现。  相似文献   
6.
二维 DFT 和 DCT 的 Systolic 阵列   总被引:1,自引:0,他引:1       下载免费PDF全文
超级计算中一个活跃的研究领域是将某些有限和,如离散富里叶变换(DFT)、离散余弦变换(DCT),映射到多处理机阵列上。本文首先通过二维DFT的行列分解算法流程图,给出了计算二维DFT的二种Systolic阵列:一种是由N_1个处理器组成的线性阵列,所花时间步为O(N_1N_2)(设二维DFT为N_1×N_2长的),与行列分解算法在单处理机上顺序执行所花时间相比,加速比为O(N)(设N_1=N_2=N)。这一结果无论是在时间消耗,还是在PE数量上都是目前最优的。另一种是由N_1×N_2个处理器组成的矩形阵列,所需时间为O(N_1+N_2),与行列算法在单处理机上顺序运行所花时间相比,加速比为O(N~2)(这里仍假定N_1=N_2=N)。本文还给出了二维DCT的与二维DFT相似的Systoilc阵列结构。不难将上述阵列推广到多维的情况。  相似文献   
7.
关于对称三对角矩阵特征值问题,本文提出一种新的分治算法。新算法以二分法、割线法迭代为基础。不同于Cuppen’s方法和Laguerre迭代法。理论分析和数值实验的结果表明:新算法的收敛速度明显比文[1]中的Laguere迭代法快。在相同的精度要求下,当问题规模较大时,使用新算法能减少40%以上的计算时间  相似文献   
8.
解题环境旨在最大限度地方便用户求解问题。ELLPACK是求解椭圆型偏微分方程的解题环境。本文分析了它的内部机制,并为它增加了一个线性方程识别器。  相似文献   
9.
基于硬件计数器的MPEG4视频应用性能特征分析   总被引:1,自引:0,他引:1       下载免费PDF全文
通过指令集扩展来增强多媒体应用性能是微处理器发展的一个趋势,IntelMMX、SSE和SSE2是很好的例子。但应用本身的特点是否支持这些体系结构特性,应用软件是否充分发挥了多媒体指令集的潜力,都是值得关注的问题。采用动态Profiling的方法,研究MPEG4视频应用在基于IntelP4处理器的桌面机上的性能特性,使用硬件计数器工具来获取指令级的性能数据,并进行了深入分析。发现MPEG4播放软件较好地利用了IntelP4的64位MMX指令集,但对SSE和SSE2指令集几乎没有利用上;两级Cache不命中导致的性能损失很大。为提高视频播放性能,改进存储层次设计与优化播放软件比改进多媒体指令集更加有效。  相似文献   
10.
文中就解Dirichlet 边界条件的Poisson 方程给出了FACR(L)算法及其并行实现过程,讨论了FACR(L)算法的计算复杂性,给出了针对向量机YH—1的算法的参数L 的优选公式,在YH—1机上得到了较为理想的,数值试验结果。  相似文献   
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号