首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   1篇
  免费   2篇
  2023年   1篇
  2012年   1篇
  1990年   1篇
排序方式: 共有3条查询结果,搜索用时 79 毫秒
1
1.
矩阵转置是矩阵运算的基本操作,广泛应用于信号处理、科学计算以及深度学习等各种领域。随着国防科技大学自主研制的飞腾异构多核数字信号处理器(digital signal processor, DSP)在各种领域中的推广应用,对高性能矩阵转置实现提出了强烈需求。针对飞腾异构多核DSP的体系结构特征与矩阵转置操作的特点,提出了一种适配不同数据位宽(8 B、4 B以及2 B)矩阵的并行矩阵转置算法ftmMT。该算法基于DSP中向量处理单元的Load/Store部件实现了向量化,同时基于矩阵分块实现了多个DSP核的并行处理,通过隐式乒乓设计实现了片上向量化转置与片外访存的重叠以及访存性能的大幅提升。实验结果表明,ftmMT能够显著加快矩阵转置操作,与CPU上的开源转置库HPTT相比,可获得高达8.99倍的性能加速。  相似文献   
2.
在外部条件既定的情况下,中国军工能否有效实现结构开放效应,主要取决于军工开放战略定位、政策目标选择和运行机制效率。在军工开放战略上,应科学定位为结构优化开放战略模式,有效促进武器装备结构升级;在产业目标选择中,应分类进行、逐步实施,形成有序竞争的开放式能力发展格局;在完善运行机制方面,应以增强军工结构开放的转置能力为主,建立高效的选择机制、传导机制和创新机制。  相似文献   
3.
本文给出一个数据体积超过计算机可用内存容量的n×n 矩阵快速转置的新方法。与常用的算法相比,所需的计算时间显著减小。  相似文献   
1
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号