排序方式: 共有54条查询结果,搜索用时 140 毫秒
51.
模型深度的不断增加和处理序列长度的不一致对循环神经网络在不同处理器上的性能优化提出巨大挑战。针对自主研制的长向量处理器FT-M7032,实现了一个高效的循环神经网络加速引擎。该引擎采用行优先矩阵向量乘算法和数据感知的多核并行方式,提高矩阵向量乘的计算效率;采用两级内核融合优化方法降低临时数据传输的开销;采用手写汇编优化多种算子,进一步挖掘长向量处理器的性能潜力。实验表明,长向量处理器循环神经网络推理引擎可获得较高性能,相较于多核ARM CPU以及Intel Golden CPU,类循环神经网络模型长短记忆网络可获得最高62.68倍和3.12倍的性能加速。 相似文献
52.
本文首先提取了分布共享存储系统(DSM)中程序访存行为的几个重要参数,并以此建立了一个处理机效率模型。在此模型基础上分析了访存行为的各种因素对处理机效率的影响情况,文章最后给出了提高处理机效率的几种技术途径。 相似文献
53.
54.
空间矢量脉宽调制的研究 总被引:4,自引:2,他引:2
对空间矢量脉宽调制(SVPWM)的理论进行了较详细的讨论.利用DSP电机控制器TMS320F240实现SVPWM,分析了该方法的特点,并给出了相应的实验结果. 相似文献