排序方式: 共有61条查询结果,搜索用时 15 毫秒
21.
多核系统中末级Cache是影响整体性能的关键。为了提出一种细粒度、低延迟、低代价的末级共享Cache资源管理机制,将系统性能目标转换为每个内核当前占用Cache资源的替换概率,以决定每个内核能够提供的被替换资源的数量;对某个需要增加Cache资源的内核,从可提供被替换资源的候选内核中选出距离较近且替换概率较高的一个内核,并以Cache块为粒度进行替换,从而实现Cache资源在不同内核间的动态划分。与传统以相联度为粒度的粗粒度替换机制相比,以Cache块为单位的替换机制具有更细的替换粒度,灵活性更高。另外,通过将位置信息和替换概率结合,保证了Cache资源与相应内核在物理布局上的收敛,降低了访问延迟。同时,所提出的方法只需要增加极少的硬件代价。实验结果表明,根据实验场景和对比对象的不同,所提方法与其他已有研究成果相比,可以实现从6.8%到22.7%的性能提升。 相似文献
22.
针对国防科技大学自主研发的异构多核数字信号处理(digital signal processing, DSP)芯片的特征以及卷积算法自身特点,提出了一种面向多核DSP架构的高性能多核并行卷积实现方案。针对1×1卷积提出了特征图级多核并行方案;针对卷积核大于1的卷积提出了窗口级多核并行优化设计,同时提出了逐元素向量化计算的核内并行优化实现。实验结果表明,所提并行优化方法实现单核计算效率最高能达到64.95%,在带宽受限情况下,多核并行扩展效率可达到48.36%~88.52%,在典型网络ResNet50上的执行性能与E5-2640 CPU相比,获得了5.39倍性能加速。 相似文献
23.
本文介绍了TMS320C31的软件开发和编程方法.着重介绍了TMS320C3X的C语言编译器及其优化方法,介绍了C和汇编语言接口的两种方法及用汇编语言编程时应注意的几个方面。 相似文献
24.
25.
26.
Java异常处理与编程方法 总被引:1,自引:1,他引:0
异常处理是程序开发的一个重要内容,异常处理的好坏关系到程序的友好程度和系统的健壮性。Java是一种纯面向对象的编程语言,其异常处理编程和普通的编程语言有很多不同的地方。分析了Java语言异常处理的内部机制,对可能出现的异常情况进行了分类,总结了编程处理异常问题时应该采用的方法以及编写异常语句使用的原则技巧。 相似文献
27.
矩阵乘卷积算法能够为各种卷积配置提供高性能基础实现,是面向给定芯片进行卷积性能优化的首要选择。针对国防科技大学自主研制的飞腾异构多核数字信号处理器(digital signal processor, DSP)芯片的特征以及矩阵乘卷积算法自身的特点,提出了一种面向多核DSP架构的高性能并行矩阵乘卷积实现算法ftmEConv。该算法由输入特征图转换、卷积核转换、矩阵乘以及输出特征图转换这四个均运行在通用多核DSP上的并行化部分构成,通过有效挖掘通用DSP核中功能单元的潜力来提升各个部分的性能。实验结果表明,ftmEConv实现了高达42.90%的计算效率,与芯片上的其他矩阵乘卷积算法实现相比,获得了高达7.79倍的性能加速。 相似文献
28.
29.
通过对常用聚类算法的研究,指出了MST聚类算法的优越性,并依据其具体实现步骤,结合Matlab软件基于矩阵运算的特点,提出了一种计算机编程思想,给出了具体流程和仿真结果。 相似文献
30.