首页 | 本学科首页   官方微博 | 高级检索  
     

并行规约与扫描原语在ReRAM架构上的性能优化
引用本文:金洲,段懿洳,伊恩鑫,戢昊男,刘伟峰. 并行规约与扫描原语在ReRAM架构上的性能优化[J]. 国防科技大学学报, 2022, 44(5): 80-91
作者姓名:金洲  段懿洳  伊恩鑫  戢昊男  刘伟峰
作者单位:中国石油大学北京 信息科学与工程学院, 北京 102249
基金项目:国家自然科学基金资助项目(61972415);计算机体系结构国家重点实验室开放课题资助项目(CARCHA202115)
摘    要:规约与扫描是并行计算中的核心原语,其并行加速至关重要。然而,冯·诺依曼体系结构下无法避免的数据移动使其面临“存储墙”等性能与功耗瓶颈。近来,基于ReRAM等非易失存储器的存算一体架构支持的原位计算可一步实现矩阵-向量乘,已在机器学习与图计算等应用中展现了巨大的潜力。提出面向忆阻器存算一体架构的规约与扫描的并行加速方法,重点阐述基于矩阵-向量乘运算的计算流程和在忆阻器架构上的映射方法,实现软硬件协同设计,降低功耗并提高性能。相比于GPU,所提规约与扫描原语可实现高达两个数量级的加速,平均加速比也可达到两个数量级。分段规约与扫描最大可达到五个(平均四个)数量级的加速,并将功耗降低79%。

关 键 词:规约  扫描  ReRAM  存算一体架构  并行计算
收稿时间:2021-12-27

Accelerating parallel reduction and scan primitives on ReRAM-based architectures
JIN Zhou,DUAN Yiru,YI Enxin,JI Haonan,LIU Weifeng. Accelerating parallel reduction and scan primitives on ReRAM-based architectures[J]. Journal of National University of Defense Technology, 2022, 44(5): 80-91
Authors:JIN Zhou  DUAN Yiru  YI Enxin  JI Haonan  LIU Weifeng
Affiliation:College of Information Science and Engineering, China University of Petroleum, Beijing 102249, China
Abstract:
Keywords:reduction   scan   ReRAM   processing in memory   parallel computing
点击此处可从《国防科技大学学报》浏览原始摘要信息
点击此处可从《国防科技大学学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号