面向图计算应用的处理器访存通路优化设计与实现 |
| |
作者姓名: | 张旭 常轶松 张科 陈明宇 |
| |
作者单位: | 中国科学院计算技术研究所先进计算机系统研究中心,中国科学院计算技术研究所先进计算机系统研究中心,中国科学院计算技术研究所先进计算机系统研究中心,中国科学院计算技术研究所先进计算机系统研究中心 |
| |
基金项目: | 国家重点研发计划项目(No. 2017YFB1001602),中国科学院青年创新促进会(No. 2017143) |
| |
摘 要: | 针对图计算应用的访存特点,提出并实现一种支持高并发、乱序和异步访存的高并发访存模块(High Concurrency and high Performance Fetcher, HCPF)。通过软-硬件协同的设计方法,HCPF可同时处理192条共8种类型的内存访问请求,且访存粒度可由用户定义,满足图计算应用对海量低延迟细粒度数据访问的需求。同时,HCPF扩展了基于内存语义的跨计算节点定制互连技术,支持远程内存的细粒度直接访问,为后续实现分布式图计算框架提供技术基础。结合上述两个核心研究内容,基于流水线RISC-V处理器核,设计并实现了可支持HCPF的RISC-V片上系统(System-on-Chip,SoC)架构,搭建基于FPGA的原型验证平台,并使用自研测试程序对HCPF进行初步性能评测。实验结果表明,HCPF相比原有访存通路,最高可将基于数组和随机地址的两种随机内存访问性能分别提升至3.5倍和2.7倍。远程内存直接访问4 Byte数据的延时仅为1.63μs。
|
关 键 词: | 内存级并行 访存通路 图计算应用 |
收稿时间: | 2019-09-19 |
修稿时间: | 2019-11-26 |
本文献已被 CNKI 等数据库收录! |
| 点击此处可从《国防科技大学学报》浏览原始摘要信息 |
|
点击此处可从《国防科技大学学报》下载全文 |
|