共查询到19条相似文献,搜索用时 367 毫秒
1.
2.
针对现有多忆阻器阵列集成架构中存在的数据加载、读出效率低以及阵列协同灵活性差等问题,提出一种高效率、高灵活度的阵列互连架构。该架构所采用的数据加载策略支持多种权重映射模式下的数据复用,减少了片外数据访存需求;所采用的计算结果读出网络支持多个处理单元灵活组合实现不同规模卷积运算,以及计算结果的快速累加读出,进而提升了芯片灵活性和整体算力。在NeuroSim仿真平台上运行VGG-8网络进行的仿真实验表明,与MAX2神经网络加速器相比,在仅增加6%面积开销的情况下,取得了146%的处理速度提升。 相似文献
3.
基于忆阻器的神经形态计算架构在图像分类、语音识别等领域取得了较好的效果,但当忆阻器阵列存在低良率问题时,其性能会出现明显下降。提出一种基于忆阻器神经形态计算的校准方法和原位训练相结合的算法,利用校准方法提高乘累加计算的准确率,并利用原位训练方法降低训练误差。为了验证所提方法的性能,采用多层感知器架构进行仿真。从仿真结果来看,神经网络的精度有明显的提高(近40%)。实验结果表明,与单纯的校准方法相比,采用所提方法训练的网络精度提高了约30%,与其他主流的方法相比,所提方法训练的网络精度提高了0.29%。 相似文献
4.
存储与计算融合是发展下一代高性能并行计算架构的颠覆性思路。基于忆阻器的非易失性逻辑运算是实现存储与计算融合的有效途径,近些年受到学术界和工业界的广泛关注。从通过忆阻器实现逻辑运算的非易失性、逻辑完备性和计算复杂度角度出发,综述了忆阻器存储与计算融合理论及实现技术的研究进展,重点介绍了基本布尔逻辑实现原理、复杂逻辑门构建技术以及存储与计算融合架构,并展望了亟待攻克的关键问题和未来发展方向。研究表明,我国应抓住忆阻器信息器件和计算架构难得的发展机遇,推动忆阻器存储与计算技术在军民领域的成熟与实用化。 相似文献
5.
6.
7.
规约与扫描是并行计算中的核心原语,其并行加速至关重要。然而,冯·诺依曼体系结构下无法避免的数据移动使其面临“存储墙”等性能与功耗瓶颈。近来,基于ReRAM等非易失存储器的存算一体架构支持的原位计算可一步实现矩阵-向量乘,已在机器学习与图计算等应用中展现了巨大的潜力。提出面向忆阻器存算一体架构的规约与扫描的并行加速方法,重点阐述基于矩阵-向量乘运算的计算流程和在忆阻器架构上的映射方法,实现软硬件协同设计,降低功耗并提高性能。相比于GPU,所提规约与扫描原语可实现高达两个数量级的加速,平均加速比也可达到两个数量级。分段规约与扫描最大可达到五个(平均四个)数量级的加速,并将功耗降低79%。 相似文献
8.
提出利用当前国际先进专用开关稳压电源集成芯片,设计高效、低纹波的新型新波器的原理及电路实现,并在实验条件下证明了本设计的工程适用性。 相似文献
9.
在计算需求层面对多种典型信号处理算法与深度学习算法进行了分析与模块化分解,提取了两类应用共有的且适合并行硬件加速的计算模块,提出了信号处理与深度学习的一致性计算模型,并基于一致性计算模型设计了控制与计算分离的层次化处理单元与阵列化计算结构。通过对不同应用计算过程的软件定义能够实现信号处理与深度学习的一致性硬件加速计算,基于Zynq计算平台从重构效率与计算性能两个方面对一致性计算模型与计算结构进行了验证,结果表明:基于一致性计算模型的软件定义可重构计算结构,具有较高的计算性能与重构效率。 相似文献
10.
针对极化敏感阵列在工程应用中所受到的诸多限制条件,本文提出了一种新型交替极化阵列结构,分析了其在滤波抗干扰中的理论极限性能,并与极化敏感阵列滤波性能进行对比研究。研究表明:相对而言,交替极化阵列在设备量减半、信号处理自由度减半的条件下,滤波抗干扰性能逼近极化敏感阵列,克服了极化敏感阵列系统复杂性带来的一系列问题,因此在阵列雷达领域具有广泛的应用前景。 相似文献
11.
片上系统(SoC)技术是近年来随着微电子技术发展出现的新技术,现已被广泛应用.利用SoC可以将原来由许多芯片完成的复杂功能,集中到一块芯片中完成,以获得更高的系统性能.以某火控系统中的模拟量输入通道为例,阐述了通过SoC技术,用基于FPGA/CPLD的方法对火控系统硬件电路进行维修改造,从而探讨了解决装备维修问题的一种方法.并讨论了改造过程中单稳态触发器96L02的替代问题,以及FPGA/CPLD与外围电路的驱动能力问题. 相似文献
12.
13.
介绍了一种基于CMOS视觉芯片的双目视觉相对定位信息提取系统。重点描述了该系统的硬件系统的组成:成像采集设备、控制器、存储器、专用DSP和外部接口电路,以及各部分的芯片选择和相应的接口设计,并提供了设计方案实例。系统具有体积小、重量轻、功耗小、集成度高、接口灵活、定位精度高等特点,可以方便地安装在各种设备,尤其是嵌入式系统上,因此可以广泛地应用到很多领域。 相似文献
14.
光通信技术对核心路由器报文转发能力不断提出更高的要求。10Gbps光传输技术已经使现有的各种软硬件路由查找方法成为核心路由器转发能力的瓶颈,而更高性能的光传输技术则已经突破了存储器访问速度的极限,使得基于单片存储器的路由转发方法无法应付未来日益增长的需求。在硬件存储器价格非常低的前提下,提出一种使用多个存储器并行流水查找的硬件转发实现结构。通过使用Internet上真实报文数据进行的性能模拟可以看出,随着并行度的增加,整个转发结构可以获得近似于线性的性能加速比。 相似文献
15.
基于FPGA的高速图像处理系统设计 总被引:1,自引:0,他引:1
针对坦克图像处理中存在的系统集成度不高、处理速度较慢等问题,设计了一种基于FPGA的高速图像处理系统。该系统通过在FPGA上配置Nios Ⅱ软核处理器以及图像采集、处理和显示等功能模块来实现其主要硬件电路,并结合系统的软件设计实现了多路图像信号的采集以及图像的放大/缩小、裁剪和叠加显示等功能。由于采用了可编程芯片和并行处理技术,该系统具有集成度高、维修性好、图像处理速度快和实时性强等优点。 相似文献
16.
分析了多核环境下传统的离散事件时间弯曲并行系统的性能,针对其事件调度开销小和负载均衡能力强难以兼得的问题,提出了一种基于分布式队列的全局调度机制,设计了相应的数据结构和调度算法,大大减少了锁开销.通过大量实验对多核环境下几种典型离散事件系统并行策略的性能分析表明,本文提出的全局调度策略不仅事件调度开销小,而且回滚率大大降低,有效克服了传统策略回滚量较大或难以实现动态负载平衡的情况,并具备良好的可扩展性. 相似文献
17.
18.
19.
将Mushroom电磁带隙结构(Electromagnetic Band Gap,EBG)的表面波带隙和同相反射特性同时用于波导缝隙阵列天线的设计,利用EBG的带隙特性抑制天线阵中的表面波,以改善天线的辐射性能;利用EBG的同相反射特性实现天线雷达散射截面(Radar Cross Section,RCS)的减缩,天线综合性能得到较大提升。制作了EBG波导缝隙天线阵样品,并对天线阵的阵元互耦、辐射方向图及天线阵RCS等指标进行了测试,结果与理论预期相吻合,有效地降低了阵元间互耦及天线阵RCS。 相似文献