首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
规约与扫描是并行计算中的核心原语,其并行加速至关重要。然而,冯·诺依曼体系结构下无法避免的数据移动使其面临“存储墙”等性能与功耗瓶颈。近来,基于ReRAM等非易失存储器的存算一体架构支持的原位计算可一步实现矩阵-向量乘,已在机器学习与图计算等应用中展现了巨大的潜力。提出面向忆阻器存算一体架构的规约与扫描的并行加速方法,重点阐述基于矩阵-向量乘运算的计算流程和在忆阻器架构上的映射方法,实现软硬件协同设计,降低功耗并提高性能。相比于GPU,所提规约与扫描原语可实现高达两个数量级的加速,平均加速比也可达到两个数量级。分段规约与扫描最大可达到五个(平均四个)数量级的加速,并将功耗降低79%。  相似文献   

2.
忆阻器是近年来发现的一种新型无源电路元件,具有非易失记忆特性,且在开关性能和工艺尺寸等多方面具有优势,可能成为IT技术新的物理基础。本文概述了忆阻器的研究意义,详细介绍了忆阻器的定义与发展历程,着重从器件制备、表征测试、基于忆阻器的新型计算系统应用等三个方面综述总结了国内外发展现状,并对忆阻器未来发展所面临的挑战进行了展望。研究表明,忆阻器相关研究将为突破冯诺依曼计算机构的限制,研究下一代计算系统奠定扎实的器件与架构基础。  相似文献   

3.
李祎  缪向水 《国防科技》2016,37(6):17-22
存储与计算融合是发展下一代高性能并行计算架构的颠覆性思路。基于忆阻器的非易失性逻辑运算是实现存储与计算融合的有效途径,近些年受到学术界和工业界的广泛关注。从通过忆阻器实现逻辑运算的非易失性、逻辑完备性和计算复杂度角度出发,综述了忆阻器存储与计算融合理论及实现技术的研究进展,重点介绍了基本布尔逻辑实现原理、复杂逻辑门构建技术以及存储与计算融合架构,并展望了亟待攻克的关键问题和未来发展方向。研究表明,我国应抓住忆阻器信息器件和计算架构难得的发展机遇,推动忆阻器存储与计算技术在军民领域的成熟与实用化。  相似文献   

4.
针对现有多忆阻器阵列集成架构中存在的数据加载、读出效率低以及阵列协同灵活性差等问题,提出一种高效率、高灵活度的阵列互连架构。该架构所采用的数据加载策略支持多种权重映射模式下的数据复用,减少了片外数据访存需求;所采用的计算结果读出网络支持多个处理单元灵活组合实现不同规模卷积运算,以及计算结果的快速累加读出,进而提升了芯片灵活性和整体算力。在NeuroSim仿真平台上运行VGG-8网络进行的仿真实验表明,与MAX2神经网络加速器相比,在仅增加6%面积开销的情况下,取得了146%的处理速度提升。  相似文献   

5.
为把握忆阻类脑芯片发展现状并总结其发展趋势,对现有忆阻类脑计算芯片与架构进行了调研,对芯片中所采用的忆阻器阵列结构和集成工艺、前神经元电路、后神经元电路、多阵列互连拓扑结构与数据传输策略,以及芯片设计过程中所采用的系统仿真和评估方法进行了对比分析。总结出当前忆阻类脑计算芯片电路设计仍需解决忆阻器可用阻态少、器件参数波动性大、阵列外围电路复杂、集成规模小等问题,并指出了该类芯片走向实际应用仍然面临着忆阻器生产工艺提升、完善开发工具支持、专用指令集开发、确定典型牵引性应用等挑战。  相似文献   

6.
为了对降落伞充气展开过程中的开伞载荷进行更加准确的预测,提出一种基于循环神经网络的开伞载荷补偿计算方法,包括模型架构和数据处理方式。该方法将充气时间法计算的预测值代入循环网络进行二次计算,使最终结果能够更加贴近试验真值。使用多层前馈网络、标准循环网络与长短时记忆网络三种网络进行比较,验证了所提模型预测结果的适用性和准确性,研究了学习率、输入层维度和隐层维度等超参数对模型性能的影响,并给出了基于长短时记忆网络的补偿模型最优训练条件。实验结果表明,利用循环网络进行开伞载荷预测具有较好的拟合结果,为机器学习与降落伞工业的学科交叉研究提供了一定的参考方向。  相似文献   

7.
针对复杂环境下由稀疏量测引起的椭圆扩展目标形态估计精度低的问题,提出了一种基于神经网络的形态估计方法。利用神经网络对目标量测进行处理,估计出椭圆扩展目标的轴长,然后结合卡尔曼滤波算法实现目标的跟踪。仿真实验结果表明,通过与基于随机矩阵、乘性误差以及卷积神经网络等模型的算法相比,所提算法的跟踪性能有显著改进。  相似文献   

8.
RBF网络用于战车火控系统弹道解算的方法   总被引:1,自引:0,他引:1  
弹道解算问题对战车火控系统的性能有着直接的影响.传统的弹道解算方法在精度和实时性方面都存在一定的局限性.为了提高解算精度、战车首发命中率和解算的实时性,基于RBF网络的函数逼近及预测能力,将RBF网络用于弹道解算,对传统算法进行优化,得到了新的弹道解算方法.最后对所提方法进行了仿真,发现新方法在解算精度没有降低的条件下,大大提高了弹道解算的实时性.  相似文献   

9.
针对多输入多输出系统受到有意干扰情况下的盲干扰抑制和信源恢复问题,提出一种双阵列天线接收机结构,通过差分处理,在不考虑独立性的条件下实现盲干扰抑制。消除干扰后的数据有明显的张量切片特征,将其堆积成三阶张量,并通过基于张量分解的方法不经信道估计直接恢复源信号,相较于传统基于信道估计的信源恢复方法大大降低信道估计误差的影响,提高恢复精度。仿真结果表明,所提方法较传统基于训练序列进行信道估计的方法能以更小的训练开销达到更优的信号恢复性能。  相似文献   

10.
针对水下定位网络节点校准耗时费力的问题及隐蔽校准的需求,提出了一种某一应答器预先校准的位置校准方法。该方法利用自主水下航行器(autonomous underwater vehicle,AUV)辅助进行应答器位置校准。首先,利用已校准应答器通过基于无迹卡尔曼滤波(unscen-ted Kalman filter,UKF)的单标距离辅助定位方法修正AUV自身定位误差;然后,利用基于容积卡尔曼滤波(cubature Kalman filters,CKF)的同步定位与建图(simutaneous localization and mapping,SLAM)方法估计其它未校准应答器位置。仿真结果表明:该方法不要求AUV具有高精度的初始位置,可同时实现AUV自身定位误差修正和应答器位置校准。  相似文献   

11.
为了提高目标轨迹预测的精度以及预测模型的泛化能力,提出基于改进蝙蝠算法优化的核极限学习机(Kernel Extreme Learning Machine,KELM)和集成学习理论目标机动轨迹预测模型。构建KELM模型,并采用改进的蝙蝠算法对KELM的参数进行优化;以优化后的KELM神经网络为弱预测器,结合集成学习算法生成强预测器,通过训练不断优化强预测的结构和参数,得到一种基于集成学习理论的目标机动轨迹预测模型;基于不同规模的样本,将所得预测模型与逆传播神经网络、支持向量机和极限学习机等模型进行对比分析。仿真结果表明:所提目标机动轨迹预测模型具有较好的预测精度和泛化能力。  相似文献   

12.
针对城市交通流随机波动性强、数据中含噪声多导致预测精度下降的问题,提出一种基于集合经验模态分解(ensemble empirical mode decomposition,EEMD)和双向门控循环单元(bidirectional gated recurrent unit,BiGRU)的组合交通流量预测模型,有效地提升了短时交通流预测的精度。模型利用EEMD算法对原始数据进行分解,根据分解所得的本征模函数(intrinsic mode function,IMF)分量绘制噪声能量图谱,去除分量中的噪声,并将去噪后的IMF分量作为BiGRU网络的输入进行训练,再将训练所得的结果进行重构加和,得到最终的预测结果。实验结果表明,未舍弃含有噪声的IMF分量进行重构的预测结果,相比于参考文献中提出的EMD+LSTM模型、LSTM模型和EEMD+LSTM模型,其平均绝对百分误差分别优化了42.36%、61.82%和30.95%;舍弃含有噪声的IMF分量后进行重构的预测结果,其平均绝对百分误差相比于将全部IMF分量进行重构优化了56.62%。  相似文献   

13.
基于不变矩和神经网络的目标识别方法   总被引:1,自引:0,他引:1  
针对寻的导引头成像制导中实时采集图像由于存在几何失真及像质模糊而导致目标识别精度差的问题,提出了一种基于不变矩和神经网络的目标识别方法.该方法采用一种改进的不变矩算法提取目标图像的不变矩特征量来训练BP神经网络,实现目标图像的识别和分类.仿真结果表明该不变矩特征库训练的神经网络分类器具有较高的识别精度,是一种比较实用的目标识别方法.  相似文献   

14.
对几种不同维数据融合方法的仿真对比研究   总被引:1,自引:0,他引:1       下载免费PDF全文
在多雷达系统组网对空情报处理中,不同的数据融合方法在融合精度、求解时间及计算量方面都有较大差异。为了验证不同融合方法的融合效果及系统处理时间和性能,分析了多雷达系统组网对不同维数据融合处理的映射法、升维法、分维法的融合框架和融合算法,并分别进行了计算机仿真,得出并分析了对比数据。仿真结果表明了分维法在数据融合中的优势。  相似文献   

15.
利用深度学习方法,为硬件计数器复用(multiplexing,MPX)提供结果精度更高的估计模型。通过对MPX估计得到的结果与实际采集的真实数据进行相似性分析,证明相同程序多次运行之间得到的硬件计数值是线性相关的。采用神经网络多层感知器(multilayer perceptron,MLP)和双向门控神经网络(bidirectional gated recurrent unit, Bi-GRU)这2种深度学习模型,对MPX数据进行拟合。基于动态时间规整(dynamic time warping, DTW),提出一个全新的评估MPX数据精度的指标DTW-cost。实验结果表明,同时收集15个硬件事件数据时,MLP方法拟合得到的13个高性能计算应用平均准确率比现有使用最广的固定插值法高出10.53%,最多可提升19.8%;而在MLP表现较差的事件上,Bi-GRU方法得到的平均准确率提升了28.8%。  相似文献   

16.
针对寿命预测模型迁移问题,提出了一种长短周期记忆网络微调(long short-term memory fine tune, LSTM-fine-tune)的迁移模型,利用理想条件下的试验数据对模型进行训练。在迁移过程中,对部分LSTM网络层进行冻结,利用实际服役环境下的数据对网络其他部分进行修正。为验证模型的泛化能力,采用不同相位与幅值的正弦函数生成数据,通过学习数据获取正弦函数的经验知识,并应用至其他正弦函数的回归,结果表明LSTM-fine-tune模型能够快速拟合,平均均方误差仅为1.033 5,明显低于直接预测误差1.536 8。为通过实际监测数据检验本方法泛化能力,分别获取了试验条件下与实际服役环境下氧气浓缩器的数据,对模型的泛化能力进行验证。结果表明,迁移后训练集预测精度提高了43.0%,测试集预测精度提高了20.2%。  相似文献   

17.
基于RBF神经网络的导弹自动驾驶仪故障诊断   总被引:1,自引:0,他引:1  
系统地分析了某型导弹自动驾驶仪的结构功能,在此基础上提出了采用RBF(径向基函数)神经网络对自动驾驶仪进行故障诊断的方法;提出了用Gauss(高斯)函数对获取的数据进行归一化处理的方法,再用处理后的数据训练RBF神经网络。实验结果表明,训练后的神经网络能快速、准确地诊断自动驾驶仪的故障,为自动驾驶仪的故障诊断提出了一种新的方法。  相似文献   

18.
针对国防科技大学自主研发的异构多核数字信号处理(digital signal processing, DSP)芯片的特征以及卷积算法自身特点,提出了一种面向多核DSP架构的高性能多核并行卷积实现方案。针对1×1卷积提出了特征图级多核并行方案;针对卷积核大于1的卷积提出了窗口级多核并行优化设计,同时提出了逐元素向量化计算的核内并行优化实现。实验结果表明,所提并行优化方法实现单核计算效率最高能达到64.95%,在带宽受限情况下,多核并行扩展效率可达到48.36%~88.52%,在典型网络ResNet50上的执行性能与E5-2640 CPU相比,获得了5.39倍性能加速。  相似文献   

19.
为了提高认知无线电传感器网络(CRSN)中的能量使用效率和性能指标,提出了一种新的基于认知无线电的无线传感网系统,该系统中的传感器节点均使用改进的机会频谱接入路由协议,提出的协议能够更好地增加网络的可扩展性和提高网络性能。构建了精确的信道模型以便评估复杂的室内环境不同区域的信号强度,通过实验模拟对提出系统的性能进行评估。模拟结果显示,相比其他两种路由协议,提出的协议在吞吐量、包延迟及总能量消耗方面表现更佳。  相似文献   

20.
针对多个虚拟网络同时映射时资源统一优化分配的问题,提出了一种基于多目标微粒群优化的虚拟网络映射方法(MSC-VNE),提高底层网络资源利用率及全局负载均衡性能。建立了虚拟网络映射的多目标优化模型,将单个虚拟网络映射作为一个子群,并采用多子群协作优化的方法在子群映射时通过相互信息交换进行协同进化,最终达到全局资源的优化分配。仿真结果表明,与典型成果相比,提出的方法有效地提高了底层网络资源利用率和虚拟网络构建成功率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号