首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
高精度的浮点乘加融合(FMA)部件一直是高性能微处理器设计追求的目标。提出了一种128位精度全流水FMA体系结构,采用10级平衡流水线,重点对超宽位的乘法器、加法器、前导零预测和规格化进行了流水优化。设计综合的结果表明,基于SMIC0.13μm工艺,该结构频率可以达到465MHz,比现有128位FMA性能提高了130%;在TSMC65nm工艺下,该结构的频率可达到1.075GHz,基本满足高性能计算的要求。  相似文献   

2.
用FPGA实现浮点FFT处理器的研究   总被引:11,自引:2,他引:9       下载免费PDF全文
针对定点FFT处理器精度不高的缺点,提出了浮点格式FFT处理器的FPGA硬件实现方案。详细阐述了FFT处理器的自定制浮点格式确定、算法选择和浮点加法实现等关键技术。该处理器已投入使用,工作性能稳定,系统时钟80MHz,完成1024点FFT IFFT运算只需64μs,误差小于-80dB。  相似文献   

3.
针对采用流水线结构设计的32位加法器系统延迟时间长的问题,设计了一个4级流水线结构的32位加法器,并对这个流水线结构进行了分析改进,设计了一个两级流水线结构的32位加法器。  相似文献   

4.
提出一种无伸缩因子的双曲线坐标旋转数字计算(CORDIC)算法,该算法解决了伸缩因子的补偿问题,扩展了传统算法中受限的收敛域。对改进算法进行了误差分析,并通过仿真图直观比较,表明采用的算法精度满足硬件精度要求。提出了一种CORDIC算法的多级流水线结构和一种新的直接数字频率合成器(DDS)设计方法,此方案降低了硬件复杂度,易于实现。  相似文献   

5.
介绍了DLX虚拟处理器的结构特征和流水线处理机的工作原理,通过矩阵乘法运算实例模拟了程序在DLX虚拟处理器中的流水执行过程,并利用DLX的统计分析工具对流水线的性能进行对比分析,提出了流水线处理过程中潜在问题的解决方法,为设计和改进流水线结构及提高流水线处理机中算法的执行效率提供了参考依据。  相似文献   

6.
现代无线通信应用对FFT计算吞吐率与灵活性需求越来越高,针对传统方案实现FFT计算时难以兼顾性能与灵活性的问题,提出一种应用定制指令集可重构结构ASRA,实现了FFT算法在该结构上的映射优化。ASRA在静态多发射处理器内紧耦合应用定制的混合粒度可重构硬件作为扩展功能单元簇,通过运行时重构动态切换扩展指令集。ASRA采用多体便笺存储器、多端口便笺管理单元及可重构互连构成片上缓存系统,结合多体并行访问、循环级乒乓交替、读/写流水化等技术有效提高了访存带宽;静态多发射和运行时语境管理机制支持核心循环的硬件自动流水执行和软流水执行,开发了指令级、数据级和循环级等多层次并行性。实验结果表明,ASRA大幅提升了FFT计算吞吐率,且支持的FFT计算参数更加灵活,而增加的面积开销相对较小。  相似文献   

7.
美国TI公司推出的浮点DSP—TMS320VC33为处理器的通用图像处理系统,具备良好的算法通用性,是一种优良的图像处理平台。本文阐述了该系统的硬件设计思想及软件开发流程。  相似文献   

8.
采用分布式算法在 FPGA 中实现 FIR 滤波器的方法,将乘加运算转化为查找表的分布式算法并对高阶 DA 的实现进行优化。设计的电路通过软件进行验证并进行硬件仿真,结果表明电路工作正确可靠,能满足设计要求。  相似文献   

9.
基于USB接口技术对"通用雷达装备虚拟维修训练系统(URVMTS)"的人机交互系统进行研究,通过合理的软、硬件设计实现了系统的通用性。不同的实装操作部件经过适当的信号调理均可以通过该系统方便地实现与雷达虚拟样机之间的交互。着重介绍了交互系统的通用性设计与实现方法,包括系统的通用性设计方案,USB硬件电路的通用性设计及相应的软件开发。  相似文献   

10.
流水调度是专用数字信号处理器高层综合中一个困难而急待解决的问题。给出了一种定向搜索流水调度算法 ,目标是使全面考虑了运算单元、寄存器和互连的硬件代价最小化。它作为一种利用启发信息的迭代算法 ,一方面克服了确定性算法爬峰能力差、易于陷于局部极值的缺点 ,另一方面启发信息的利用加快了搜索过程。典型设计实例显示算法性能达到或超过了目前流水调度文献报道的最好性能  相似文献   

11.
模块化油料装备具有运用方式灵活、功能模块扩展能力强的优点,既能使油料装备的保障能力显著增强,又方便设计、制造、使用和维修,但各模块单元之间不易实现干式快速连接与分离。为实现油料装备模块单元快速连接、拆卸且无油料漏出,创新设计一种干式快速自封连接接头。该接头用于油料装备模块单元连接时,管路系统能自动接通;各模块单元分离时,管路系统能自动封闭,使各模块单元或组合体形成一个密封体,始终无漏油现象。该干式快速自封连接接头用于模块单元连接或分离,具有简便、快捷且无油料渗出等特点。  相似文献   

12.
以超长指令字(VLIW)数字信号处理器(DSP)作为平台,针对现有提高单线程取指流水线效率的方法中存在的弊端,提出了一种高性能的取指流水架构.该架构支持无效取指的检测与作废,从而降低不必要的cacbe访问,减少取指流水停顿周期,该结构还引入专用硬件支持编译调度的循环软流水,有效提高指令并行性,降低代码存储空间,由此释放...  相似文献   

13.
宽单指令多数据流(Single Instruction Multiple Data, SIMD)架构数字信号处理器一般都能高效支持地址连续或等距跨步等规则应用的向量访存,但对于科学与工程计算中广泛存在的不规则应用的数据访存则带宽利用率往往较低,从而大幅降低了其整体运算能效。为了提高不规则应用的向量访存性能,基于某SIMD数字信号处理器的体系结构,设计了一种支持Gather/Scatter访存的向量存储器GSVM。通过设计与SIMD宽度相匹配的向量地址计算单元和合适深度的冲突缓冲器阵列,实现了Gather/Scatter指令向量地址计算、仲裁与缓存的全流水访存操作。实验结果表明,相比以前不支持Gather/Scatter访存的存储器,GSVM在增加22%的硬件代价基础上,基于稀疏矩阵向量乘的测试程序集获得了2~8的性能加速比。  相似文献   

14.
随着空间探测任务逐步增加、空间信道频谱资源日趋紧张,传统Gardner定时同步算法已经无法满足高速数传系统高通量、高可靠性的需求。为了提高Gardner定时同步算法的吞吐率并增大可纠正误差范围,提出一种高速并行Gardner算法。为了保证插值精度同时减少乘法器消耗,设计了一种并行分段抛物线插值滤波器;为了便于并行流水线设计和最佳采样点选取,构建了计数模块和定时缓存调整模块;为了提高等价吞吐率,重构了流水线并行环路滤波器结构和并行数控振荡器结构。结果表明,该算法等价吞吐率可达1 739.13 Msps,数字信号处理器资源消耗可减少44%,可纠正2×10-3的定时误差。  相似文献   

15.
空间推进系统工作过程的模块化建模   总被引:1,自引:1,他引:0       下载免费PDF全文
建立空间推进系统仿真模块(包括液体管道模块、三通模块、充填模块、推力室模块等)的数学模型.虽然采用的是集中参数方法,但同时考虑了液体的惯性、粘性和压缩性,所以本文建立的常微分方程组能在一定程度上反映供应系统工作过程的分布特性.  相似文献   

16.
LS-DSP是用于航天图像处理的数字信号处理器,内部的协处理器由处理元PE阵列构成。路由器则是实现PE阵列网格互连的专用部件,也是操作最频繁的部件。如何降低处理器功耗,提高算法的执行效率是一个非常重要的研究课题。针对LS-DSP路由器的电路进行门控时钟的低功耗设计改进,并以算法为例进行了控制、执行过程功耗分析和比较。实验结果表明,改进结构的路由器降低功耗76%。  相似文献   

17.
针对反导作战指控系统作战管理任务与过程,分别构建了层次式、中心式和分布式3种作战管理模式。基于3种管理模式,采用以仿真系统搭建作战环境进行对抗的仿真评估方法,以拦截比率(发射数/拦截数)为评估参数对不同作战管理模式的效能进行了仿真评估,同时对影响评估效能的参数进行了敏感性分析。根据分析评估结果,明确了在不同作战样式下采用不同作战管理模式的基本原则。  相似文献   

18.
机动输油管线泵机组仿真模型构建   总被引:1,自引:0,他引:1  
受经费、人力、装备等因素的制约,机动型输油管线的实装训练往往难以开展,而开展仿真训练则是提高训练水平和效益的重要手段。构建机动输油管线泵机组仿真模型是模拟器研制和管线系统仿真的基础。建立了机动输油管线泵机组柴油机、增速器、离心泵的数学模型,给出了泵机组仿真计算的基本流程,建立了基于统一建模语言(UML)的泵机组仿真模型类图。所提出的建模方法同样适用于滑片泵泵机组。  相似文献   

19.
软件内建自测试中测试点的研究   总被引:1,自引:0,他引:1  
“软件内建自测试”是软件测试和可测性设计研究领域中的一个新概念,其思想来源于硬件内建自测试BIST(Build-In-Self-Test),即模拟硬件BIST中的附加电路。在软件中也插入这样的一些“附加电路”,即测试点(CheckPoint),这样就大大减少了测试时的复杂度,其中测试点设置是软件内建自测试系统的核心模块之一。具体讨论了测试点设置策略、测试点个数,最后给出了一个具体的实现。  相似文献   

20.
在自主地面车辆中,视觉系统的重要作用之一是根据路标来定位。本文提出了一种便于流水线图像处理结构实现的多层模板相关神经元网络(MTCNN)。文中给出了MTCNN的基本结构及训练算法,并且将其与经典的多层前馈神经元网络(MLFNN)进行了比较。仿真结果表明,本文提出的算法结构在多层前馈神经元网络的分类能力与采用通用图像处理硬件的可实现性之间,取得了良好的折衷。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号