共查询到20条相似文献,搜索用时 15 毫秒
1.
YHFT-DX是国防科技大学自主研制的一款高性能DSP.以提升YHFI-DX的 Cache 性能为目标,研究了降低 Cache 失效延迟的优化策略,设计并实现了一种针对高频高性能DSP的一级数据Cache优化策略--失效流水.与传统优化策略相比,该策略将连续访问Cache的失效请求并进行流水化处理,使多个Cache失效延迟重叠,从而达到降低平均Cache失效代价的目的.将该策略应用到YHFT-DX芯片的一级数据Cache控制器的设计与优化中,使访问Cache失效引起的流水线停顿从8拍降为2拍,显著提升了系统性能. 相似文献
2.
近年来,无缓冲路由器由于不需要缓冲器而成为片上网络低开销的解决方案。为了提高无缓冲路由器的性能,提出一种单周期高性能无缓冲片上网络路由器。该路由器使用一个简单的置换网络替换串行化的交换分配器与交叉开关以实现高性能。虚通道路由器与基准无缓冲路由器相比,该路由器在TSMC65nm工艺下可以以较小的面积开销达到2GHz的时钟频率。在合成通信负载与真实应用负载下的模拟结果表明,该路由器的包平均延迟远小于虚通道路由器和其他无缓冲路由器。 相似文献
3.
基于资源预留策略提出一种多级光互连仲裁机制,通过将网络分级实现快速、高效的仲裁。多优先级数据缓存队列的传输节点设计,提供了不同类型流量的差异化传输;通过预约式两级仲裁机制,实现网络的完全公平与100%的高吞吐率。设计并对快速仲裁通道进行了合理布局,极大地缩短了仲裁延迟。仿真结果表明:采用基于资源预留的分级仲裁策略,在多种流量模式下所有节点均获得公平的服务。与Feather Weight相比,分级仲裁策略吞吐率提高17%;与2-pass相比,仲裁延迟减少15%,同时,功耗减少5%。 相似文献
4.
在SIMD处理器上映射矩阵运算时会带来大量的数据重排操作从而降低系统性能。本文提出定制化的多粒度矩阵寄存器文件(MMRF)以消除数据重排操作。MMRF支持多粒度的并行行访问和列访问,从而提升矩阵运算的性能。MMRF可以被动态配置为不同的并行访问模式,在不同模式下一个或多个子矩阵可以被并行处理。实验结果显示,同传统的向量寄存器文件(VRF)和矩阵寄存器文件(MRF)相比,MMRF可分别带来2.21倍和1.6倍的平均性能提升,面积分别增加14.3%和3.7%,功耗分别增加14.6%和2.2%。同TMS320C64x+处理器相比,基于SIMD技术的FT-Matrix处理器在引入MMRF后可以得到5.65倍到7.71倍的性能提升。通过层次化的全定制设计技术,MMRF的面积和关键路径分别减少17.9%和39.1%。 相似文献
5.
基于通用多核架构的网络分组处理系统性能受到诸如分组IO开销高、多核共享内存及进程调度竞争大、页表缓冲表项失效率高等问题的困扰。为此提出一种基于通用多核网络分组处理系统、面向高速分组转发应用的线程亲和缓冲区硬件管理机制,并在网络专用协处理引擎上实现。该机制采用无中断的线程亲和调度策略,将包含控制信息与缓冲区地址信息的描述符和分组数据按照分组处理的线程号链式地对应加载在多个地址连续的共享缓冲区中。基于通用多核和现场可编程门阵列平台进行报文转发测试,实验结果表明,采用线程亲和缓冲区管理机制能使平均报文转发处理性能提升12.4%,有效地降低IO开销和TLB表项失效率。 相似文献
6.
7.
基于SpaceWire网络在热点通信模式下的工作特点,研究缓存资源的分配算法。给出均匀通信模式和热点通信模式的释义;推导网络路由节点的满负荷概率和平均延时的解析方法,计算网络中的关键通信节点;再给出SpaceWire网络缓存资源分配算法。利用Opnet网络仿真平台建立SpaceWire通信模型,仿真了不同通信模式中采用缓存优化策略前后的关键性能指标。研究结果表明:在热点通信模式状态下,该缓存资源分配算法在保证总资源一定的前提下,网络系统的平均延时降低,优化了SpaceWire网络性能。 相似文献
8.
一种面向应用的NOC缓冲区分配算法 总被引:2,自引:1,他引:1
片上互连网络是片上通信问题的有效解决方案,但其存在严重的资源限制.输入缓冲区占据片上网络总面积的显著部分,同时其容量大小对不同应用映射后获得的性能有重要影响.给出一种面向应用数据负载的NOC缓冲区分配算法,针对不同的应用映射,该算法可以根据数据流量分布特征实现各个路由器输入通道上缓冲区资源的定制分配.实验结果表明,使用该算法后,系统缓冲区资源得到了更有效的利用.与均匀分配缓冲区的NOC系统相比,采用该算法实现的缓冲区分配方案使系统在保持性能变化不大的情况下,能够节省约50%的缓冲区总容量. 相似文献
9.
集中控制混合网络中,异构化网络内部的流量具有一定的规律和特性,如果使用原有的单一的离散式最大极值和无状态的网络资源调度算法,忽略了异构网络规律,会造成网络利用率较低、易震荡、部分网络流延迟等问题。通过分析由集中控制网络和普通网络组成的混合网络的拓扑结构,对混合网络结构中常见问题如流闪现、不能估计的流、路径堵塞或连接震荡场景进行分析,并提出基于期望和状态的流量评价资源规划算法POS和POS-FME。算法考虑混合网络的运行状态,对系统可用资源进行评估,为系统中各种流匹配对应可用资源,并具有一定的预测作用,从而避免混合网络出现运行效率低下的场景。通过实验,POS算法和POS-FME算法相对传统算法,利用率提高了10%~30%,并降低了震荡和平均延迟。 相似文献
10.
无线网络中的路由与信道分配可极大地影响网络的性能.为了解决无线网状网络中的路由与信道分配问题,提出并研究了一种称为CRAG(基于博弈论的无线网状网络路由与信道分配联合优化)的方法.CRAG采用协同博弈的方式将网络中的每个节点模型化为一个弈者,每个弈者的策略为与其相关的路由与信道分配方案,收益函数为给定流量需求矩阵下的成功传输流量.弈者通过协同博弈来优化收益函数以最大化网络的吞吐量.基于NS3的仿真结果表明,CRAG在收敛性、时延、丢包率和吞吐量方面优于其他当前的算法,从而证明了协同博弈的方法可以用于无线网状网络的路由与信道分配联合优化,并有效地改进网络性能. 相似文献
11.
针对超高速SpaceFibre星载网络中多源数据传输的确定性和实时性应用需求,提出一种分类细粒度低延时确定性调度算法。该算法基于差异化调度策略的思想,将数据流划分为三类。为实现网络资源的细粒度分配,引入扩展时隙。该算法采用无冲突均匀调度方法,降低了数据包的平均排队延时。为适应有效载荷组网的航天应用场景,该算法兼顾网络拓扑结构生成调度方案。为验证算法有效性,在OPNET仿真平台下利用自定义建模技术搭建网络仿真模型。仿真结果表明:相比优先权调度和无冲突连续调度机制,该算法实现了时间敏感数据流的确定性传输;随着时隙数目的增加,网络的延时性能和抗抖动性能显著提升,吞吐量性能得到保证;该算法具有一定的航天工程实用价值。 相似文献
12.
功耗与延迟是无线传感器网络介质访问控制协议设计首要考虑的两个问题。提出了一种新的传感器网络低延迟、低功耗、接收节点初始化异步介质访问控制协议——THO-MAC协议。通过准确预测接收节点的唤醒时间,THO-MAC协议调度发送节点侦听信道,从而减少发送节点空闲侦听能量浪费。THOMAC协议在发送节点两跳转发节点集中选择使报文两跳转发延迟最小的转发节点,从而降低报文传输延迟。使用NS2模拟器对THO-MAC协议进行了详细模拟。模拟结果显示,与RI-MAC和Any-MAC协议相比,THOMAC协议可以减少35.5%和18%的报文传输延迟,同时节省23.5%和15.5%的节点功耗。 相似文献
13.
14.
为了提高认知无线电传感器网络(CRSN)中的能量使用效率和性能指标,提出了一种新的基于认知无线电的无线传感网系统,该系统中的传感器节点均使用改进的机会频谱接入路由协议,提出的协议能够更好地增加网络的可扩展性和提高网络性能。构建了精确的信道模型以便评估复杂的室内环境不同区域的信号强度,通过实验模拟对提出系统的性能进行评估。模拟结果显示,相比其他两种路由协议,提出的协议在吞吐量、包延迟及总能量消耗方面表现更佳。 相似文献
15.
提出了串联恒流和并联恒压两种适合应用于海底观测网络的远程供电系统方案;在相同条件下,利用算法分别完成了两种系统的可靠性设计与分配方案,并根据各子单元的分配可靠度计算了两种系统各节点的供电可靠度。分析结果表明:相比于并联恒压远供系统,串联恒流远供系统对子单元的要求相对较低,而各节点的供电可靠度相对较高,说明串联恒流远供系统更适合应用于我国的海底观测网络建设。 相似文献
16.
为了延长无线传感器网络的工作周期,在满足网络覆盖性能的前提下,可利用调度算法让一部分节点进入休眠以节省能量。提出了一种基于网格划分的无线传感器网络多重覆盖算法,新算法包括冗余节点判断和节点调度两部分。将节点覆盖区域划分为多个网格,通过判断各个网格是否满足覆盖要求,进而判断节点是否冗余。新算法给出了边界冗余节点判据,在调度过程中能够克服边界效应的影响,同时通过冗余节点能量比较,避免了休眠冲突和覆盖盲区的产生。仿真结果表明,与传统的CPNSS算法相比,新算法对冗余节点的判断更为准确,在网络工作集和平均覆盖度两项性能评价指标上均优于传统调度算法,且对网络节点数量增加造成的影响不敏感,能够有效地减少网络冗余,起到了提升网络性能的效果。 相似文献
17.
18.
针对合成孔径雷达图像目标检测中存在的样本获取困难且数量有限问题,提出了联合生成对抗网络和检测网络的学习模型。利用原始训练集对特别设计的超快区域卷积神经网络进行预训练;再通过基于注意力机制的深度学习生成对抗网络生成高质量合成样本,并输入检测网络进行预测;依据预测信息和概率等价类属标签分配策略为新生样本提供注释信息,并以一定占比对原始训练集进行扩充;利用扩充数据集对检测网络进行再训练。多组仿真实验证明,所提框架能够有效提升网络检测效率和性能。 相似文献
19.
为提升物联网与边缘计算应用中前端节点间的数据访问效率,提出了一种新型远程零拷贝文件系统。该文件系统无须借助特殊硬件,可直接基于通用网卡设备实现零拷贝的数据传输框架;充分利用新型非易失内存的随机访问特性,尽可能减少数据缓存和拷贝,提高数据访问的吞吐量。建立缓冲区池,精简并融合传统网络栈和存储栈,从而缩短文件访问路径,减少软件冗余,降低数据访问延迟。最终提供高带宽、低延迟的远程数据访问性能。测试结果表明,远程零拷贝文件系统比传统网络文件系统减少了42.26%~99.19%的读写延迟,细粒度访问下的吞吐量最高可提升1297倍,显著降低了处理器开销和缓存失效次数。 相似文献