首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 125 毫秒
1.
为摆脱对商用网卡的依赖,降低软硬件复杂度,提出通用多核网络分组处理系统,构建面向大报文高速分组转发应用的软硬件协同数据分段卸载发送机制,并实现原型系统。该机制基于轻量级输入输出的软硬件协同多核分组处理系统,以降低大报文切分、拷贝开销以及软硬件复杂度为目的,把实现切分报文、封装报文头以及校验功能中硬件实现复杂的部分卸载到驱动中,将分段报文数据拷贝缩减为新报文头的拷贝,结合链式直接内存存取技术,为多核实现高速的大报文分组转发提供有效的解决方案。基于国产通用多核和高性能现场可编程门阵列平台进行发送性能测试。测试结果表明:采用数据分段卸载发送机制能大幅提升报文发送性能,有效解决大报文引发的多核网络分组处理性能下降的问题。  相似文献   

2.
随着网络带宽的不断提高,分组到达路由器的时间间隔不断缩短,对路由器处理分组的速度提出了新的要求。传统的分组调度算法,如WFQ,由于性能和可扩展性等问题,难以在高性能核心路由器中实现。为此,提出了分组非精确调度技术,在不影响应用QoS的前提下对经典的调度算法进行修改,通过简化硬件设计提高调度器的服务能力。模拟分析表明,采用非精确调度技术的SLQF算法的延时特性与传统算法LQF基本一致。  相似文献   

3.
随着线路传输速率的快速提高,报文线速转发面临极大挑战。基于并行处理技术,提出分布式并行转发引擎结构,实现高速报文转发。针对并行转发引擎负载分配问题,设计AHDA(Adaptive Hashing DispatchAlgorithm)算法,该算法为综合考虑负载均衡和报文保序提供支持。模拟结果表明,AHDA算法均匀分配负载,保证很低的报文乱序率,对网络处理器规模具有良好的可扩展性。  相似文献   

4.
功耗与延迟是无线传感器网络介质访问控制协议设计首要考虑的两个问题。提出了一种新的传感器网络低延迟、低功耗、接收节点初始化异步介质访问控制协议——THO-MAC协议。通过准确预测接收节点的唤醒时间,THO-MAC协议调度发送节点侦听信道,从而减少发送节点空闲侦听能量浪费。THOMAC协议在发送节点两跳转发节点集中选择使报文两跳转发延迟最小的转发节点,从而降低报文传输延迟。使用NS2模拟器对THO-MAC协议进行了详细模拟。模拟结果显示,与RI-MAC和Any-MAC协议相比,THOMAC协议可以减少35.5%和18%的报文传输延迟,同时节省23.5%和15.5%的节点功耗。  相似文献   

5.
多核环境下负载均衡的并行离散事件全局调度机制   总被引:1,自引:1,他引:0       下载免费PDF全文
分析了多核环境下传统的离散事件时间弯曲并行系统的性能,针对其事件调度开销小和负载均衡能力强难以兼得的问题,提出了一种基于分布式队列的全局调度机制,设计了相应的数据结构和调度算法,大大减少了锁开销.通过大量实验对多核环境下几种典型离散事件系统并行策略的性能分析表明,本文提出的全局调度策略不仅事件调度开销小,而且回滚率大大降低,有效克服了传统策略回滚量较大或难以实现动态负载平衡的情况,并具备良好的可扩展性.  相似文献   

6.
协作通信是提高无线传感网络性能的有效技术.为此,针对能量采集的无线传感网络(EH-WSNs),提出多转发节点协作传输(Multi-relay Cooperative Transmitting,MRCT)方案.MRCT方案采用时隙切换/功率分配机制,优化解码信息和传输信息的功率分配;转发节点将所接收的信息进行放大——转发处理,并由将多个转发节点的信息合并后,再传输传感节点,进而提高吞吐量和安全能力.通过仿真分析了MRCT方案的吞吐量和安全中断概率性能.仿真结果表明,提出的MRCT方案的吞吐量和安全性能得到提升.  相似文献   

7.
基于分布式转发交换的并行路由器关键技术研究   总被引:1,自引:0,他引:1       下载免费PDF全文
随着Internet链路速率和IP前缀数目的不断增长,对路由器的转发和交换能力提出了更高的要求.提出一种基于分布式转发交换的并行路由器体系结构,采用多个低速的能够独立转发和交换报文的功能部件构成多级流水线,以流水的方式执行报文转发和交换.对该结构实现关键技术--基于子树映射的IP流水查找机制进行了深入的研究,提出了相应的解决方案,并指出了下一步的研究方向和思路.  相似文献   

8.
针对于邻居网络功能节点对资源调度的影响,提出了基于服务功能链的网络功能资源调度机制GSDM。基于服务功能链,GSDM将邻居节点运行状态信息加入到调度策略中,有效刻画了网络功能连接关系对资源调度的影响。实验结果表明:GSDM有效地提高了资源调度的召回率以及精准率,并有效提高了网络功能虚拟化系统性能。  相似文献   

9.
并行是提高计算机性能最主要的方法,随着集成电路生产工艺的不断发展,除了在单个芯片内集成更多的处理器核外,通过集成高速互连网络接口构建多路并行系统一直是提高高性能计算机并行性的主要方式。提出了一种面向多核微处理器的互连接口的设计方案,基于精简的PCI-E总线协议,采用高速串行数据传输技术,支持Cache一致性报文和大块数据传输报文,能够用于实现4个处理器的直接互连。模拟结果表明,优化设计的互连接口每个接口能够实现64Gbps的双向最大有效带宽,最小传输延迟为120ns,能够较好平衡不同报文类型对带宽和传输延时的要求。  相似文献   

10.
基于并行流水的转发引擎设计与性能分析   总被引:1,自引:0,他引:1       下载免费PDF全文
光通信技术对核心路由器报文转发能力不断提出更高的要求。10Gbps光传输技术已经使现有的各种软硬件路由查找方法成为核心路由器转发能力的瓶颈,而更高性能的光传输技术则已经突破了存储器访问速度的极限,使得基于单片存储器的路由转发方法无法应付未来日益增长的需求。在硬件存储器价格非常低的前提下,提出一种使用多个存储器并行流水查找的硬件转发实现结构。通过使用Internet上真实报文数据进行的性能模拟可以看出,随着并行度的增加,整个转发结构可以获得近似于线性的性能加速比。  相似文献   

11.
针对应用层组播报文转发的特点,提出了一种能够提高应用层组播转发速率的新机制.该机制降低了应用层组播报文从主机内存到网卡缓冲区之间数据复制的次数,节省了CPU处理开销.理论分析表明该机制能够降低应用层组播延迟和提高应用层组播转发速率.实验验证了该机制的可行性与有效性.  相似文献   

12.
基于Libpcap网络数据包捕获技术的改进   总被引:1,自引:0,他引:1  
分析了Linux下基于Libpcap的网络数据包捕获技术机理,指出了影响数据包捕获性能的"瓶颈",通过零拷贝技术、内存映射技术和中断节制机制对其改进,并进行仿真实验。结果表明:改进方法可以显著提高数据包的捕获率。  相似文献   

13.
针对无线传感器网络中瓶颈节点和准瓶颈节点对网络影响的特例性问题,将重要节点的概念推广到对节点介数的研究,提出了基于介数中心性重要节点的能量均衡机制。该机制将介数值大于网络平均介数值的节点判定为重要节点,并利用重要节点的邻居节点建立缓冲机制来减少其数据的转发次数,在牺牲较少数据传输延时的情况下节省了介数中心性重要节点的能量消耗。仿真实验表明该机制能够较好地均衡无线传感器网络中的节点能耗,提高了网络生命周期。  相似文献   

14.
针对国防科技大学自主研发的异构多核数字信号处理(digital signal processing, DSP)芯片的特征以及卷积算法自身特点,提出了一种面向多核DSP架构的高性能多核并行卷积实现方案。针对1×1卷积提出了特征图级多核并行方案;针对卷积核大于1的卷积提出了窗口级多核并行优化设计,同时提出了逐元素向量化计算的核内并行优化实现。实验结果表明,所提并行优化方法实现单核计算效率最高能达到64.95%,在带宽受限情况下,多核并行扩展效率可达到48.36%~88.52%,在典型网络ResNet50上的执行性能与E5-2640 CPU相比,获得了5.39倍性能加速。  相似文献   

15.
将小波包变换理论应用于多载波码分多址(MC-CDMA)系统,提出一种基于小波包函数的正交调制方法.系统中,发端数据串并转换成若干子信道,每个子信道的数据进行直序扩频,不同子信道上的数据以chip调制不同的小波包函数作为基带传输波形.小波包函数的一系列优良性质,使系统能有效地抗多径干扰,抑制子信道串扰、多址干扰等.本文对系统在多径Rayleigh慢衰落信道中的性能,进行了理论分析和计算机仿真.结果表明,本系统比基于DFT的MC-CDMA有较大的性能改善.  相似文献   

16.
为了加快卷积神经网络模型的计算速度,便于大规模神经网络模型在嵌入式微处理器中的实现,以FT-matrix2000向量处理器体系结构为研究背景,通过对多核向量处理器体系结构的分析和对卷积神经网络算法的深入研究,提出将规模较小的卷积核数据置于标量存储体,尺寸较大的卷积矩阵置于向量存储体的数据布局方案。针对矩阵卷积中数据难以复用的问题,提出根据卷积核移动步长的不同动态可配置的混洗模式,通过对所取卷积矩阵元素进行不同的移位操作,进而大幅提高卷积矩阵数据的复用率。针对二维矩阵卷积由于存在数据相关性进而难以多核并行的问题,提出将卷积矩阵多核共享,卷积核矩阵多核独享的多核并行方案。设计了卷积核尺寸不变、卷积矩阵规模变化和卷积矩阵尺寸不变、卷积核规模变化的两种计算方式,并在主流CPU、GPU、TI6678、FT-matrix2000平台进行了性能对比与分析。实验结果表明:FT-matrix2000相比CPU最高可加速238倍,相比TI6678可加速21倍,相比GPU可加速663 805倍。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号