首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
为了降低功耗,目前能耗有效的嵌入式微处理器一般都采用分布式与层次化的寄存器文件结构。第一层的超小寄存器文件(TORF)的极小容量使得很多数据必须存放到第二层的通用寄存器文件(GRF)中,这给编译器带来了新的挑战。通过分析程序特征,提出了新的VLIW调度算法,通过在编译时对变量进行检测,在恰当的时机插入虚拟的copy操作并进行指令与通信调度,为对寄存器需求较大的全局变量与软流水变量构建了新的包含GRF的数据传输路由,将对TORF的压力转移到GRF中。实验结果表明,新的VLIW调度算法符合处理器的设计初衷。与不使用GRF相比,在程序性能只降低约8%的情况下,降低了约51%的寄存器访问能耗,43%的处理器能耗。最关键的是避免了程序员手工分配优化的难题。  相似文献   

2.
多核环境下负载均衡的并行离散事件全局调度机制   总被引:1,自引:1,他引:0       下载免费PDF全文
分析了多核环境下传统的离散事件时间弯曲并行系统的性能,针对其事件调度开销小和负载均衡能力强难以兼得的问题,提出了一种基于分布式队列的全局调度机制,设计了相应的数据结构和调度算法,大大减少了锁开销.通过大量实验对多核环境下几种典型离散事件系统并行策略的性能分析表明,本文提出的全局调度策略不仅事件调度开销小,而且回滚率大大降低,有效克服了传统策略回滚量较大或难以实现动态负载平衡的情况,并具备良好的可扩展性.  相似文献   

3.
在SIMD处理器上映射矩阵运算时会带来大量的数据重排操作从而降低系统性能。本文提出定制化的多粒度矩阵寄存器文件(MMRF)以消除数据重排操作。MMRF支持多粒度的并行行访问和列访问,从而提升矩阵运算的性能。MMRF可以被动态配置为不同的并行访问模式,在不同模式下一个或多个子矩阵可以被并行处理。实验结果显示,同传统的向量寄存器文件(VRF)和矩阵寄存器文件(MRF)相比,MMRF可分别带来2.21倍和1.6倍的平均性能提升,面积分别增加14.3%和3.7%,功耗分别增加14.6%和2.2%。同TMS320C64x+处理器相比,基于SIMD技术的FT-Matrix处理器在引入MMRF后可以得到5.65倍到7.71倍的性能提升。通过层次化的全定制设计技术,MMRF的面积和关键路径分别减少17.9%和39.1%。  相似文献   

4.
基于HLA的装备分布式虚拟维修训练过程极易产生仿真节点负载失衡,以往的负载平衡研究多关注资源利用率,仿真运行过程中可能会因节点负载的不均衡进行频繁的负载调度,影响仿真运行效率.针对此问题,以保证仿真节点的高效运行为首要目的,将负载平衡定义为不存在超载节点即为平衡,提出了一种动静结合的复合式负载平衡调度方法.研究了复合式负载平衡系统的体系结构,采用最小连接调度法实现了节点静态负载的粗粒度平衡,引入仿真运行比率分量参数表征负载量值,进而设计了动态负载平衡算法对仿真运行过程进行实时监控和调度.实验结果表明,改进后仿真平衡调度频率明显下降,实现了资源利用率和仿真效率的平衡兼顾,取得了良好的效果.  相似文献   

5.
SCP口寄存器是ISDN U接口技术中的串行控制口寄存器.SCP口寄存器可分为控制寄存器、状态寄存器以及维护信道数据寄存器;从比特位数方面考虑,SCP口寄存器也可分为三类:6个4比特宽的“半字节”寄存器NRO—NR5、一个12比特的寄存器R6以及17个8比特的字节寄存器BRO—BR15A.下面就一些主要的寄存器的比特组成进行论述.  相似文献   

6.
随着工艺尺寸的逐渐缩小,集成电路中由放射性粒子引起的软错误不断增加,在设计时必须考虑由软错误引起的可靠性问题.使用软错误免疫寄存器对电路敏感部分选择性加固是降低逻辑电路软错误率简单有效的方法.总结了常用的软错误免疫寄存器结构,并使用可靠性分析方法对8种寄存器进行量化研究和比较,得出双模时空冗余寄存器具有更高的可靠度;针对现有可靠寄存器开销较大的缺点,设计了一种基于时钟延时的动态主级时空双模冗余寄存器--DMTS-DR,不仅能很好地免疫自身的SEU,还能对前级组合逻辑的SET进行有效屏蔽.与其它可靠寄存器相比,DMTS-DR的面积和延时开销都有大幅降低,在可靠性、面积和速度间实现了较好的折中.  相似文献   

7.
代码体积和代码稀疏是VLIW处理器一直存在的问题.通过对一系列典型应用在流处理器上的程序特征进行分析,提出了一种新的VLIW分域压缩技术,剔除各个子域中的空操作,并设计了分布式指令存储器对压缩后的代码进行解压缩执行.实验证明,该技术能够减少MASA流处理器中近39%的片外指令访存,降低约65%的片上指令存储器空间需求;同时使得指令存储器面积和系统面积分别减少了约37%和8.9%.  相似文献   

8.
针对当前预警监视任务中雷达组网资源调度方法难以与太空目标数量井喷式增长、太空武器多样化发展的趋势相适应,而资源调度具有场景复杂、计算量大、精度要求高等特点的问题,在对反导预警与空间目标监视2类任务中资源调度原则分析的基础上,引入层次分析法与人工智能算法对资源调度问题进行求解,在任务和雷达2个层面实现了面向预警监视任务的雷达组网智能化资源调度。在任务层面,基于层次分析法对任务优先级进行了划分,为面临多个任务冲突时的任务优先选取提供了解决途径;在雷达层面,通过构建2类任务场景下的资源调度模型,在模拟退火算法和粒子群算法的基础上进行改进,提出了面向目标分配排序作业的模拟退火混合离散粒子群算法,对资源调度方案优化中的计算时间、资源节省率、算法合格率等3个指标进行了提升,有效提高了预警监视任务中雷达组网的探测效能。  相似文献   

9.
针对分布式多站雷达协同定位下的功率分配问题,提出一种改进凸松弛的启发式算法。给出了分布式多站雷达定位误差的克劳美罗下界(CRLB),建立功率约束下最小化CRLB迹的功率分配模型。设计了一种改进凸松弛算法,通过迭代修正松弛参数和快速功率调整策略解决非凸优化问题消除松弛带来的误差。仿真实验表明,相对于均匀功率分配算法和基于凸松弛的功率分配算法,改进凸松弛启发式功率分配算法下目标的定位性能更优。  相似文献   

10.
随着线路传输速率的快速提高,报文线速转发面临极大挑战。基于并行处理技术,提出分布式并行转发引擎结构,实现高速报文转发。针对并行转发引擎负载分配问题,设计AHDA(Adaptive Hashing DispatchAlgorithm)算法,该算法为综合考虑负载均衡和报文保序提供支持。模拟结果表明,AHDA算法均匀分配负载,保证很低的报文乱序率,对网络处理器规模具有良好的可扩展性。  相似文献   

11.
为了开发分布式系统中的计算资源,我们设计了一个基于面向对象大粒度数据流模型的并行C++系统OOCPCS.该系统的底层计算模型是面向对象范式和数据流模型的结合体。它将状态对象引入到数据流模型中,并且支持面向对象的特性。本文讨论了此模型在OOCPCS系统中的实现;并行化编译器;POC程序设计语言;面向对象网络文件I/O和虚拟OOLGDFM机  相似文献   

12.
韩礼德的语域理论是系统功能语法的重要理论之一,它强调语言的交际功能和社会意义。文章探讨了如何将语域知识运用于大学英语教学实践,这种尝试不仅能使学生的阅读理解能力得到提高,而且有利于听、说、写、译等综合能力的提高,从而找到一种较好的教学方法,加速学生从语言知识向语言应用能力转化的过程。  相似文献   

13.
针对传统的栅格数据存储策略不能满足分布式计算环境下粗粒度数据访问需求,应对海量栅格数据计算时效率低下的问题,结合分布式文件系统的存储特点,同时考虑地图代数算子在Map/Reduce阶段以栅格瓦片为单位的计算特点,提出一种基于Hadoop分布式文件系统的栅格瓦片存储策略。围绕栅格数据瓦片分割、压缩瓦片数据组织与存储、分布式文件输入输出接口改进等方面对该存储策略加以实现,并使用基于该存储策略的地图代数局部算子的分布式计算流程加以验证。理论分析与实验结果表明,该策略能够显著提高分布式计算环境下空间分析算子的运算速度。  相似文献   

14.
在局部网络环境下实现分布式文件系统和远程过程调用是实现高层分布式软件的基础。本文在分析Netware层次结构的基础上,给出了一个在网络层上的分布式文件系统和远程过程调用的设计与实现,详细讨论了该系统的功能、用户界面和实现中的技术问题,包括可靠性和并发控制等必须解决的问题。本文的工作是为在Novell网上实现分布式数据库而设计的。  相似文献   

15.
动态二进制翻译在实现多源到多目标的程序翻译过程中,为屏蔽不同源平台间的硬件差异引入中间代码,采用内存虚拟策略进行实现,但同时带来中间代码膨胀问题。传统的中间代码优化方法主要采用对冗余指令进行匹配删除的方法。将优化重点聚焦在针对特殊指令匹配的中间表示规则替换上,提出了一种基于中间表示规则替换的二进制翻译中间代码优化方法。该方法针对中间代码膨胀所呈现的几种典型情景,描述了中间表示替换规则,并将以往应用在后端代码优化上的寄存器直接映射策略应用在此处。通过建立映射公式,实现了将原来的内存虚拟操作替换为本地寄存器操作,从而降低了中间代码膨胀率。使用SPEC CPU2006测试集进行了实验,验证了此优化方法的正确性和有效性。测试用例在优化前和优化后的执行结果一致,验证了优化方法的正确性;优化后测试用例的中间代码平均缩减率达到32.59%,验证了优化方法的有效性。  相似文献   

16.
大数据背景下,网络文件系统NFS作为一种成熟的分布式文件系统,为数据存储、管理提供了良好解决方案;So PC是基于软硬件协同设计的片上可编程系统,应用前景十分广泛。系统以SATA硬盘为存储介质实现了一个基于So PC的完整网络存储结构。重点介绍了如何在FPGA内嵌Micro Blaze处理器上设计实现NFS服务组件、文件系统软件,以及如何设计实现SATA硬盘控制硬件IP核。经Xilinx的XUPV5_LX110T开发平台调试验证,So PC网络存储软硬件系统工作正常,可以用作云存储的虚拟资源节点。  相似文献   

17.
编程实现局域网内可靠传输文件的方法研究   总被引:2,自引:0,他引:2  
针对在开发船舶动力系统分布式设计环境过程中遇到的文件传输问题,讨论了分别基于Socket技术和.NET Remoting技术的编程实现方法.通过比较发现,后者具有编程简单、使用可靠等方面的明显优势.另外,通过实验方式确定了传送过程中数据块大小的选择,并对文件加密解密的问题采用了加入随机数据的方式进行解决.  相似文献   

18.
发展了单向并行分裂法(SPP)用于求解三对角和块三对角线性方程组,算法考虑了三对角线性系统求解中文件IO及结果传输通信所占时间比例较大的特点,充分利用了计算、文件IO与通信三者之间的重叠。分析了SPP算法的计算与通信开销。在工作站机群上进行了测试分析,结果表明SPP算法适合于分布式计算  相似文献   

19.
本文阐述了一种在单机上模拟MPP机执行并行汇编代码的方法。这种并行汇编代码由MPPFORTRAN编译器生成。由于在一个大型工程中,编译生成的目标代码运行环境不一定能及时具备,所以,研制汇编代码模拟环境DPFAS有助于及早验证编译目标代码的正确性和完备性。本文通过共享进程组在SGI工作站上实现多机环境模拟和远程地址访问模拟。此模拟环境的实现对MPP数据并行FORTRAN编译器的正确性验证和效率评估有一定的帮助。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号