首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 609 毫秒
1.
为减少远程Cache访问延迟,提高共享存储系统的性能,提出了一种新的基于程序内在写突发特性的最后一次写访问预测方法,并对一个具体的目录协议进行了改造,以支持该预测方法。通过预测Cache块的最后一次写访问并提前对其进行降级,处理器能直接从主存中读取数据,从而减少了远程Cache访问所需的一个网络跳步数。与当前基于指令的预测方法相比,该方法能极大减少存储开销。基准测试程序的评测结果表明,该方法能获得83.1%的预测准确率,并且能提高8.57%的程序执行性能,同时与基于指令的预测方法相比,该方法能分别减少历史踪迹表69%的存储开销和签名表36%的存储开销。  相似文献   

2.
为减少远程Cache访问延迟,提高共享存储系统的性能,提出了一种新的基于程序内在写突发特性的最后一次写访问预测方法,并对一个具体的目录协议进行了改造,以支持该预测方法。通过预测Cache块的最后一次写访问并提前对其进行降级,处理器能直接从主存中读取数据,从而减少了远程Cache访问所需的一个网络跳步数。与当前基于指令的预测方法相比,该方法能极大减少存储开销。基准测试程序的评测结果表明,该方法能获得83.1%的预测准确率,并且能提高8.57%的程序执行性能,同时与基于指令的预测方法相比,该方法能分别减少历史踪迹表69%的存储开销和签名表36%的存储开销。  相似文献   

3.
在大规模并行处理系统中,通讯开销是影响程序性能的一个重要因素。本文提出了一种MPPFortran程序中串行循环的优化技术:在串行循环中加入同步控制、将串行循环转换成共享循环。该技术能减少通讯开销、提高程序的性能。  相似文献   

4.
文章针对紫外光通信传输距离受限特点,提出采用基于Pastry的低开销、快速定位的对等网络组网方式S-Pastry建立点对点之间的数据链路,并分析了S-Pastry的算法性能。仿真结果表明,基于S-Pastry的紫外光通信组网技术能实现了低开销、快速定位的紫外光通信数据链接。  相似文献   

5.
针对传统混合模糊测试提升技术多聚焦于利用多种动静态分析手段辅助而忽略了混合符号执行自身性能的问题,提出一种混合模糊测试平衡点模型,并基于该模型对主流混合符号执行方案进行剖析,包括污点分析辅助模糊测试、混合模糊测试以及混合符号执行,归纳了6种符号执行方案,基于混合符号执行引擎Triton复现了6种符号执行方案,并通过10个典型真实程序进行了测试评估。从效率、内存、覆盖率三个维度对各个方案进行性能对比与影响因素分析。实验证明,优化方案都可以消除不必要的约束并减少时间和空间开销,但约束缩减会造成信息丢失,造成覆盖率降低。基于实验数据分析,提出了一个优化方案的性能序列,并提出三种针对不同测试需求的优化方案。  相似文献   

6.
针对传统模拟电路故障诊断方法识别准确率低及耗时较长的问题,提出一种基于改进的二进制粒子群优化算法(IBPSO)与隐马尔科夫模型(HMM)的综合诊断方法。该方法利用IBPSO对故障特征进行提取优化,降低故障特征维度,进一步利用HMM对提取的故障特征进行预处理,排除不可能类故障特征,提高了LSSVM的分类准确率。经过仿真结果分析验证,该方法较现有的BP神经网络诊断方法,能够在确保正确率得到提升的基础上,进一步提高故障诊断速度,具有更强的战场环境适用性。  相似文献   

7.
为进一步提升阻塞式干扰环境下跳频通信系统的抗干扰能力,在信道估计良好的情况下,利用混合信道下优化的低密度奇偶校验码(LDPC)度序列对跳频通信系统进行了改进。仿真验证2048码长、0.5码率在40%删除概率度优化序列下的性能较高斯信道下优化度序列性能在10-5误码率下提升0.62 dB。并针对实际作战使用问题提出了一种低复杂度的折中的使用方案。  相似文献   

8.
针对标准支持向量回归波束形成器的计算复杂度高、内存开销大、训练速度慢的缺点,提出了邻近支持向量机(Proximal Support Vector Machine,PSVM)波束优化方法。PSVM打破了通过对偶问题求解原问题的传统思维,将支持向量回归的约束条件等式化,直接对原问题进行分析与求解,给出了基于PSVM波束形成器的优化模型及具体实现过程,并进行了数值仿真实验。研究结果表明,在保持波束形成器性能基本不变的情况下,降低了计算复杂度,减少了内存开销,提高了训练速度。与传统的支持向量回归波束形成相比,具有良好的快速性,为波束形成器的优化设计提供了一种新的有效方法。  相似文献   

9.
为降低消费者租借云计算系统资源的开销,提出了成本约束的内存预留随机整数线性规划模型及方法。结合预留计划和按需计划的内存资源价格,设计包含成本及资源总量约束条件的随机开销函数,并以函数期望值最小化为目标,基于内存消耗量概率分布求出优化的内存预留量。试验表明,消费者利用该方法租借资源的开销比利用预留计划、按需计划及同类方法租借资源的开销更小。  相似文献   

10.
聚合通信广泛应用于高性能计算的研究和工程领域。在大规模的科学和工程计算中,聚合通信开销占据很大比例,有时甚至可达到全部消息传递开销的80%,是高性能计算系统的性能瓶颈。因此提出了一种基于网卡的归约计算硬件卸载机制,通过在网卡上嵌入归约操作逻辑部件,实现了数据在传输过程中的计算,减轻了CPU的负担,降低了通信延迟。通过FPGA平台实现了16节点的归约操作实验,并基于xNetSimPlus模拟器模拟了不同节点规模的归约操作。实验证明,卸载机制能有效减少聚合通信中归约操作的时间,所提支持归约计算的网卡卸载机制最高可以加速归约操作2.71倍。  相似文献   

11.
对计算流体力学(CFD)程序CNS提出一种Offload模式下基于内外子区域划分的异构并行算法,结合结构化网格下有限差分计算和四阶龙格库塔方法的特点,引入ghost网格点区域,设计了一种ghost区域收缩计算策略,显著降低了异构计算资源之间的数据传输开销,负载均衡时CPU端的计算与MPI通信完全和加速器端的计算重叠,提高了异构协同并行性。推导了保证计算正确性的ghost区域的参数,分析了负载均衡的条件。在“CPU(Intel Haswell Xeon E5-2670 12 cores ×2)+加速器(Xeon Phi 7120A ×2)”的服务器上测得该算法较直接将任务子块整体迁至加速器端计算的异构算法性能平均提升5.9倍,较MPI/OpenMP两级并行算法使用24个纯CPU核的性能,该算法使用单加速器时加速1.27倍,使用双加速器加速1.45倍。讨论和分析了性能瓶颈与存在的问题。  相似文献   

12.
对计算流体力学(Computational Fluid Dynamics, CFD)程序CNS提出一种Offload模式下对任务内外子区域划分的异构并行算法,结合结构化网格下有限差分计算和四阶龙格-库塔方法的特点,引入ghost网格点区域,设计了一种ghost区域收缩计算策略,显著降低了异构计算资源之间的数据传输开销,负载均衡时CPU端的计算与MPI通信完全和加速器端的计算重叠,提高了异构协同并行性。推导了保证计算正确性的ghost区域的参数,分析了负载均衡的条件。在"CPU(Intel Haswell Xeon E5-2670 12 cores×2)+加速器(Xeon Phi 7120A×2)"的服务器上测得该算法较直接将任务子块整体迁至加速器端计算的异构算法性能平均提升至5.9倍,较MPI/OpenMP两级并行算法使用24个纯CPU核的性能,该算法使用单加速器时加速至1.27倍,使用双加速器加速至1.45倍。讨论和分析了性能瓶颈与存在的问题。  相似文献   

13.
栅格数据处理中邻域型算法的并行优化方法   总被引:1,自引:1,他引:0       下载免费PDF全文
随着并行计算的成熟,众多数据密集型的栅格处理算法亟需利用并行计算来缩减执行时间.针对其中一类邻域型算法,构建了用于估计是时间代价的串行/并行时域模型,分析了各个组成的代价影响因素,提出了降低数据I/O代价的并行I/O方法和降低数据通信代价的光圈预测方法.实验证明,所提的两个优化方法可以使邻域型栅格处理算法的并行程序更加充分地利用并行计算资源,进而在一般并行化的基础上进一步提升其并行性能.  相似文献   

14.
本文论述了多帧速系统在多机环境下并行仿真时处理机分配的原则,指出为减少通信开销,应将多帧速系统中各个子系统分配到不同的处理机(群) 上并行处理。并给出了多帧速系统的仿真主控流程。  相似文献   

15.
针对多径信道条件下,偏移正交幅度调制的正交频分复用(OQAM/OFDM)系统中采用导频序列方式进行信道估计时导频开销较大的问题,提出一种基于压缩感知的离散导频信道估计方法。该方法利用无线信道的稀疏特性,建立基于压缩感知的OQAM/OFDM系统信道估计模型,对离散导频结构进行了优化设计,使较少的导频符号随机分布在子载波上,在接收端利用信号恢复算法实现信道估计。该方法能够显著减少导频数量,并实现高精度信道估计性能,通过实验仿真对比验证了所提方法在慢时变和快时变的无线信道条件下的有效性。  相似文献   

16.
舰船的舷角是鱼雷攻击时的重要参数,同时也是海航避碰中避碰线路确定的计算依据。在基于视觉的识别中,获取目标舰船的舷角即可确定其相对拍摄视角,从而大大缩小在全方位视野特征库中的搜索范围,提高识别速度。然而现有的舷角测量方法均是采用连续跟踪解算实现的,无法实时测量。为解决实时测量的问题,首先推导了基于视觉的目标舰船舷角测量原理,然后针对摄像机倾斜的情况提出基于水天线校正的改进方法,最后通过实验验证,结果表明方法简单易操作、实时性好。  相似文献   

17.
Most operating systems for large computing facilities involve service disciplines which base, to some extent, the sequencing of object program executions on the amount of running time they require. It is the object of this paper to study mathematical models of such service disciplines applicable to both batch and time-shared processing systems. In particular, Markov queueing models are defined and analyzed for round-robin and foreground-background service disciplines. With the round-robin discipline, the service facility processes each program or job for a maximum of q seconds; if the program's service is completed during this quantum, it leaves the system, otherwise it returns to the end of the waiting line to await another quantum of service. With the foreground-background discipline each new arrival joins the end of the foreground queue and awaits a single quantum of service. If it requires more it is subsequently placed at the end of the background queue which is allocated service only when the foreground queue is empty. The analysis focuses on the efficiency of the above systems by assuming a swap or set-up time (overhead cost) associated with the switching of programs on and off the processor. The analysis leads to generating functions for the equilibrium queue length probabilities, the moments of this latter distribution, and measures of mean waiting times. The paper concludes with a discussion of the results along with several examples.  相似文献   

18.
摘要:针对现有的测试响应压缩方法在未知位处理能力、混淆能力、诊断能力和压缩能力方面只侧重于单一能力的问题,首次将LDPC编码技术应用于测试响应压缩中,提出一种基于规则LDPC码校验矩阵的测试响应压缩方法.通过对上述4种能力进行仿真分析得出,该方法与现有测试响应压缩方法相比整体性能有明显的提升.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号