首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 316 毫秒
1.
复杂体系的结构分析和建模研究   总被引:3,自引:0,他引:3       下载免费PDF全文
根据复杂体系的概念及其所呈现出的多种特性,利用复杂体系的使命分解和复杂体系的元素组成对复杂体系进行综合的结构分析,描述了目标分解、功能分解和行为分解的复杂体系使命目标三阶段分解过程以及系统单元、复合元和体系外部环境的复杂体系三元素结构框架。在此基础上,提出了采用一种“两层四级”的设计思想对复杂体系进行有效的结构建模设计,并针对复杂体系内部的相互位置层次及其功能关联定义了度量实体、层级映射、系统关联性和软构层等相关概念,清晰地阐释了复杂体系结构分析和建模时体系层次映射的实质,从而为复杂体系的效能评估以及体系改进和优化提供一定的理论指导。  相似文献   

2.
基于GPU的二维离散小波变换快速计算   总被引:1,自引:0,他引:1       下载免费PDF全文
通过分析小波变换的多相表示和GPU通用计算模型,结合现代GPU的多纹理和多渲染目标特性,提出了一种基于GPU与多相表示的二维离散小波变换计算方法,该方法使小波变换的计算形式完全适合GPU的SIMD结构,同时大幅减少了纹理访问次数,充分利用了GPU的矢量运算和二维寻址能力,实验表明该方法在处理速度上有大幅的提高。  相似文献   

3.
根据一种层次数据的特点,采用层次编码标识实体的方式进行数据存取,并在此基础上进行表设计.使用触发器、存储过程、视图、客户端计算等方式逐层统计层次节点上的费用.最后,分析了这几种方式的特点和适用范围.  相似文献   

4.
武器装备体系通过提供相应的能力来支持其使命任务的完成,而武器装备体系需要完成的使命任务多、需要的能力数量多,相互的关系复杂.为了清楚地描述武器装备体系使命、任务和能力之间的映射关系以及抽取武器装备体系能力之间的关联关系,在对武器装备体系使命、任务和能力层次关系描述的基础上,构建了武器装备体系作战任务一能力概念格,分析了...  相似文献   

5.
利用CUDA Fortran语言发展了一种基于GPU的计算流体力学可压缩湍流求解器。该求解器基于结构网格有限体积法,空间离散采用AUSMPW 格式,湍流模型为k-ω SST两方程模型,采用MPI实现并行计算。针对最新的GPU架构,讨论了通量计算的优化方法及GPU计算与PCIe数据传输、MPI通信重叠的多GPU并行算法。进行了超声速进气道及空天飞机等算例的数值模拟以验证GPU在大网格量情况下的加速性能。计算结果表明相对于Intel Xeon E5-2670 CPU单一核心的计算时间,单块NVIDIA GTX Titan Black GPU可获得107至125倍的加速比。利用四块GPU实现了复杂外形1.34亿网格的快速计算,并行效率为91.6%。  相似文献   

6.
在事件数据的push和pull之间实现更好的平衡是无线传感器网络数据分发算法节能的关键.分析了两种典型的有结构和无结构的数据分发算法,结合这两种算法使用的push pull策略,针对无线传感器网络的ANY型查询的特定需求,提出了两种基于有结构和无结构存储模式相结合的混合型数据分发算法SDC1&2.分析表明,这两种算法在保证push pull之间平衡的前提下解决了已有算法存在的热点问题、存储拷贝数多和查询性能低问题,能更好地适应ANY型查询的特点,是两种能量高效的数据分发算法.  相似文献   

7.
利用CUDA Fortran语言发展了基于图形处理器(GPU)的计算流体力学可压缩湍流求解器。该求解器基于结构网格有限体积法,空间离散采用AUSMPW+格式,湍流模型为k-ωSST两方程模型,采用MPI实现并行计算。针对最新的GPU架构,讨论了通量计算的优化方法及GPU计算与PCIe数据传输、MPI通信重叠的多GPU并行算法。进行了超声速进气道及空天飞机等算例的数值模拟以验证GPU在大网格量情况下的加速性能。计算结果表明:相对于Intel Xeon E5-2670 CPU单一核心的计算时间,单块NVIDIA GTX Titan Black GPU可获得107~125倍的加速比。利用四块GPU实现了复杂外形1.34亿网格的快速计算,并行效率为91.6%。  相似文献   

8.
RNA二级结构预测是生物信息学领域重要的研究方向,基于最小自由能模型的Zuker算法是目前该领域最典型使用最广泛的算法之一。本文基于CPU GPU的混合计算平台实现了对Zuker算法的并行和加速。根据CPU和GPU计算性能的差异,通过合理的任务分配策略,实现二者之间的并行协作计算和处理单元间的负载平衡;针对CPU和GPU的不同硬件特性,对Zuker算法在CPU和GPU上的实现分别采取了不同的并行优化方法,提高了混合加速系统的计算性能。实验结果表明,CPU处理单元在混合系统中承担了14%以上的计算任务,与传统的多核CPU并行方案相比,采用混合并行加速方法可获得15.93的全局加速比;与最优的单纯GPU加速方案相比,可获得16%的性能提升,并且该混合计算方案可用于对其它生物信息学序列分析应用的并行和加速。  相似文献   

9.
根据构建原则建立分层次的雷达网探测效能评估体系,针对体系指标量化困难,评价模糊,结构多层次,运用模糊理论和层次分析法,结合控制区间和记忆模型对雷达组网探测效能评估。最后通过实例分析,证实了模糊层次分析控制区间和记忆模型方法的有效性和可操作性,为雷达组网优化部署奠下基础。  相似文献   

10.
基于Erasure Code的分割文件P2P存储结构设计   总被引:1,自引:0,他引:1       下载免费PDF全文
在充分考虑P2P存储特点的前提下,设计了一种新颖的基于Erasure Code的分割文件P2P存储方案,构建Chord协议上的P2P文件存储结构.通过设计有效的文件存储、访问和更新功能,克服传统Erasure Code冗余文件存储方案的不足,使存储文件具有一定的数据修改能力和结构伸缩能力.理论分析和实验仿真验证了设计方案在P2P存储系统中的可行性和有效性.  相似文献   

11.
为了达到异构多核处理器能直接交叉访问对方的内存地址空间的目的,通过构建统一的三级Cache结构和数据块状态标记方法,并优化Cache块状态的修改算法,提出了异构千核处理器系统的统一内存地址空间访问方法,避免了当前独立式异构计算机系统结构下复制和传输数据块所带来的大量额外访存开销。通过采用部分Rodinia基准测试程序测试,获得了最高9.8倍的系统加速比,最多减少了90%的访存频率。因此,采用该方法能有效减少异构核心间交换数据块所带来的系统开销,提高异构千核处理器的系统性能加速比。  相似文献   

12.
高性能RTI自适应通信机制研究   总被引:1,自引:0,他引:1       下载免费PDF全文
为了提高HLA仿真系统在高性能计算平台上的运行性能,针对高性能计算平台的高性能层次式通信环境,提出了一种共享内存/IB/以太网自适应RTI通信机制-SACM机制,该机制能够根据通信双方所在节点的网络拓扑信息,自适应建立延迟最小的通信连接,实现共享内存、IB等高速互连及以太网互连的自适应选择.同时在该通信机制中,针对节点内高速共享内存通信需求,提出了一种面向多盟员互连的共享内存通信算法,有效提高了节点内盟员通信效率.对象属性值更新延迟测试结果表明,该通信机制可以有效提高RTI在高性能计算平台的通信性能.  相似文献   

13.
为了加快卷积神经网络模型的计算速度,便于大规模神经网络模型在嵌入式微处理器中的实现,以FT-matrix2000向量处理器体系结构为研究背景,通过对多核向量处理器体系结构的分析和对卷积神经网络算法的深入研究,提出将规模较小的卷积核数据置于标量存储体,尺寸较大的卷积矩阵置于向量存储体的数据布局方案。针对矩阵卷积中数据难以复用的问题,提出根据卷积核移动步长的不同动态可配置的混洗模式,通过对所取卷积矩阵元素进行不同的移位操作,进而大幅提高卷积矩阵数据的复用率。针对二维矩阵卷积由于存在数据相关性进而难以多核并行的问题,提出将卷积矩阵多核共享,卷积核矩阵多核独享的多核并行方案。设计了卷积核尺寸不变、卷积矩阵规模变化和卷积矩阵尺寸不变、卷积核规模变化的两种计算方式,并在主流CPU、GPU、TI6678、FT-matrix2000平台进行了性能对比与分析。实验结果表明:FT-matrix2000相比CPU最高可加速238倍,相比TI6678可加速21倍,相比GPU可加速663 805倍。  相似文献   

14.
采用图染色方法解决通量累加和局部最大压力计算引起的两种典型资源竞争问题,并通过共享内存的使用、体编号和面编号的重排、面数据的重排三种策略优化图染色方法。针对应用在空气动力学多种规模的三维网格,分别采用双精度和单精度操作数,在Nvidia Tesla V100和K80 GPU上,展开性能测试。结果表明:共享内存的优化效果不明显;体编号和面编号重排降低了图染色方法的计算性能;面数据重排可以有效地优化图染色方法;计算性能在V100上提高20%左右,在K80上提高15%左右。  相似文献   

15.
针对图计算应用的访存特点,提出并实现一种支持高并发、乱序和异步访存的高并发访存模块(High Concurrency and high Performance Fetcher, HCPF)。通过软-硬件协同的设计方法,HCPF可同时处理192条共8种类型的内存访问请求,且访存粒度可由用户定义,满足图计算应用对海量低延迟细粒度数据访问的需求。同时,HCPF扩展了基于内存语义的跨计算节点定制互连技术,支持远程内存的细粒度直接访问,为后续实现分布式图计算框架提供技术基础。结合上述两个核心研究内容,基于流水线RISC-V处理器核,设计并实现了可支持HCPF的RISC-V片上系统(System-on-Chip,SoC)架构,搭建基于FPGA的原型验证平台,并使用自研测试程序对HCPF进行初步性能评测。实验结果表明,HCPF相比原有访存通路,最高可将基于数组和随机地址的两种随机内存访问性能分别提升至3.5倍和2.7倍。远程内存直接访问4 Byte数据的延时仅为1.63μs。  相似文献   

16.
针对分布式存储环境下显式差分方法的并行计算问题 ,依据分布式存储多处理机的体系结构特点 ,提出了一个重叠边界优化模型 ;该模型目前已成功应用于中国科学院第三代海洋环流模式的分布式并行计算优化。  相似文献   

17.
应对新形势下非常规突发事件的严峻挑战是各国政府亟待解决的问题,综合人工社会-计算实验-平行执行的ACP方法,是解决非常规突发事件应急管理问题的有效方法.本文引入ACP方法,阐述构建高性能社会计算实验动态仿真引擎的作用;按照层次化模块化思想设计动态仿真引擎D-PARSE的体系结构,详细描述各组成部分的具体功能,并基于并行...  相似文献   

18.
Kriging插值算法被广泛应用于地学各领域,有着极其重要的现实意义,但在面对大规模输出网格及大量输入采样点时,不可避免地遇到了性能瓶颈。利用Open CL和Open MP在异构平台上实现了CPU与GPU协同加速普通Kriging插值。针对Kriging插值中采样点的不规则分布及CPU和GPU由于体系结构差异对其的不同适应性,提出一种基于不同设备间计算性能的差异和数据分布特点的负载均衡方法。试验结果表明,该方法能有效提高普通Kriging插值速度,同时还能节约存储空间和提高访存效率。  相似文献   

19.
针对软件接收机相关器计算的实时性问题,通过分析扩频信号的接收过程,建立一种基于向量内积的并行相关信号接收模型。利用图形处理单元中大量的浮点运算单元进行矩阵与向量运算,并行计算各通道相关值,提高了信号相关运算的实时性。仿真验证结果表明,利用基于GPU的向量内积软件并行相关算法计算25 MHz采样率时长1 ms的信号相关值,25个通道共150个相关运算耗时967μs,与CPU上基于数学核心函数库的实现相比速度约提高了61.4倍,能够实现宽带扩频信号软件实时相关接收。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号