首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
基于栅格分层的逐栅格汇流算法并行化研究   总被引:2,自引:2,他引:0       下载免费PDF全文
分布式水文模型中的逐栅格汇流算法计算量大,需要借助并行计算以满足大流域长历时模拟的要求。针对目前鲜有对基于隐式有限差分的逐栅格汇流算法进行并行计算研究的情况,基于栅格分层的思想提出一种适用于共享内存并行计算环境的逐栅格汇流并行算法。该算法首先根据流向进行栅格分层,使同一层中栅格的计算相互独立,然后将同一层中栅格的计算任务分配到多个计算单元并行计算。采用C++编程语言与OpenMP并行编程库实现了该算法,并选择河北省清水河流域为实验区,在不同数据规模(30m、90m、270m分辨率)、不同核数(2~20个)以及不同栅格分层方法的情况下对算法性能进行了测试。实验结果表明本文提出的并行算法具有较好的加速比和并行效率,且并行效率随数据规模的增大而增大。栅格分层方法对算法并行性能有明显影响,从上到下的分层方法比从下到上的方法具有更高的并行效率。  相似文献   

2.
北斗系统静止轨道卫星信号盲区解算方法复杂、串行计算耗费时间长,需在并行环境下利用更多的计算资源进行北斗盲区的快速解算。本文在分析北斗盲区解算原理与算法并行特征基础上,提出了基于动态盲区影响域的并行解算方法,并以栅格单元为并行粒度进行任务划分,实现了北斗盲区的高效并行解算。基于全国范围59景数字高程模型数据,利用8进程进行盲区并行解算,耗费时间约为5小时。实验测试结果表明:算法的并行效率随着进程数的增加有所衰减,但稳定在96%以上。基于本文方法实现的程序中间件已集成应用于高性能地理信息平台中,应用效果良好。  相似文献   

3.
北斗系统静止轨道卫星信号盲区解算方法复杂,串行计算耗费时间长,须在并行环境下利用更多的计算资源进行北斗盲区的快速解算。在分析北斗盲区解算原理与算法并行特征基础上,提出动态盲区影响域的并行解算方法。以栅格单元为并行粒度进行任务划分,实现了北斗盲区的高效并行解算。运用全国范围59景数字高程模型数据,利用8进程进行盲区并行解算,耗费时间约为5小时。实验测试结果表明:算法的并行效率随着进程数的增加有所衰减,但稳定在96%以上。其程序中间件已集成应用于高性能地理信息平台,应用效果良好。  相似文献   

4.
针对分布式综合化(DIMA)架构下实时动态消息流和网络资源能力,优化航空数据和通信网络(ADCN)拓扑问题,提出一种基于业务拓扑、网络拓扑以及延迟、线缆约束下的多目标网络拓扑优化算法。该算法能够基于驻留任务的信号、逻辑连接、物理连接关系,在资源约束下优化机载网络拓扑。算法通过组合优化方法计算折中全局最优解集(Pareto最优)。对于大规模机载网络架构优化,为了减少计算规模和提高计算时间,又提出一种预计算路径算法。算法通过类A320机载网络拓扑场景和类A380机载网络拓扑场景进行验证。结果表明,相比手动功能映射和网络拓扑优化设计,优化效率能提高10%~30%。  相似文献   

5.
分布式并行地形分析中数据划分机制研究   总被引:1,自引:0,他引:1       下载免费PDF全文
数据粒度是海量空间数据并行计算的重要问题之一。通过对不同性质的并行算法的对比分析,提出空间数据粒度模型,量化地反映并行地形分析中数据划分的规模,建立并行数据粒度评价模型。通过研究集群环境下不同算法的数据并行数据粒度问题,提出基于并行数据粒度评价模型的优化数据粒度调度算法。通过计算每一次并行计算的时间与数据粒度效率,从而实现对计算数据粒度动态更新以追求更高的加速比。经过实验验证,该算法较之传统算法,可提供更高的任务执行效率并具有更好的可移植性。  相似文献   

6.
针对多边形并行栅格化中的负载不均衡问题提出一种新的数据划分方法,主要包括:迭代计算划分线的位置,在每次迭代中保证分块间的计算量大致均衡,完成数据划分、实现负载均衡;提出基于二叉树的划分结果融合策略,以解决跨边界多边形的融合问题。在多核CPU环境下实现并行算法,选用多个典型土地利用现状数据集进行测试。结果表明:针对不同类型多边形数据集,所提方法较传统方法可获得更高的并行加速比和更好的负载均衡;针对大数据量数据集,以多边形节点数为度量标准可更精确地估算分块计算量,从而更好地实现负载均衡。  相似文献   

7.
一种面向多核处理器的高效并行PCA-SIFT算法   总被引:1,自引:0,他引:1       下载免费PDF全文
提出一种面向多核处理器的并行PCA-SIFT算法,采用数据级并行方法实现并行的特征提取和特征点匹配,将计算任务分配到各个DSP核并行处理,充分开发多核处理器的多级并行性.实验结果表明,并行PCA-SIFT算法对各种不同图像形变的图像具有良好的适应性,具有接近串行PCA-SIFT算法的图像匹配能力,平均加速比达3.12.  相似文献   

8.
新的空间物点定位解算方法   总被引:1,自引:0,他引:1  
目前近景摄影测量学空间物点定位主要应用的是空间点线线交会原理,其数学基本形式有两种:共线方程交会法和投影矩阵交会法.针对近景摄影测量学空间物点定位原理,在共线方程交会法的基础上,提出了一种新的空间物点定位解算方法.该方法应用多元函数极值定理和克莱姆法则对空间线线交会问题进行求解,给出了详细的运算过程.实验证明了该算法的准确性.  相似文献   

9.
拓扑结构/模糊逻辑的车载导航系统地图匹配算法   总被引:1,自引:0,他引:1  
研究了地图匹配技术在车辆组合导航系统中的特点,利用模糊逻辑处理近似信息的优势和路网的拓扑结构,提出了一种基于拓扑结构/模糊逻辑的匹配地图算法,通过模糊逻辑部分的搜索子算法和投影子算法计算路段的隶属度,再结合路网自身的拓扑结构来选择匹配路段及投影匹配点,详细介绍了该算法的设计和流程.实际跑车实验证明,该算法有效地提高了匹配正确率和匹配效率.  相似文献   

10.
在CPU/GPU异构体系结构计算集群上,建立了基于MPI+CUDA的异构并行可压缩流求解器。讨论了异构结构上的可压缩流并行算法的并行模式,在CPU上执行计算密集度低、指令复杂的计算任务,在GPU上执行计算密集度高、指令单一的计算任务。通过数个算例,对比了异构并行计算和传统CPU并行计算计算结果和计算效率。将该算法运用于高超声速流动的数值模拟中,数值结果显示,基于MPI+CUDA的异构并行可压缩流求解器鲁棒性好,计算效率较CPU同构并行计算提高10倍以上。  相似文献   

11.
针对传统基于激光雷达(Light Detection And Ranging,LiDAR)数据的树种分类方法难以直接且全面地利用点云的三维结构信息的问题,提出一种基于三维深度学习的机载LiDAR数据的树种分类方法.该方法直接从三维数据中抽象出高维特征,而无须将点云转化为体素或二维图像.以塞罕坝国家森林公园内白桦和落叶松...  相似文献   

12.
本文用时间相关法计算了固体火箭发动机燃烧室─喷管亚跨声速流场数值解,控制方程用MacCormack二步显格式:边界点参数用物理边界条件和参考平面上的特征方程计算。计算表明,达到收敛的数值积分步数比纯喷管的跨声速计算要多得多。虽然喷管壁上和轴线上的马赫数分布与纯喷管计算类似,但喷管中的等马赫线分布与纯喷管计算的结果[3]相差较远。  相似文献   

13.
基于有限体积方法、TVD差分格式和显式Runge-Kutta迭代方法的框架,针对超声速/高超声速飞行器绕流流场,在超级并行计算机上完成了2~64个CPU并行数值计算工作。通过测试程序在超级计算机上的并行效率,并将并行程序应用于航天飞机绕流流场计算,检验了计算程序进行大规模并行计算的性能。结果表明,在负载平衡的条件下,程序在该超级并行计算机上达到了不同程度的超线性加速比,并行效率最高达到了126%,远远高于微机Cluster并行平台上的结果,适合复杂流场的大规模并行计算。  相似文献   

14.
计算流体动力学的一些领域中经常要用到流场点到壁面的最小距离,为了提高壁面距离计算的精度和效率,将KD树应用于非结构网格的壁面距离计算,计算了若干三维外形的壁面距离,结果表明:基于KD树的网格壁面距离计算方法鲁棒性好,计算效率和结果精度高,适应复杂外形的能力强;算法的通用性好,可以拓展应用到多种网格类型。  相似文献   

15.
针对包含运动边界的非定常流动问题,基于弹簧近似法设计了一套非结构动网格分区并行计算流程,引入了METIS软件进行非结构网格二次剖分,研究了对接边界通信类型及其处理方法,基于消息传递并行编程模式实现了非结构动网格求解器的并行化。测试结果表明:该求解器具有较高的并行效率,网格变形模块对非结构动网格并行计算性能具有重要影响。  相似文献   

16.
面向云计算的数据中心网络拓扑研究   总被引:2,自引:0,他引:2       下载免费PDF全文
目前对数据中心网络拓扑的研究主要集中在如何提高结构性能上,却忽略了数据中心网络拓扑是否与云计算机制相适应的问题.针对该问题,建立了一种面向云计算的数据中心网络拓扑结构.研究了在具有该拓扑结构的数据中心网络上执行主流云计算机制的方法.分析了该拓扑结构的网络规模、网络直径等性能.仿真结果表明在具有该拓扑结构的数据中心网络上...  相似文献   

17.
向量化算法映射是向量处理器的难点问题。提出一种高效的支持原位计算的三角矩阵乘法向量化方法:将L1D配置为SRAM模式,用双缓冲的乒乓方式平滑多级存储结构的数据传输,使得内核的计算与DMA数据搬移完全重叠,让内核始终以峰值速度运行,从而取得最佳的计算效率;将不规则的三角矩阵乘法计算均衡分布到各个向量处理单元,充分开发向量处理器的多级并行性;将结果矩阵保存在乘数矩阵中,实现原位计算,节省了存储空间。实验结果表明,提出的向量化方法使三角矩阵乘法性能达到1053.7GFLOPS,效率为91.47%。  相似文献   

18.
针对现有的跑道失效率计算方法对数据的处理要求很复杂,并且计算效率较低,难以满足实时性要求的不足,提出一种快速的解析近似计算方法,通过有利弹着区的选取以及瞄准点的优化选择,将问题从搜索最小升降窗口转化为求解母弹对有利弹着区的命中概率,免去了搜索升降窗口的计算时间,从而大幅提高了计算效率。仿真结果表明,快速解析近似计算方法计算速度快且满足了精度要求。  相似文献   

19.
依据境界之间的拓扑数据,采用拓扑分析、边界追踪、边界闭环构建、边界约束下的凸分解、区域填充和边界符号化等技术手段,提出了OpenGL渲染环境下军用数字地图政区的构建方法.通过具体的软件开发和真实数据的测试,证明该方法生成政区准确、符号美观,可适用于不同比例尺下数字地图的显示.该算法具有较强的通用性,遵循国军标的相关规定,已经在相关数字地图软件中得以应用.  相似文献   

20.
在计算需求层面对多种典型信号处理算法与深度学习算法进行了分析与模块化分解,提取了两类应用共有的且适合并行硬件加速的计算模块,提出了信号处理与深度学习的一致性计算模型,并基于一致性计算模型设计了控制与计算分离的层次化处理单元与阵列化计算结构。通过对不同应用计算过程的软件定义能够实现信号处理与深度学习的一致性硬件加速计算,基于Zynq计算平台从重构效率与计算性能两个方面对一致性计算模型与计算结构进行了验证,结果表明:基于一致性计算模型的软件定义可重构计算结构,具有较高的计算性能与重构效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号