首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
针对舰船传感器视频信号高清化和数字视频总线传输实时化需求,分析多核DSP并行处理和JPEG编码算法的基础上,提出了基于多核DSP的JPEG图像编码实现方法,以TI公司TMS320C6678数字信号处理器为硬件平台,实现了多核DSP核间高效通信和任务级并行处理。实验测试JPEG算法核心组件,优化编码子系统可进一步提升系统处理能力;实验结果表明,基于八核DSP的JPEG编码系统的实时处理能力比单核系统提升了5倍,提高了视频图像压缩效率,满足数字视频总线实时性传输要求。  相似文献   

2.
针对国防科技大学自主研发的异构多核数字信号处理(digital signal processing, DSP)芯片的特征以及卷积算法自身特点,提出了一种面向多核DSP架构的高性能多核并行卷积实现方案。针对1×1卷积提出了特征图级多核并行方案;针对卷积核大于1的卷积提出了窗口级多核并行优化设计,同时提出了逐元素向量化计算的核内并行优化实现。实验结果表明,所提并行优化方法实现单核计算效率最高能达到64.95%,在带宽受限情况下,多核并行扩展效率可达到48.36%~88.52%,在典型网络ResNet50上的执行性能与E5-2640 CPU相比,获得了5.39倍性能加速。  相似文献   

3.
矩阵乘卷积算法能够为各种卷积配置提供高性能基础实现,是面向给定芯片进行卷积性能优化的首要选择。针对国防科技大学自主研制的飞腾异构多核数字信号处理器(digital signal processor, DSP)芯片的特征以及矩阵乘卷积算法自身的特点,提出了一种面向多核DSP架构的高性能并行矩阵乘卷积实现算法ftmEConv。该算法由输入特征图转换、卷积核转换、矩阵乘以及输出特征图转换这四个均运行在通用多核DSP上的并行化部分构成,通过有效挖掘通用DSP核中功能单元的潜力来提升各个部分的性能。实验结果表明,ftmEConv实现了高达42.90%的计算效率,与芯片上的其他矩阵乘卷积算法实现相比,获得了高达7.79倍的性能加速。  相似文献   

4.
矩阵转置是矩阵运算的基本操作,广泛应用于信号处理、科学计算以及深度学习等各种领域。随着国防科技大学自主研制的飞腾异构多核数字信号处理器(digital signal processor, DSP)在各种领域中的推广应用,对高性能矩阵转置实现提出了强烈需求。针对飞腾异构多核DSP的体系结构特征与矩阵转置操作的特点,提出了一种适配不同数据位宽(8 B、4 B以及2 B)矩阵的并行矩阵转置算法ftmMT。该算法基于DSP中向量处理单元的Load/Store部件实现了向量化,同时基于矩阵分块实现了多个DSP核的并行处理,通过隐式乒乓设计实现了片上向量化转置与片外访存的重叠以及访存性能的大幅提升。实验结果表明,ftmMT能够显著加快矩阵转置操作,与CPU上的开源转置库HPTT相比,可获得高达8.99倍的性能加速。  相似文献   

5.
设计了一种基于FPGA与DSP的高速多通道实时数据采集传输系统。该系统通过FPGA实现对时钟、ADC、DSP等芯片的功能配置,采集数据由FPGA预处理后通过EMIF接口传送至DSP,并完成后续的复杂信号处理。该系统最高数据采集速率可达500 MSPS,FPGA与DSP之间可实现高速率的数据传输。实际测试结果表明,该系统实现了多通道数据的实时同步采集、传输与处理,数据采集达到较高性能,能够满足当前复杂电磁环境下精确制导雷达数据处理分析的需求。  相似文献   

6.
针对单DSP系统不能满足多路声纳信号实时处理的要求,提出了基于TMS320C6416芯片的多板卡声纳信号协同处理技术,介绍了协同处理中DSP之间以及DSP与主控计算机之间的数据传输方法和软件实现流程,该技术可通过增加信号处理板卡扩展系统的处理能力,具有较好的灵活性。实验结果验证了系统协同处理的正确性。  相似文献   

7.
针对单DSP系统不能满足多路声纳信号实时处理的要求,提出了基于TMS320C6416芯片的多板卡声纳信号协同处理技术,介绍了协同处理中DSP之间以及DSP与主控计算机之间的数据传输方法和软件实现流程,该技术可通过增加信号处理板卡扩展系统的处理能力,具有较好的灵活性。实验结果验证了系统协同处理的正确性。  相似文献   

8.
并行是提高计算机性能最主要的方法,随着集成电路生产工艺的不断发展,除了在单个芯片内集成更多的处理器核外,通过集成高速互连网络接口构建多路并行系统一直是提高高性能计算机并行性的主要方式。提出了一种面向多核微处理器的互连接口的设计方案,基于精简的PCI-E总线协议,采用高速串行数据传输技术,支持Cache一致性报文和大块数据传输报文,能够用于实现4个处理器的直接互连。模拟结果表明,优化设计的互连接口每个接口能够实现64Gbps的双向最大有效带宽,最小传输延迟为120ns,能够较好平衡不同报文类型对带宽和传输延时的要求。  相似文献   

9.
针对数字视频总线在装备应用中的实时性需求,在分析JPEG编码原理和多核DSP任务并行的基础上,提出了一种基于TMS320C6678的JPEG编码算法并行实现方法,该方法实现了任务级并行流水和核间高效通信。实验结果表明,该方法是可行、有效的,并且基于TMS320C6678的JPEG编码系统的实时处理能力有很大提升。  相似文献   

10.
一种面向多核处理器的高效并行PCA-SIFT算法   总被引:1,自引:0,他引:1       下载免费PDF全文
提出一种面向多核处理器的并行PCA-SIFT算法,采用数据级并行方法实现并行的特征提取和特征点匹配,将计算任务分配到各个DSP核并行处理,充分开发多核处理器的多级并行性.实验结果表明,并行PCA-SIFT算法对各种不同图像形变的图像具有良好的适应性,具有接近串行PCA-SIFT算法的图像匹配能力,平均加速比达3.12.  相似文献   

11.
根据查询谓词的相似性来实现计算共享是数据流查询优化的主要策略之一,主要针对时空数据流中基于滑动窗口的范围聚集问题进行查询优化,采用时间片段和空间片段分别描述滑动窗口之间和空间范围谓词之间的重叠。提出基于时空分片技术将时空数据流元组分成互不重叠的时空片段。范围聚集查询首先基于时空片段生成中间结果,然后根据查询条件与时空片段的映射关系生成查询结果。实验表明,提出的时空分片策略能大大提高时空数据流中范围聚集查询的性能。  相似文献   

12.
武警财务辅助决策系统是武警部队财务信息化建设的重要内容,在优化财务决策中发挥着不可估量的作用。OLAP技术具有为数据使用对象提供多维度视角和分析的特征,为财务辅助决策系统提供了重要的技术保障。通过对武警财务辅助决策系统的功能分析,提出运用OLAP技术构建武警部队财务决策系统的初步构想。  相似文献   

13.
针对多传感器间存在时空相关性和先验知识未知的情况,提出了一种基于核偏最小二乘最优加权的传感器网络时空融合模型。首先用核偏最小二乘法对每个传感器在不同时刻的测量值进行融合,然后将各个传感器同时刻的估计值进行空间最优融合,从而得到被测参量的最终融合估计。该模型还能排除那些取值远离样本点集合平均水平的奇异点。理论分析和融合实验表明,该模型能取得较高的融合精度,并能显著节省网络能量。  相似文献   

14.
面向 MPP Fortran 的程序自动并行化初探   总被引:3,自引:0,他引:3       下载免费PDF全文
MPPFortran是由Cray公司推出的一种较有代表性的数据并行语言,本文首先介绍了MPPFortran的主要特点,然后,以该语言为例,对面向MPP系统程序自动并行化的主要内容进行了初步的探讨。  相似文献   

15.
为识别链路层加密比特流,以未加密与加密数据在随机统计特性上的差异为依据,对4种典型的随机性检测方法在比特流长度不同时的识别率进行了比较研究.针对块内最长游程检测过程中出现的比特流尾部比特位不能构成完整子块的问题,提出了2种可行的处理方案.通过对块内最长游程检测门限值函数的研究,基于参数优化的方法改进了块内最长游程的检测方案,在一定程度上提高了识别率.最后,以某无线网络链路层加密比特流为识别对象,对提出方案的有效性进行了验证.  相似文献   

16.
为了保证无线传感器网络中数据的完整性,针对基于LEACH路由协议的动态轮时间算法存在的问题,提出一种基于人工神经网络的数据预测算法。该动态轮时间算法中,部分簇因调整后的轮时间不足以完成数据的采集而丢失数据。数据预测算法结合传感器节点数据具有时空相关性的特点,将时空延迟算子引入神经网络模型,并通过建立的神经网络模型对数据进行预测。仿真时采用伯克利英特尔实验室的传感器数据,通过Mafl软件对模型进行测试并分析仿真结果。实验结果表明:该算法对连续多个数据的预测效果理想,预测误差始终保持在较低水平。  相似文献   

17.
多传感器数据融合中的数据预处理技术   总被引:5,自引:2,他引:3  
数据预处理是进行多传感器数据融合的基础 ,对数据的空间统一和时间统一的研究方法及流程进行了阐述 ,介绍了基于该方法的技术在实际应用中取得的效果 .  相似文献   

18.
异构混合存储的软硬件协同数据放置策略   总被引:1,自引:0,他引:1       下载免费PDF全文
分析比较当前大数据中心典型混合存储架构,针对其不能综合运用存储管理系统和存储设备优势的问题,提出软硬件协同的数据放置策略,同时考虑软件层混合存储管理系统和硬件层混合存储设备的特点,根据应用特性为数据选择合适的存储管理系统和设备。面向不同应用场景,提出运行前规划存储路径的静态放置模式和运行中规划存储路径的动态放置模式。基于存储管理系统和设备性能参数建模,采用仿真方法实现各数据放置策略,并运行实际应用中的三类负载进行实验测试,结果表明采用软硬件协同的数据放置策略相比只考虑存储管理系统和存储设备的数据放置策略,性能可以提高近30%。  相似文献   

19.
针对主流方法难以满足多层级实时可视化的需求,提出面向大规模地理矢量线数据的多层级实时可视化技术。建立面向多层级瓦片绘制的自适应可视化模型,设计像元四叉R(pixel quad R, PQR)树空间索引和基于PQR树的自适应可视化算法,分别用于支撑模型的数据组织和可视绘制。在10亿规模数据集上的实验表明:该技术在0.57 s内可计算任一层级上的可视结果,并且计算耗时大幅小于主流方法。当数据规模急剧增长时,该技术在各显示层级上仍具有较好的可视性能,最低可视速率超过100张/s,大幅优于主流方法。该技术在单机条件下即可支撑大规模地理矢量线数据的多层级实时可视化,在空间大数据探索分析领域具备较好的应用前景。  相似文献   

20.
军事数据融合概念方法研究   总被引:1,自引:0,他引:1  
现代战争中,要保持信息优势,必须建立适合新环境的指挥控制信息系统。但是信息超载,信息的不完整和不确定等情况对信息系统的设计提出了新的挑战。结合当前信息融合框架和实践的经验,提出了数据建模和管理的五维结构:空间(x,y,z),时间(t)和可能的世界(w),基于系统的目标和准确的需求分析,提出了一个军事信息系统设计的框架。用数据分析、数据融合方法和推理技术来完成数据的获取和资源的管理,提出增加具有优化能力的智能组件实现系统的学习能力,提高系统的性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号