期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	60篇
免费	20篇
国内免费	7篇

出版年

2024年	2篇
2023年	2篇
2020年	2篇
2019年	2篇
2018年	1篇
2017年	1篇
2016年	5篇
2015年	2篇
2014年	3篇
2012年	5篇
2011年	7篇
2010年	4篇
2009年	4篇
2008年	6篇
2007年	5篇
2006年	4篇
2005年	4篇
2004年	5篇
2003年	2篇
2002年	6篇
2001年	7篇
1999年	1篇
1997年	2篇
1996年	3篇
1993年	1篇
1992年	1篇

排序方式： 共有87条查询结果，搜索用时 15 毫秒

[首页] « 上一页 [1] [2] 3 [4] [5] [6] [7] [8] [9] 下一页 » 末页»

21.

TMS320C31系列讲座(1)——第一讲高性能浮点数字信号处理器TMS320C31

张雄伟《军事通信技术》1996,(2)

TMS320C31是美国TI公司在TMS320C30基础上推出的低成本高性能浮点数字信号处理器,本文介绍了它的主要性能、硬件构成、软件资源及开发工具。相似文献

22.

软件无线电技术研究

于全夏启斌《现代军事通信》1997,5(1):8-15

本文首先了软件无线电技术及其设计思想;然后对软件无线电的体系结构,包括硬件总体结构和软件模型做了简要的分析;最后着重讨论了实现软件无线电的一些关键技术。如：宽带天线、宽频段射频前端、功率放大、宽带Ａ／Ｄ变换和高速ＤＳＰ技术。相似文献

23.

具有高效混洗模式存储器的可编程混洗单元

下载免费PDF全文

万江华刘胜周锋王耀华陈书明《国防科技大学学报》2011,33(6):31-35

为向量DSP提出并设计了一种具有高效混洗模式存储器的可编程混洗单元,该结构能够使应用程序的混洗指令在执行时和通用寄存器或访存带宽等系统的关键资源分离,从而提高混洗单元的执行效率.采用区分不同混洗粒度和元素索引等方法对混洗模式所对应的开关矩阵进行了压缩,我们的存储效率高于当前其他方案.该混洗单元具有可编程的特点,应用程序... 相似文献

24.

多核数字信号处理器并行矩阵转置算法优化

下载免费PDF全文

裴向东王庆林廖林玉李荣春梅松竹刘杰庞征斌《国防科技大学学报》2023,45(1):57-66

矩阵转置是矩阵运算的基本操作,广泛应用于信号处理、科学计算以及深度学习等各种领域。随着国防科技大学自主研制的飞腾异构多核数字信号处理器(digital signal processor, DSP)在各种领域中的推广应用,对高性能矩阵转置实现提出了强烈需求。针对飞腾异构多核DSP的体系结构特征与矩阵转置操作的特点,提出了一种适配不同数据位宽(8 B、4 B以及2 B)矩阵的并行矩阵转置算法ftmMT。该算法基于DSP中向量处理单元的Load/Store部件实现了向量化,同时基于矩阵分块实现了多个DSP核的并行处理,通过隐式乒乓设计实现了片上向量化转置与片外访存的重叠以及访存性能的大幅提升。实验结果表明,ftmMT能够显著加快矩阵转置操作,与CPU上的开源转置库HPTT相比,可获得高达8.99倍的性能加速。相似文献

25.

可扩展通用并行声纳信号处理系统设计

郭元曦桑恩方高鹏王继胜《海军工程大学学报》2007,19(3):31-34

针对水声领域中高速大容量的实时信号处理任务,为了提高处理系统的通用性,设计并实现了一种基于DSP芯片的并行声纳信号处理系统。系统采用TI公司的高性能处理芯片TMS320C6416作为其处理内核,并采用松耦合式的静态结点互连网络结构,能够在保证结点具有一定处理能力的同时进行方便高效的互连。为通用并行信号处理平台的设计提供了一种新的思路。相似文献

26.

基于闪存的TMS320VC5416 DSP并行引导装载方法

何维苗叶永涛夏惊雷《现代军事通信》2004,12(4):50-55

以C5416为例,系统地阐述了FLASH的系统编程技术和基于FLASH的DSP独立系统的实现,并根据实际经验,详细介绍了一种采用外部并行引导方式来实现DSP系统自举引导装载的方法。该DSP独立系统的实现方法简单、可靠,适用于用户程序代码小于32K字时的情况。相似文献

27.

多核数字信号处理卷积算法并行优化

下载免费PDF全文

许金伟王庆林李娅琳姜晶菲高蕾李荣春李东升《国防科技大学学报》2024,46(1):103-112

针对国防科技大学自主研发的异构多核数字信号处理(digital signal processing, DSP)芯片的特征以及卷积算法自身特点,提出了一种面向多核DSP架构的高性能多核并行卷积实现方案。针对1×1卷积提出了特征图级多核并行方案;针对卷积核大于1的卷积提出了窗口级多核并行优化设计,同时提出了逐元素向量化计算的核内并行优化实现。实验结果表明,所提并行优化方法实现单核计算效率最高能达到64.95%,在带宽受限情况下,多核并行扩展效率可达到48.36%～88.52%,在典型网络ResNet50上的执行性能与E5-2640 CPU相比,获得了5.39倍性能加速。相似文献

28.

相关跳频通信技术 总被引：2，自引：0，他引：2

李玉生王治元《现代军事通信》1999,7(3):7-8

本文对相关快速跳频技术作了初步的介绍,重点讨论了相关编码和异步跳频的基本原理,并在此基础上结合器件发展水平和典型应用简要分析了实现的可能性及广阔的发展前景相似文献

29.

二维矩阵卷积在向量处理器中的设计与实现

下载免费PDF全文

张军阳郭阳《国防科技大学学报》2018,40(3):69-75

为了加快卷积神经网络模型的计算速度,便于大规模神经网络模型在嵌入式微处理器中的实现,以FT-matrix2000向量处理器体系结构为研究背景,通过对多核向量处理器体系结构的分析和对卷积神经网络算法的深入研究,提出将规模较小的卷积核数据置于标量存储体,尺寸较大的卷积矩阵置于向量存储体的数据布局方案。针对矩阵卷积中数据难以复用的问题,提出根据卷积核移动步长的不同动态可配置的混洗模式,通过对所取卷积矩阵元素进行不同的移位操作,进而大幅提高卷积矩阵数据的复用率。针对二维矩阵卷积由于存在数据相关性进而难以多核并行的问题,提出将卷积矩阵多核共享,卷积核矩阵多核独享的多核并行方案。设计了卷积核尺寸不变、卷积矩阵规模变化和卷积矩阵尺寸不变、卷积核规模变化的两种计算方式,并在主流CPU、GPU、TI6678、FT-matrix2000平台进行了性能对比与分析。实验结果表明:FT-matrix2000相比CPU最高可加速238倍,相比TI6678可加速21倍,相比GPU可加速663 805倍。相似文献

30.

梯度学习的参数控制帮助线程预取模型

下载免费PDF全文

裴颂文张俊格宁静《国防科技大学学报》2016,38(5):59-63

对于非规则访存的应用程序,当某个应用程序的访存开销大于计算开销时,传统帮助线程的访存开销会高于主线程的计算开销,从而导致帮助线程落后于主线程。于是提出一种改进的基于参数控制的帮助线程预取模型,该模型采用梯度下降算法对控制参数求解最优值,从而有效地控制帮助线程与主线程的访存任务量,使帮助线程领先于主线程。实验结果表明,基于参数选择的线程预取模型能获得1.1~1.5倍的系统性能加速比。相似文献

[首页] « 上一页 [1] [2] 3 [4] [5] [6] [7] [8] [9] 下一页 » 末页»