首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
汉语语音识别中的一种音节分割方法   总被引:2,自引:0,他引:2  
汉语语音识别研究中,识别单元的选取是很重要的。随着大词汇量连续语音识别研究的发展,越来越多汉语语音识别研究中选取次音节单位作为识别单元。结合汉语发音声学特性,提出了音节的重叠音素分割策略,并利用小波方法实现了音节的分割,实验证明该方法分割准确可靠。  相似文献   

2.
本文研究神经网络的多层感知器模型在语音识别中的应用。为达到实时识别的效果,笔者设计了TMS32010数字信号处理板,它与PC/XT机构成主-从系统,由PC/XT机管理数据,TMS32010进行高速运算,实验中,考察了神经网络对数字语音的识别能力,识别率达到95%以上,结果表明,用神经网络进行语音识别是一种很有前途的方法。  相似文献   

3.
本文综述了语音识别领域里的主要技术。首先,系统地介绍了孤立词识别系统中的算法和技术。然后,简要介绍了连续语音识别系统中的主要处理方法。最后,说明了语音理解系统中的特殊问题。  相似文献   

4.
信息科学的发展对指挥控制的技术提出更高的要求,语音识别将是车载、机载、舰载综合电子设备中一项不可缺少的内容。但海、陆、空等指挥控制环境中高噪声的存在及其导致的话者语音变化,为语音识别系统的可靠应用带来了困难,要解决这个问题,就必须研制具有抗噪声能力的语音识别系统。本文基于语音识别的基本原理,通过对噪声特性及其对语音识别影响的分析,从提高系统的鲁棒性入手,探讨了抗噪声语音实时识别系统  相似文献   

5.
语声控制系统是指利用电子计算机对语音信号进行分析,提取出其中携带的有关参数,综合利用语音识别技术与讲者识别技术而构成的一种专用控制系统。本文介绍一个基于汉语数字零到九识别的语声控制系统的模型及其实现方法。  相似文献   

6.
本文全面介绍了一种采用改进的SEVQ匹配算法的特定人汉语语音识别系统,具体描述了系统总体方案、系统参数的选取策略、各种识别预处理所用方法及语音模式匹配原理和方法。系统的实时识别率超过93%  相似文献   

7.
深度学习在自然语言处理中的应用越来越广泛。相比于传统的n-gram统计语言模型,循环神经网络(Recurrent Neural Network,RNN)建模技术在语言模型建模方面表现出了极大的优越性,逐渐在语音识别、机器翻译等领域中得到应用。然而,目前RNN语言模型的训练大多是离线的,对于不同的语音识别任务,训练语料与识别任务之间存在着语言差异,使语音识别系统的识别率受到影响。在采用RNN建模技术训练汉语语言模型的同时,提出一种在线RNN模型自适应(self-adaption)算法,将语音信号初步识别结果作为语料继续训练模型,使自适应后的RNN模型与识别任务之间获得最大程度的匹配。实验结果表明:自适应模型有效地减少了语言模型与识别任务之间的语言差异,对汉语词混淆网络进行重打分后,系统识别率得到进一步提升,并在实际汉语语音识别系统中得到了验证。  相似文献   

8.
军事情报的收集、处理和分析是情报部门的重要工作,当今时代,依靠人工搜集处理方法在效率上已经不能满足需要,采用先进的信息处理技术对情报进行自动处理技术正是解决这一问题的有效途径。大部分的情报载体是文字和语音.因此自然语言和语音处理技术在情报处理方面发挥着重要作用。针对军事情报处理方法中的语言、语音处理技术进行简单的介绍,包括机器翻译、信息检索,语音分析、语音识别等方面。  相似文献   

9.
在孤立词语音识别中,从背景噪声中找出语音的开始和终止是很重要的,准确地确定语音的端点,是正确的语音识别的基础,并能使语音处理的计算减少到最小。本文研究了端点识别的二种算法:能量过零率法,多门限过零率法。能量过零率法用得比较普遍:能量检测浊音,过零率检测清音。多门限过零法将能量和过零率结合成一个参数,使端点检测只用一个参数。在此基础上,我们又提出了一种新算法:极值变化率法。极值变化率能更好地区分噪声和清音,而且检测端点时也只用一个参数。  相似文献   

10.
研究了手机智能语音交互功能使用现状、存在问题及改进措施。通过问卷调查和用户访谈的方式从功能需求、掌控程度、优势不足和改进建议4个方面收集语音功能用户反馈信息,利用统计学方法对问卷结果进行统计描述和数据分析。用户对语音功能有较大需求,用户年龄、职业、性格因素对语音功能掌控程度存在显著差异,不同语音功能使用情况有显著差异,解放双手、自然高效、满足特定场所需求是语音功能的主要优势,操作过于繁琐、用户使用习惯以及手机语义理解能力差是目前语音功能的主要不足。智能语音功能市场潜力大,需引导用户转变使用习惯,同时提高语音识别理解能力,简化操作,提高语音交互易用性。  相似文献   

11.
语音识别一般只是将语音转化成文字,识别的结果是没有标点的一连串汉字,这不利于读者阅读,也会影响后续任务的处理.因此,引入语音端点检测解决上述问题.同时针对传统的语言模型N-gram存在忽略字词之间语义的相似性、训练时的参数过大等问题,提出一种以全序列卷积神经网络DFCNN作为声学模型,Transformer作为语言模型...  相似文献   

12.
本文提出了用二阶神经网络进行文本无关的说话人识别的方案,同时采用多共用一张大网的做法,并针对说话人识别的特点分析了方案中语音预处理和特征提取的问题。最后对方案进行了计算机模拟实现,取得了满意的识别效果。  相似文献   

13.
一个基于LB/IHMM的高性能汉语连接数字语音识别系统   总被引:1,自引:0,他引:1       下载免费PDF全文
本文使用一种IHMM的简化训练算法,讨论了一个基于LevelBuilding搜索算法,参考模式基于IHMM模型的高性能的汉语连接数字语音识别系统。文中详细描述了系统的特征提取、IHMM模型、训练过程和识别过程,以及系统用于特定人、多说话人和不认人语音识别的实验,并且对实验结果进行了分析和讨论。  相似文献   

14.
MFCC参数是说话人识别常用的特征参数,但单独使用MFCC参数,系统性能难以进一步提高。文章提出了一种MFCC和语谱图特征相融合的说话人识别方法。针对语谱图特征空间维数高、数据量大的问题,采用流形学习中的LLE算法对语谱图信息进行压缩,并根据样本点每一维所代表的不同特性信息改进了LLE算法。以SRMC汉语语音数据库为测试语音,与传统PCA算法以及单独使用MFCC参数进行对比实验,在识别人数为100人时,识别率分别提高了2.5%和3%,验证了所提方法的有效性。  相似文献   

15.
本文介绍并讨论语音识别军事应用的潜力和现状,给出我们建立的一个可用于军事作战指挥和多控制场合的小、中词汇表实时语音识别系统。  相似文献   

16.
利用小波的多分辨特性提取说话人的语音特征参数,以及在预处理过程中运用小波分解去除噪声的基本原理和方法,分析了小波变换在说话人识别过程中不同阶段的应用。总结了小波变换对提高说话人识别系统的识别率具有重要的意义,并且提出了小波变化在说话人识别中运用所存在的问题和难点。  相似文献   

17.
本文就Kohonen自组织特征映射神经网络模型采用其基本学习算法直接用于孤立字非特定人的语音识别时所存在的不足进行了改进。大量的实验结果表明,改进后的方法对得到良好的映射圈和提高识别率具有积极的作用。  相似文献   

18.
说话人识别技术,即声纹识别技术,它做为一种身份识别的手段,是语音信号处理中的重要组成部分,具有独特的优势,近年来也逐渐成为国际上研究的热点,在军事上得到了广泛的应用。  相似文献   

19.
本文描述了一实验型语音识别系统,它采用了沃尔什分析和动态规划方法来识别不连续的、与讲话人有关联的语音。该方法的目的是利用容易买到的微处理器来研制一种廉价系统,以便根据运行速度检验算法。该系统采用 Z80微处理器,其软件在 CP/M 操作系统下开发,软件是模块化的,并且几乎全部用 Pascal语言写成,因此优化非常方便。当前计划的目标是根据本文提出的算法,提出一个能实时工作的系统的技术规范。  相似文献   

20.
根据 LPC 理论实现了一个实时、单人、小词汇集的语音识别系统,用作为指挥自动化的智能语音接口。本文详细叙述了这个语音识别系统的设计原理,对语音识别中常用的几个算法作了改进。指出了经典 DTW 算法对端点精度过于敏感的缺点,并提出了改进的 SDTW 算法,即滑动(Sliding)DTW 算法,使得认识率有了提高;修改了 LPC 中杜宾算法和取消了 DTW 中显式的弯折函数,减少了它们所需的空间,提高了计算效率;在主机方面,设计实现了“透明语音键盘”,使得话筒与普通键盘等效,方便了用户。本系统词汇量在200个以内,平均响应时间1S,平均识别率95%左右,已在本院的小型指挥自动化网上通过运行。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号