首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
语音是由人类发音器官发出的,能载负与传达一定的语义信息并能被他人所理解的语言的物质外壳.20世纪70年代以来,随着计算机科学和信息技术的跨越式发展,利用数字技术对人类自然语音信号进行相应的处理,让机器具有"听"、"说"人类自然语言的能力,已成为人类信息革命的标志性景观.语音信号数字处理技术在国民经济、日常生活和军事领域有着极为重要的应用价值和极其广阔的应用空间.当前,语音信号数字处理技术正在军事领域大显身手,其发展水平已成为衡量世界各国军队信息化水平和军事实力的重要标志,并将成为未来信息化战争不可或缺的重要组成部分.  相似文献   

2.
一个基于LB/IHMM的高性能汉语连接数字语音识别系统   总被引:1,自引:0,他引:1       下载免费PDF全文
本文使用一种IHMM的简化训练算法,讨论了一个基于LevelBuilding搜索算法,参考模式基于IHMM模型的高性能的汉语连接数字语音识别系统。文中详细描述了系统的特征提取、IHMM模型、训练过程和识别过程,以及系统用于特定人、多说话人和不认人语音识别的实验,并且对实验结果进行了分析和讨论。  相似文献   

3.
多媒体界面中的语音评价问题尚处于研究阶段。本文探讨了语音评价的基本方法,重点对语音的客观评价方法进行研究,提出了一种应用语音分析技术进行语音总体效能客观评价的计算机处理方法。  相似文献   

4.
文中提出了一种自适应的语音时长调整算法,首先对语音分段,提取出稳定的语音段使之与音素或者音节基本对应,然后根据总调整因子β和各段语音长度分配每一个语音段的局部调整因子iβ,最后采用波形相似叠加(W SOLA)算法完成对语音的时长调整。仿真结果表明:文中算法实用有效,可以合成可懂度和自然度更高的语音。  相似文献   

5.
为了在语音转换过程中充分提取语音的个人特征信息,同时考虑到语音的稀疏性,文章提出了一种基于稀疏卷积非负矩阵分解的语音转换方法。卷积非负矩阵分解得到的时频基可以承载语音信号中的个人特征信息及语音帧之间的相关性,而稀疏卷积非负矩阵分解得到的过完备时频基更能体现语音的细节,可以较好地保存语音中的个人特征信息。利用这一特点,通过稀疏卷积非负矩阵分解从训练数据中提取源说话人和目标说话人相匹配的过完备时频基,然后通过时频基的替换实现语音转换。相对于传统方法,该方法能够更好地保存语音个人特征信息和语音帧间相关性,从而可以进一步提高转换语音的质量和相似度。实验仿真及主、客观评价结果表明,与基于高斯混合模型、卷积非负矩阵分解的语音转换方法相比,该方法具有更好的转换语音质量和转换相似度。  相似文献   

6.
信息科学的发展对指挥控制的技术提出更高的要求,语音识别将是车载、机载、舰载综合电子设备中一项不可缺少的内容。但海、陆、空等指挥控制环境中高噪声的存在及其导致的话者语音变化,为语音识别系统的可靠应用带来了困难,要解决这个问题,就必须研制具有抗噪声能力的语音识别系统。本文基于语音识别的基本原理,通过对噪声特性及其对语音识别影响的分析,从提高系统的鲁棒性入手,探讨了抗噪声语音实时识别系统  相似文献   

7.
针对低信噪比环境下语音端点检测准确率低、鲁棒性差,提出了一种将谱减降噪和自适应子带对数能熵积相结合的语音端点检测算法.首先利用改进的多窗谱估计谱减法提升语音信号质量,再以自适应子带对数能熵积这一新的语音特征参数为阈值,使用动态阈值双门限检测法进行语音端点检测.实验结果表明,该算法针对低信噪比语音信号具有更好的准确性和鲁...  相似文献   

8.
近年来,各高校的语音实验室从数量和质量上都取得了长足的发展,但却面临着语音实验室的使用、管理和维护之间矛盾日益突出的局面。分析高校语音实验室的现状,重点阐述了语音实验室科学化管理的内涵以及改革传统管理模式的具体实施方法。  相似文献   

9.
文章提出了一种基于非负矩阵分解的语音增强算法。该算法包括两个阶段,训练阶段和增强阶段。训练阶段通过非负矩阵分解算法对纯净的噪声频谱进行训练,得到噪声字典矩阵,保存其作为增强阶段的先验信息。增强阶段首先通过非负矩阵分解算法对带噪语音的频谱进行分解,然后联合噪声字典矩阵和推导得到的相应迭代公式对语音字典矩阵和语音编码矩阵进行估计,重构增强语音。仿真结果表明,文中增强方案在抑制背景噪声,提高信噪比和减少语音失真方面要优于传统的语音增强算法。  相似文献   

10.
本文介绍一种具有随机滑动窗口的语言学习机,它采用数字信号处理技术记录、存贮、回放语音信号,在微处理器的控制下,随意选择回放语音信号起始点,从已存贮的语音数字信号中选取一小段语音放音,特别适合于需分辨、模仿和背诵语音的人们,音质清晰、操作灵活。  相似文献   

11.
本文介绍了语音编码技术发展现状及应用情况,以及语音编码标准及其最新进展。  相似文献   

12.
文中提出了一种基于离散余弦变换(DCT)和基音同步叠接相加(PSOLA)的语音变换方法。此方法可以自由调整源语音的基音频率、能量分布和时长,以达到变换要求,并且变换后的语音具有较高的质量。变换方法首先对基音标记过的语音段通过DCT进行基音频率和能量分布的调整,之后再通过PSOLA法进一步对基音频率进行修正。实验表明,此方法在男女声变换中,能够使变换前、后语音的性别感觉明显变化,并且保持了较高的语音质量。  相似文献   

13.
针对盲源分离算法无法直接对单路含噪语音信号进行分离的问题,提出一种基于奇异谱分析的盲源分离单通道语音增强算法.通过对单路含噪语音信号进行奇异谱分析,将其低频分量作为第二路观测信号,利用改进的最大信噪比盲源分离算法进行处理,从而实现语音信号和噪声的分离.实验结果表明,该算法能够有效抑制噪声,提高信噪比,起到良好的语音增强效果.  相似文献   

14.
论汉语语音在英语语音教学中的作用   总被引:1,自引:0,他引:1  
以往英语语音教学研究中,一般只强调母语语音在英语语音学习中的干扰作用.通过 对比英语音素与汉语音素的相同与不同之处,对2种语言的发音进行对比研究.在探讨汉语语音干扰作用的同时,着重研究如何在英语语音教学中运用汉语语音规则,从而发掘汉语语音在英语语音教学中的辅助作用.  相似文献   

15.
文章提出一种基于小字典训练和过完备稀疏表示的语音增强算法。该算法通过构造过完备的小字典并使用带噪语音的幅度谱对其进行训练来实现。训练过程中通过不断地使用K-SVD算法更新字典矩阵和相应的稀疏系数矩阵来实现对纯净语音的提取,达到语音增强的效果。该方法不同于传统增强算法需要对噪声进行估计与抑制,而是通过稀疏表示将纯净语音从带噪语音中分离出来。主客观测试结果表明,本文方法较好地消除了随机噪声,低信噪比情况下增强效果明显优于传统算法,且能够避免产生音乐噪声。  相似文献   

16.
本文是作者在1997 年 《声学学报》中文版和英文版发表的三篇文章基础上的进一步研究。这些文章没有对提出的三种语音特征综合方法进行理论分析, 本文运用概率论知识, 详细地对前面三篇文章提出的三种语音特征信息综合方法进行理论分析。分析结果表明: 三种语音特征信息综合方法能够比较好地综合语音特征信息, 提高语音识别系统的性能。这一结果与前面三篇文章中实验结果一致。  相似文献   

17.
研究了手机智能语音交互功能使用现状、存在问题及改进措施。通过问卷调查和用户访谈的方式从功能需求、掌控程度、优势不足和改进建议4个方面收集语音功能用户反馈信息,利用统计学方法对问卷结果进行统计描述和数据分析。用户对语音功能有较大需求,用户年龄、职业、性格因素对语音功能掌控程度存在显著差异,不同语音功能使用情况有显著差异,解放双手、自然高效、满足特定场所需求是语音功能的主要优势,操作过于繁琐、用户使用习惯以及手机语义理解能力差是目前语音功能的主要不足。智能语音功能市场潜力大,需引导用户转变使用习惯,同时提高语音识别理解能力,简化操作,提高语音交互易用性。  相似文献   

18.
本文基于语音增强技术研究工作.根据无线语音通信中噪声干扰的特点.对不同噪声采取不同的降噪对策,使用单端、被动降噪模式,在不改变原有通信系统工作模式情况下,实现了无线语音通信的降噪功能。  相似文献   

19.
与数据指挥相比,语音指挥在战术环境中优势明显。但因战术条件下地理环境复杂、电磁环境恶劣、通信信道速率低等原因影响了其指挥效能的发挥。通过对语音指挥现状分析,提出面向战术环境特别是窄信道条件下语音指挥的总体设想,并给出提升战术环境下语音指挥能力的关键技术及解决措施。最后通过试验验证了技术可行性。  相似文献   

20.
在数字语音通信中,低延迟、低数码率与语音质量三者相互矛盾。本文在目前国际上比较先进的语音编码方法-多带激励(MBE)语音编码方法基础上,力图降低其延迟,提出了多带激励与线性预测相结合(MBE-LPC)语音编码方法,研究了该模型的语音分析与合成基本原理和算法,提出了在4.8kbps中等传输速率下延迟小于50ms的语音编码方案,在计算机上模拟实现。实验结果表明,该算法所模拟的4.8kbps较低延迟语音  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号