首页 | 本学科首页   官方微博 | 高级检索  
   检索      

基于稀疏卷积非负矩阵分解的语音转换方法研究
引用本文:马振,张雄伟,杨吉斌,徐玉龙.基于稀疏卷积非负矩阵分解的语音转换方法研究[J].军事通信技术,2013(2):1-7.
作者姓名:马振  张雄伟  杨吉斌  徐玉龙
作者单位:解放军理工大学通信工程学院研究生3队;解放军理工大学指挥信息系统学院
基金项目:江苏省自然科学基金资助项目(BK2012510);解放军理工大学预研基金资助项目(20110211)
摘    要:为了在语音转换过程中充分提取语音的个人特征信息,同时考虑到语音的稀疏性,文章提出了一种基于稀疏卷积非负矩阵分解的语音转换方法。卷积非负矩阵分解得到的时频基可以承载语音信号中的个人特征信息及语音帧之间的相关性,而稀疏卷积非负矩阵分解得到的过完备时频基更能体现语音的细节,可以较好地保存语音中的个人特征信息。利用这一特点,通过稀疏卷积非负矩阵分解从训练数据中提取源说话人和目标说话人相匹配的过完备时频基,然后通过时频基的替换实现语音转换。相对于传统方法,该方法能够更好地保存语音个人特征信息和语音帧间相关性,从而可以进一步提高转换语音的质量和相似度。实验仿真及主、客观评价结果表明,与基于高斯混合模型、卷积非负矩阵分解的语音转换方法相比,该方法具有更好的转换语音质量和转换相似度。

关 键 词:语音转换  稀疏卷积非负矩阵分解  过完备时频基
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号