基于特征聚合的管制语音声纹深度识别方法 |
| |
引用本文: | 李印轩,汤闻易,杨涛,王雪川,李呈祥.基于特征聚合的管制语音声纹深度识别方法[J].指挥控制与仿真,2023(2):112-115. |
| |
作者姓名: | 李印轩 汤闻易 杨涛 王雪川 李呈祥 |
| |
作者单位: | 1. 北京首都国际机场股份有限公司;2. 南京电子工程研究所空中交通管理系统与技术国家重点实验室 |
| |
基金项目: | 国家重点研发计划“机场飞行区智能物联与决策研究(2020YFB1600104)”; |
| |
摘 要: | 针对带有噪声的管制语音声纹识别问题,提出了一种基于特征聚合的声纹识别算法,能够在音频流中识别不同的管制员和飞行员的声纹特征。在经典的X-VECTORS算法的基础上,通过设计残差语谱图特征提取模块和全局可微的NetVLAD特征聚合模块,构造了端到端的说话人识别神经网络训练框架;最后在实际管制语音数据集上对各种说话人识别方法的精度进行了对比分析。实验结果表明,相较于传统的X-VETCORS方法,提出的基于声纹聚合的说话人识别方法具有更高的识别精度。
|
关 键 词: | 时延神经网络 特征聚合 局部聚集描述子向量 管制语音 |
|
|