首页 | 本学科首页   官方微博 | 高级检索  
     

基于数据增广的声学场景分类
作者姓名:李源  马成男  李关防  王强  张文武
作者单位:海装重大专项装备项目管理中心, 北京 100071;江苏自动化研究所, 江苏 连云港 222061
摘    要:声学场景分类是计算机听觉领域的热点方向之一,相比计算机视觉,特定场景下音频数据的收集和标注成本相对较高,如何利用有限的声学场景音频获得较高的分类准确率成为当前研究的重点内容.利用深度学习技术,结合轻量化网络模型mobilenetv2以及Mel声谱特征,基于城市场景分类数据集(urbansound8k)对三种数据增广技术...

关 键 词:声学场景分类  数据增广  SpecAugment  Mixup  Cutmix
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号