首页 > 论文导航 > 工业
电信技术论文_基于深度学习的开放场景下声纹识别系统的设计与实现
 
更新日期:2021-09-14   来源: 水利规划与设计   浏览次数:42   在线投稿
 

核心提示:文章摘要:针对现实应用场景中短时语音和混叠有噪音情况下声纹识别准确性低的问题,本文设计了一种改进的基于深度学习的声纹识别

 

文章摘要:针对现实应用场景中短时语音和混叠有噪音情况下声纹识别准确性低的问题,本文设计了一种改进的基于深度学习的声纹识别算法,提高了声纹识别模型在短时语音和带噪环境下的鲁棒性,并将该模型部署到了嵌入式设备中。本文主要对声纹识别算法的编码层和损失函数进行改进。对于编码层,本文使用了基于差分编码的NeXtVLAD技术,同时对帧级特征中的静态声纹特征和动态声纹特征进行建模。对于损失函数,本文将基于小样本学习框架的余弦-原型损失函数cosine-Prototypical 与附加间隔分类损失函数AM-Softmax 进行融合来训练声纹识别模型,使得模型在特征空间中的同类特征尽可能集聚,异类特征尽可能分离。此外,本文还将声纹识别算法部署在Raspberry Pi平台上,实现了能快速推理的声纹识别系统。实验结果表明:这种改进的声纹识别系统在多种开放场景下,能够实时、准确地完成声纹识别任务,可以达到实际应用的要求。

文章关键词:深度学习,开放场景,短时语音,声纹识别,差分化编码,NeXtVLAD,树莓派,

项目基金:广东省青年创新人才项目(2018GkQNCX005),

论文作者:郭新1 罗程方2 邓爱文2 

作者单位:1. 广东交通职业技术学院机电工程学院 2. 华南理工大学自动化科学与工程学院 

论文分类号: TN912.34;TP18

相似文献:基于深度学习的小样本声纹识别方法研究.....作者:李靓,孙存威,谢凯,贺建飚,刊载期刊:《计算机工程》
融合声纹信息的能量谱图在鸟类识别中的研究.....作者:杨春勇,祁宏达,彭焱秋,尹滨,侯金,舒振宇,陈少平,刊载期刊:《应用声学》

相关文章:激光雷达技术在部件级三维实景的应用.....作者:郭王
人工智能在智能制造中的应用.....作者:杨磊
大数据人工智能驱动图书馆知识服务和学科建设.....作者:姜爱蓉
商业航天背景下的遥感应用产业化.....作者:刘东升
Artificial Intelligence: Where Maybe Next Steps? “人工智能热”之后的冷静思考.....作者:Tony Qiu
Computational Analysis of the Voynich Manuscript 十五世纪伏尼契码的智能解析.....作者:Greg Kondrak
深度强化学习系列课程第四讲.....作者:汪荣贵
5G赋能,智享未来.....作者:赵海峰

 

上一篇:中国共产党论文_凝心聚力 乘势而上 锐意进取 向着第二个百年奋斗目标前进

下一篇: 临床医学论文_纳米材料用于放疗防护的研究进展

 
相关论文导读
 
发布日期:2022-05-26 来源: 浏览次数:127
 
 
发布日期:2022-05-26 来源: 浏览次数:113
 
 
发布日期:2022-05-26 来源: 浏览次数:120
 
 
 
 
发布日期:2022-05-26 来源: 浏览次数:125
 
 
发布日期:2022-05-26 来源: 浏览次数:123
 
 
 
发布日期:2022-05-26 来源: 浏览次数:135
 
 
发布日期:2022-05-26 来源: 浏览次数:122
 
分类浏览
 
论文阅读排行
 
最新论文阅读
 
 
 



2018-2020 400农业期刊网 专业学术期刊名单推荐平台

 

免责声明:本平台并非任何杂志官网,仅限于整理学术信息以及期刊投稿渠道