Learning Discriminative Features for Speaker Identification and Verification

学习说话人识别和验证的判别特征

摘要

任何文本独立的说话者识别和/或验证系统的成功依赖于系统学习辨别特征的能力。

在本文中,我们提出了一种基于流行的非常深VGG [1] CNN的卷积神经网络(CNN)架构,通过关键修改来适应可变长度频谱图输入,减少模型磁盘空间要求并减少参数数量,从而产生在培训时间显着减少。我们还提出了一个统一的深度学习系统,用于文本无关的说话人识别和说话人验证,通过在Softmax损失和中心损失的共同监督下训练拟议的网络架构。

[2]获得适用于说话人识别和验证任务的高度辨别力的深度特征。

我们使用最近发布的VoxCeleb数据集[3],其中包含超过1200名属于不同种族的名人的数十万个现实世界话语,用于对我们的方法进行基准测试。我们最好的CNN模型获得了84.6%的前1准确度,比Vox-Celeb的方法有4%的绝对改进,而与Center Loss相结合的训练将Top-1准确度提高到89.5%,绝对值提高了9% Voxceleb的方法。

索引术语࿱

学习说话人识别和验证的判别特征相关推荐

  1. (TIP-2019)基于判别特征学习的跨视角步态识别

    基于判别特征学习的跨视角步态识别 paper题目:Cross-View Gait Recognition by Discriminative Feature Learning paper是中国科学院大 ...

  2. SH-SSS丨跨年龄声纹识别:学习年龄不变的说话人特征

    SH Symposium Series on Speech (SH SSS 2022)  SH SSS 是由语音之家打造的AI语音技术相关的前沿论文成果分享平台. 来自AI语音技术领域的优秀论文作者. ...

  3. XGBoost学习(六):输出特征重要性以及筛选特征

    XGBoost学习(一):原理 XGBoost学习(二):安装及介绍 XGBoost学习(三):模型详解 XGBoost学习(四):实战 XGBoost学习(五):参数调优 XGBoost学习(六): ...

  4. python dlib学习(七):人脸特征点对齐

    前言 前面的博客介绍过人脸特征点标定:python dlib学习(二):人脸特征点标定.这次试着使用这些人脸特征点来对人脸进行对齐. 完整工程链接附在文章最后. 程序 上代码,程序中使用了python ...

  5. 嵌套交叉验证的一致特征(Consensus features nested cross-validation)

    5.5 嵌套交叉验证的一致特征(Consensus features nested cross-validation) 参考: Parvandeh S, Yeh H W, Paulus M P, et ...

  6. LOAM学习-代码解析(三)特征点运动估计 laserOdometry

    LOAM学习-代码解析(三)特征点运动估计 laserOdometry 前言 一.初始化 二.去除位移畸变 TransformToStart TransformToEnd 三.去除角度畸变 Plugi ...

  7. Keras深度学习实战(12)——面部特征点检测

    Keras深度学习实战(12)--面部特征点检测 0. 前言 1. 数据集和模型分析 1.1 数据集分析 1.2 模型分析 2. 面部特征点检测 3. 模型测试 小结 系列链接 0. 前言 在计算机视 ...

  8. 【深度学习】擦除:提升 CNN 特征可视化的 3 种重要手段

    作者丨皮特潘 审稿|邓富城 编辑丨极市平台 导读 所谓擦除,就是去除掉一部分有用的信息,以提高网络提取特征的能力.本文对3种提升特征可视化的方法进行了详细综述,包括直接擦除.利用预测信息(CAM)擦除 ...

  9. 论文学习——考虑场次降雨年际变化特征的年径流总量控制率准确核算

    文章目录 1 摘要 2 研究背景 2 资料和方法 2.1 场次降雨数据 2.2 场次降雨划分方法 2.2.1 采用日降雨数据 2.2.2 按照实际降雨过程进行划分 2.2.3 两种方式的比较 2.3 ...

最新文章

  1. 网站文章中如何设置关键词才更有利于SEO优化?
  2. 翻译: TypeScript 1.8 Beta 发布
  3. Applying Rhetorical Structure Theory to Student Essays for Providing Automated Writing Feedback
  4. 嵌入式系统——指令平均时钟数和运算速度MIPS计算
  5. python删除数据框中的字符串列_如何根据条件删除pandas数据框中的列?
  6. 红米开发版刷机教程_红米手机稳定版刷机教程(Recovery卡刷)的具体操作方法
  7. npm install xxxx --legacy-peer-deps命令是什么?
  8. Windows IME (一)
  9. Google assisant 2018谷歌IO大会 谷歌助理背后的系统设计
  10. ubantu 16 nfs挂载
  11. 使用 live555 直播来自 v4l2 的摄像头图像
  12. MySQL数据库基础--数据管理
  13. 由freemarker毫秒级时间谈固定日期格式
  14. 【华为_WLAN】AP4030DN 由 FIT AP 更新至 FAT AP(Uboot方式)
  15. 数据去重方法python_Python统计文件中去重后uuid个数的方法
  16. 京东商城招聘软件工程师(北京)
  17. laravel php 默认图片下载
  18. java SE基础知识
  19. 小故事说JAVA设计模式-策略模式【Strategy Pattern】
  20. MySQLdb._exceptions.OperationalError: (1050, “Table ‘django_content_type‘ already exists“)

热门文章

  1. java通过itext生成PDF,设置单元格cell的最大高度 以及 itext7初尝
  2. OpenApi合并实践
  3. Vue读取Excel文件转换为Html预览,打印
  4. confluence 制作流程图_轩辕剑7全剧情流程图文攻略_全支线任务全收集攻略
  5. 电子笔记本的思考(1)
  6. 给王菲写的一首歌《四季之恋》
  7. 【JAVASE】正则表达式
  8. 珍爱生命急救与自救学习笔记
  9. jquery 向后台传数组 JAVA接收
  10. 张爱玲《色戒》-谈女人-读书笔记