SH Symposium Series on Speech (SH SSS 2022) 

SH SSS 是由语音之家打造的AI语音技术相关的前沿论文成果分享平台。

来自AI语音技术领域的优秀论文作者、专家学者,用最精炼的表达来解读最新的高质量论文。

分享的论文成果来自国内外顶级会议收录的优秀文章、前沿学术报告。

主题 Tittle

跨年龄声纹识别:学习年龄不变的说话人特征

嘉宾 Author

覃晓逸,武汉大学博士生,主要研究方向为声纹识别、语音鉴伪,已发表十余篇国际会议论文。全球语音大赛经验丰富,并获顶级赛事多项奖牌,参与组织举办INTERSPEECH2022、INTERSPEECH FFSVC2020和HI-MIA数据库的开源,曾获SASV2022 第二名,M2MET2022 第一名,VOXSRC2020 TRACK2 第三名,VOXSRC2019 TRACK2第三名,VOICES2019 SV 第三名,ASVSPOOF2021 PA 第一名。掌握语音处理算法和机器学习流行工具,有丰富的语音识别实战经验。

概述 Abstract

近些年说话人识别取得了巨大的发展,但是由于相关数据的缺乏,很少有人关注跨年龄声纹识别。本篇文章基于VoxCeleb数据集挖掘跨年龄测试集并提出一种学习年龄不变的说话人表征(Age-invariant speaker representation, AISR)方法。由于VoxCeleb数据是从YoutuBe平台上采集下来,因此这个数据天然的就是跨年龄数据的场景。然而数据集提供的原始信息并不包含说话人的年龄信息。因此,我们采用一种人脸估计年龄的方法,通过识别视频数据来预测估计每个音频段的说话人年龄。由此,我们构建了基于VoxCeleb的跨年龄测试集(Vox-CA),其中正样本对有意选择较大年龄跨度的数据。此外,在选择负样本对时参照Vox-H集,考虑国籍和性别的影响。经过测试发现,基线系统性能从Vox-H集上的1.939%EER下降到Vox-CA20集的10.419%,这一结果表明跨年龄场景的困难程度。因此,我们提出了一种年龄解耦对抗学习(ADAL)方法,以缓解年龄差距的负面影响,减少类内方差。我们的方法在Vox-CA20测试集上的相关EER降低超过10%,优于基线系统。相关资源已经在Github上开源。

题 目 Tittle

Cross-Age Speaker Verification: Learning Age-Invariant Speaker Embeddings

期 刊 Journal & Comments

InterSpeech2022

作 者 Authors

覃晓逸,李娜,翁超,苏丹,李明

论文地址 Url

https://arxiv.org/abs/2207.05929

论文代码 Code

https://github.com/qinxiaoyi/Cross-Age_Speaker_Verification

议程

Program Overview

时间 主题 嘉宾
19:00-19:40 跨年龄声纹识别:
学习年龄不变的说话人特征
覃晓逸
19:40-19:45 Q&A

参与方式

SH-SSS丨跨年龄声纹识别:学习年龄不变的说话人特征

投稿 Call For Papers

在语音领域,您的文章内容具有技术创意性重要性论文解读清晰均可投稿!

投稿方式

投稿邮箱

jack@speechhome.com

SH-SSS丨跨年龄声纹识别:学习年龄不变的说话人特征相关推荐

  1. 【声纹识别】适量量化(VQ)说话人门禁识别【含GUI Matlab源码 2608期】

    ⛄一.矢量量化(VQ)说话人识别简介 目前自动说话人识别的方法主要是基于参数模型的HMM的方法和基于非参数模型的VQ的方法.1992年, 日本人Matsui和Fur ui主要从对语声波动的鲁棒性方面对 ...

  2. AI赋能下的声纹识别技术在公共安全领域的深度应用

    佳都新太科技股份有限公司 徐建明 1.声纹识别在公共安全领域的应用现状 生物特征是指每个个体所独有的.可以通过技术有效测量.甄别.鉴定与验证的某类生理上的特征或行为上的方式.从生物特征的来源进行区分, ...

  3. kaldi中的声纹识别

    kaldi中的声纹识别 文章目录 kaldi中的声纹识别 kaldi的安装 运行aishell例程 使用TIMIT数据库进行声纹识别 kaldi中声纹识别的流程 我的博客:https://yutouw ...

  4. python声纹识别_【kaldi学习.4】Aishell V1(说话人识别、声纹识别)中的run.sh详解...

    下面打算用aishell来做声纹识别,在做声纹识别之前,肯定是要对run.sh这个文件做个深入的了解,才可以继续往下走,接下来会记录如何修改run.sh去运行自己的数据,而不是手动输入自己的数据... ...

  5. 最强大脑第二场战平听音神童!百度大脑小度声纹识别技术解析

    from: http://geek.csdn.net/news/detail/134398 日前,继在江苏卫视<最强大脑>第四季"人机大战"首轮任务跨年龄人脸识别竞赛中 ...

  6. 一文看懂“声纹识别VPR” | AI产品经理需要了解的AI技术概念_团员分享_@cony

    前言:声纹识别是AI领域中一个看似很小.但其实有机会在近期落地,且比较有意思的细分方向:本文作者是"AI产品经理大本营"团员@cony  ,她总结了AI产品经理"最必要& ...

  7. AI领域「听风者」:声纹识别5大核心知识点!

    https://www.toutiao.com/a6691897670778225160/ 在移动互联网大行其道的时代,人们不用出门不用见面就可以完成很多事情,比如购物.生活缴费.投资理财等,在享受着 ...

  8. 中国AI又夺一冠!依图刷榜全球声纹识别挑战赛,刷新纪录,大比分夺魁

    鱼羊 发自 凹非寺 量子位 出品 | 公众号 QbitAI 中国军团,继续刷新全球AI各项竞赛. 这一次,是全球声纹识别竞赛:这一次,是独角兽依图. VoxCeleb说话人识别挑战赛,简称VoxSRC ...

  9. 声纹识别的模式识别方法

    声纹识别的模式识别方法 2011/01/05 对于模式识别,有以下几大类方法: 模板匹配方法:利用动态时间弯折(DTW)以对准训练和测试特征序列,主要用于固定词组的应用(通常为文本相关任务): 最近邻 ...

最新文章

  1. HTML与XML总结
  2. 如何编写webService接口
  3. GitNote 基于 Git 的跨平台笔记软件正式发布
  4. 【行业报告】中国金融科技2017专题研究报告——易观智库
  5. c#中Excel数据的导入、导出
  6. 机房布线的最高境界 | 最后的暗黑系,真是亮瞎眼 ​
  7. 如何打造程序员专属聊天室?
  8. python智能推荐_Python与集体智能:第2章:推荐项目
  9. 在win中搭建IOS自动化
  10. 标准cpci接口定义_cpci接口定义精简
  11. Ffmpeg视频压制的基础知识
  12. 大白菜u盘装系统教程linux,大白菜5.1版 快速U盘装系统综合教程
  13. Js 中null 和underfined的区别
  14. SKYPE的BUG 7/8
  15. 悟透Javascript(转载)
  16. animate.css 动画库的使用
  17. sockboom群_Phonics:自然拼读自然拼读练习表
  18. 日记侠:都是精准引流的文章,前3名阅读量怎么差这么多
  19. javamagic使用教程
  20. flash如何转html5,闪客精灵如何将Flash格式转换成HTML5

热门文章

  1. Pytorch实现戴口罩人脸检测和戴口罩识别(含训练代码 戴口罩人脸数据集)
  2. 全球及中国人工沙行业需求前景与发展趋势预测分析报告2022-2028年
  3. 关于Linux使用pppd拨号,自动断网,重新拨号功能
  4. 金融python入门书籍_零基础想系统地学习金融学、量化投资、数据分析、python,需要哪些课程、书籍?有哪些证书可以考?...
  5. 执行kubectl get csr显示NoT found.
  6. 金融要求计算机水平,什么是金融人才?符合五大标准的金融人
  7. [剑指offer]顺时针打印矩阵
  8. [重学Java基础][Java IO流][Exter.2]IO流中几种不同的读写方法的区别
  9. vertica备份与恢复(一)
  10. 成功解决[Error] reference to ‘xx’ is ambiguous