7.1 概述

第3 章~第6 章介绍了声纹技术的主要应用,包括声纹识别、声纹分割聚类,以及基于声纹的语音识别、语音合成、语音检测、人声分离等。这些应用很多都经历过数年甚至数十年的发展,已经变得十分成熟,并且被部署到了许多商业级别的系统、产品及服务中。

本章将眼光投向更长远的未来。首先,讨论现有声纹技术所面临的诸多挑战。然后,探讨未来的声纹系统如何解决其对数据的海量需求,并介绍一些声纹领域新兴的研究方向。在这些研究方向中,包含了目前还不够成熟,但可能会在未来得到普及的应用。

7.2 声纹技术的挑战

7.2.1 对信道变化的鲁棒性

从事过声纹领域研究的人员大概都会有这样的经历,在某一类数据集上,我们可以训练出准确率很不错的模型,但是一旦该模型被用于实际应用,就会发现准确率远远达不到预期。例如,如果用LibriSpeech 数据集[97] 训练我们的声纹识别模型,即使该模型可以在LibriSpeech 的测试集上达到非常高的准确率,一旦将该模型用于电话语音或网络视频语音的声纹识别,其准确率便会大幅下降。

造成这一现象的原因,在于实际应用中,我们将面对更复杂的信道,导致应用场景与训练数据之间的信道不匹配[26]。而声纹技术所面临的一大挑战,便是其对于信道变化的鲁棒性(robustness)。造成信道不匹配的原因可能有很多种,笔者列举一些最常见的原因:

(1)环境噪声的影响。在不同的应用场景中,可能存在不同类别的环境噪声。例如在交通工具上,可能存在汽车引擎的声音;在人群聚集的场所,可

声纹技术(七):声纹技术的未来相关推荐

  1. 声音内容识别 linux,语音支付,银行的声纹识别与声纹鉴定

    原标题:语音支付,银行的声纹识别与声纹鉴定 近日,人民网官方微博表示:声纹识别已用于部分银行.开启声纹验证,只要说出随机动态码,就能进行转账.支付等交易.专家:每个人说话时的短时频谱.声源等都有差异. ...

  2. 声纹识别demo_声纹识别 iOS SDK 文档

    # 声纹识别 iOS SDK 文档 # 1.简介 声纹识别(Voiceprint Recognition),是一项提取说话人声音特征和说话内容信息,自动核验说话人身份的技术.MSC SDK 声纹识别( ...

  3. 声纹识别demo_声纹识别 · 科大讯飞MSC开发指南-iOS · 看云

    [TOC] 声纹识别,主要是提供基于用户声纹特征的注册.验证服务.讯飞开放平台支持2种类型的声纹密码类型,即文本密码和数字密码,在注册时需要指定声纹类型. ~~~ //创建声纹对象 isvRec=[I ...

  4. 声纹识别demo_声纹识别 · JD NeuHub API Documents

    声纹识别 一.接口描述 1. 功能描述 声纹识别基于说话人的声音提供说话人确认功能. 2. 能力说明 声纹识别API提供说话人注册以及说话人确认的功能.用户可以先用声音进行注册,再根据声音进行说话人确 ...

  5. 艺术编程-技术之声第二期

    技术未来篇 CTO和技术副总裁应该如何分工?谁才是技术领导者? 湖畔大学教务长曾鸣:注意,创新最难的第一步不是从0到1 在收购Sun六年后,Oracle终于瞄准了Java的非付费用户 技术之声篇 为什 ...

  6. 四层和七层交换技术-loadbalance

    1 四层交换技术简介 我们知道,二层交换机是根据第二层数据链路层的MAC地址和通过站表选择路由来完成端到端的数据交换的.三层交换机是直接根据第三层网络层IP地址来完成端到端的数据交换的. 四 层交换机 ...

  7. 交互式计算机图形学总结:第七章 离散技术

    第七章 离散技术 OpenGL缓存 帧缓存的写操作 –写模式(Writing Mode) –位写入模式 –异或写入模式:如果对某一个源位执行两次异或操作,那么返回目标位的初始状态 映射方法 –纹理映射 ...

  8. 软考网络管理员学习笔记7之第七章网络管理技术

    第七章网络管理技术 考点1.Windows的基本管理 [考法分析] 本考点的基本考法是能够识别Windows系统下,常见命令的含义与作用 [要点分析] 1.需要熟悉掌握常见命令,如ipconfig.pi ...

  9. 【原创】IP摄像头技术纵览(七)---P2P技术—UDP打洞实现内网NAT穿透

    [原创]IP摄像头技术纵览(七)-P2P技术-UDP打洞实现内网NAT穿透 本文属于<IP摄像头技术纵览>系列文章之一: Author: chad Mail: linczone@163.c ...

  10. 《自然语言处理(哈工大 关毅 64集视频)》学习笔记:第七章 句法分析技术

    视频列表: 43 句法分析技术(一) 44 句法分析技术(二) 45 句法分析技术(三) 46 句法分析技术(四) 47 句法分析技术(五) 43 句法分析技术(一) 第七章 句法分析技术 什么是句法 ...

最新文章

  1. django1.4.9 OMserverweb站点管理
  2. php使用http请求头实现文件下载
  3. SQLite_Android
  4. cookie代码加时间多久出现一次_恶意代码分析 丨 一个毫无套路的咸鱼诈骗网站...
  5. python字符串函数_python字符串函数
  6. 如何在 macOS Monterey 中使用空间音频?
  7. 计算机一级word之sum函数,Word2013文档表格中利用SUM函数对数据进行计算的方法
  8. 内存申请标记注意区分___GFP_HIGH和___GFP_HIGHMEM
  9. 秃头警告之——使用mondo rescue备份linux系统ISO镜像的踩坑历程
  10. oracle创建ora文件,ORACLE配置tnsnames.ora文件实例
  11. 计算机毕业设计ssm电脑销售管理系统
  12. python 黑魔法_Python “黑魔法” 之 Meta Classes
  13. 58同城2018秋招前端笔试试题
  14. 中国动漫产业落后的症结
  15. mai模板html,纯PC网站模板改为自适应模板方法
  16. rust怎么放篝火_Rust游戏中12个实用小技巧,包含无伤下坠、直梯爬楼
  17. 基金:实战,连涨7天,8天到底抛还留?爱吹牛的赵吹吹又来了
  18. 大数据-数仓-数据采集-业务数据(二):全量同步采集【MySQL<-->DataX(全量)<-->HDFS】【每日全量:每天都将业务数据库中全部数据同步到数据仓库,是保证两侧数据同步的最简单方式】
  19. 2016微软技术大会门票在线抢,最后半天!!!
  20. detectron2如何使用模型

热门文章

  1. 实施质量保证-执行过程组
  2. WP7 个人股票软件 GilStock v1.0 正式版
  3. eclipse中下划线显示不出来问题解决
  4. 学习笔记1:异地容灾和负载均衡
  5. 【Docker】Linux各系统安装Docker,Docker-compose方式汇总
  6. Vue进阶(幺零三):Markdown 基本语法
  7. apkanalyzer.bat could NOT be found in D:\Program Files\android-sdk的解决方案
  8. 一、Azure Kinect 传感器 SDK 下载——Azure Kinect DK入门
  9. 计算机itpt证书有什么用,ITPT信息技术应用专业能力培训项目认证课程体系表.pdf...
  10. 【NLP】讯飞英文学术论文分类挑战赛Top10开源多方案–5 Bert 方案