语音技术――性别辨识和语者验证
语音技术――性别辨识和语者验证
2010/11/24
性别辨识和语者验证简介
性别辨识(Gender Recognition)技术是以语音讯号处理的方法,撷取说话者的声音特征,藉此判断说话者的性别是男性或女性,如下流程图所示的技术。
而语者验证(Speaker Verification)技术,如下图所示,我们亦可称之为语者认证(Speaker Authentication)或是语者侦测(Speaker
Detection),主要是用来鉴定一已知身份的说话者其宣称之身份的真实性,利用撷取说话者的声纹特征,我们可以从事先储存的语者声纹资料库中,取出该宣称身份的语者声纹模型,并且和说话者输入的声音做比对,由于系统会先获知该使用者表明的身份(如小美),所以这会造成两种可能的判断错误,其中一种是错误接受(False
Accept),即说话者为一冒充者(Imposter)但被系统误认为其所宣称的身份,另外一种是错误拒绝(False Reject),即系统将真实身份的说话者误判为冒充者。
性别辨识和语者验证特色
本项性别辨识技术的主要特点在于用户不须事先建立个人声纹资料库,祗要提供输入的声纹即可进行辨识,且辨识率在实际的电话语音中可达93%。
语者验证辨识技术的特色分为两种,一种是和本文相关(Text-Dependent)的验证,即用户在建立个人声纹资料库和验证个人声纹所输入声音必须是相同的,另一种是和本文无关(Text-Independent)的验证,即用户在建立个人声纹资料库和验证个人声纹时所输入的声音允许是不同的,而本公司提供的技术同时可应用于上述的两种使用情境,让使用者的应用更广泛。
性别辨识和语者验证应用
性别辨识可应用于需验证男女生性别的场合,例如从身份证号码的第一个数字得知被验证者的性别,验证说话者的性别是否与该身份证号码所载的性别一致,此外也可应用在语音辨识的前端,当辨识出说话者的性别后,以性别相关的语音模型(Gender-Dependent
Model)进行辨认以提升语音辨识率。
语者验证技术的应用则更广泛,在个人方面可应用于个人设备的管控,例如:个人电脑的使用权限设定,在企业方面则有银行信用卡刷卡时的身份核对,或从大量的客服人员对话资料中撷取出是否有含某特定身份者在说话,以减轻客服人员的工作量,并提升客服品质(Quality
Management)。
CTI论坛编辑
相关阅读:
语音技术――性别辨识和语者验证相关推荐
- 干货 | 清华大学郑方:语音技术用于身份认证的理论与实践
本讲座选自清华大学语音和语言技术中心主任郑方教授近期于清华大数据"技术·前沿"系列讲座上所做的题为<语音技术用于身份认证的理论与实践>的演讲. 以下为演讲的主要内容: ...
- 【飞桨PaddleSpeech语音技术课程】— 声音分类
(以下内容搬运自飞桨PaddleSpeech语音技术课程,点击链接可直接运行源码) 1. 识别声音 通过声音,人的大脑会获取到大量的信息,其中的一个场景是:识别和归类.如:识别熟悉的亲人或朋友的声音. ...
- 一文看懂语音技术商业化逻辑:对品牌意味着什么 | 综述
▼ 点击上方蓝字 关注网易智能 聚焦AI,读懂下一个大时代! 引言 基于语音的技术将对许多行业产生巨大影响,在短短两年内,预计50%的搜索将基于语音技术. 该项技术的普及率可能因用户的年龄.地理位置和 ...
- 浅谈语音技术(ASR/TTS/质检/声纹)
文章目录 1. 写在前面 2. 语音合成 TTS (1) 基本概念 (2) 效果评估方法 (3) 音色与定制 (4) 发音规则 3. 语音识别 ASR (1) 基本概念 (2) ASR效果影响因素 口 ...
- 人工智能语音技术支持“多情感程度”调节,细腻演绎“人声”
近期,微软发布最新语音技术,支持"情感程度"轻松调节,令智能语音的情感表现力更加细腻可控. 人类的情感很大程度上体现于语音语调的微妙变化,比如一句"再见",有时 ...
- 一次对语音技术的彻底批判
作者 | Alexander Veysov 译者 | 孙薇,编辑 | 夕颜 出品 | AI科技大本营(ID:rgznai100) ImageNet的出现带来计算机视觉领域的突破发展,掀起了一股预训练之 ...
- 全球顶级语音技术比赛中获双料冠军,这家中国公司靠什么?
萧箫 发自 凹非寺 量子位 报道 | 公众号 QbitAI 一场关键比赛,刚刚在全球顶级语音会议INTERSPEECH 2021上决出胜负. 腾讯.西工大.CMU等国内外机构是这场对决的主办方,两项比 ...
- 智能语音技术新发展与发展趋势
本文总结于西工大音频语音与语言处理实验室(ASLP@NPU)负责人-谢磊教授在深蓝学院的公开课--智能语音技术的新进展与发展趋势-NPU-ASLP视角. 大家好!感谢深蓝学院的邀请!我代表西工大音频语 ...
- 终于有人对语音技术来了次彻头彻尾的批判!
作者 | Alexander Veysov 译者 | 孙薇,责编 | 夕颜 出品 | CSDN(ID:CSDNnews) ImageNet的出现带来计算机视觉领域的突破发展,掀起了一股预训练之风,这就 ...
最新文章
- 连接两个点云中的字段或数据形成新点云以及Opennni Grabber初识
- vbox虚拟机无法使用计算机名称,win10/windows10启动virtualbox虚拟机提示“不能为虚拟电脑XX点击一个...
- Linux(CentOS)升级gcc到4.8.5版本
- [Java基础]并发修改异常
- Spring-IOC推导
- 批量修改一张表格的多个sheet名
- 使用CSS在文字前面加上图标。
- hive 开窗函数之lag,lead,first_value,last_value
- 用CocoaPods安装ReactiveCocoa遇到的问题
- 10款超好用插件,助你玩转Chrome浏览器
- Cisco设备基础命令
- Charles做弱网测试
- mysql+两行+一样+筛选_Excel两行交换及两列交换,快速互换相邻表格数据的方法...
- Oracle minus用法详解及应用实例
- jpa+hibernate整合达梦数据库(附源码)
- mysql MMM方案
- 计算机管理主分区改成逻辑分区,Win7将主分区变为逻辑分区的方法
- 黑马粉丝感叹:好可呀,好想要!!【最新福利你还没领?】
- 云主机装黑果实践(6):处理云主机上变色龙启动后置过程:驱动和黑屏
- 推荐一个利用 python 生成 pptx 分析报告的工具包:reportgen