“Hi Sir,请播放莫扎特的钢琴曲”,“好的,请问您播放哪一首?”... 如今语音助手已经走入千家万户,无论是手机、平板还是智能音箱,几乎都配有随唤随到的语音小助手。

这些对答如流的语音助手,到底有多少词汇量?是否和人类一样需要从ABC开始积累呢?答案是他们并不需要逐步积累,而是通过发音词典库,这个库中涵盖了语音助手能够识别的所有语音。

发音词典 (Lexicon) 包含了从单词 (Words) 到音素 (Phones) 之间的映射,作用是用来连接声学模型和语言模型。发音词典包含系统所能处理的单词的集合,并标明了其发音。其与语音识别其他模块的关系如下:通过发音词典得到声学模型的建模单元和语言模型建模单元之间的映射关系,从而把声学模型和语言模型连接起来,组成一个搜索的状态空间,用于解码器进行解码工作。我们的识别目标是单词序列 (句子的分词结果),每个单词由提前构造好的发音词典 (Lexicon) 转为对应的音素序列 (中文的音素通常指拼音中的声母和韵母),即将单词序列转为音素序列。

在语音识别系统中,发音词典包含的数据量越大,对于提升语音识别的准确率效果越好。发音词典和语种相互对应,每个语种需要准备一个发音词典。当新词汇产生时,可以将这些词汇及对应音标添加进去,不断扩充词典规模。因此,词汇量、音标标注和校对的准确性是衡量该发音词典质量的重要标准。

目前,很多发音词典是自己生成的,准确性相对较低,将影响语音识别系统的性能。如何搜集到准确、大量、覆盖面全的发音词典,成为语音领域的又一难题。同时,由于发音词典的搜集、标注、清洗需要专业的语言学家和声学家把控,因此发音词典语料的开源甚少。

目前,Magic Data已建立了成熟的发音词典构建流程,积累了深厚的语音语言学基础研究成果。拥有包括粤语、闽南语、四川话、天津话、武汉话、长沙话、山西话、南昌话、上海话、客家话等各种方言。同时拥有众多常用的语种,包括英语、日语、法语、西班牙语、意大利语、德语、葡萄牙语、印尼语等语种的发音词典。

发音词典需要经过全面的搜集、精细的标注、其中每个单词都经过人工校对,才可以称为高质量的发音词典。通过发音词典可以用来构建更大、更全面、更准确的发音词典库,从而提升语音识别的准确率。

行业洞察 | 你的语音小助手的词汇量够吗?相关推荐

  1. Python-懒人必备-语音小助手

    又是复习学习熟悉语法的一天. import speech_recognition as sr from os import path from aip import AipSpeech import ...

  2. 文字转语音小助手有哪些?分享三款,配音免费还易操作

    文字转语音小助手有哪些?分享三款,配音免费还易操作 文字转语音,其实就是将我们撰写好的文档转为语音进行播放,比如为短视频配音,其实也可以理解成为文字转语音.很多小伙伴会直接自己配音,但是对于不会配音的 ...

  3. 如何用mind+制作一个语音小助手

    要求: 用mind+的实时模式来制作一个语音小助手来进行语音对话,可以实现语音问答,语音学习.前者指的是用户可以与语音智能小助手形成问答的形式,语音学习,后者语音学习的指的是采取机自我学习的形式,即语 ...

  4. P1125 笨小猴笨小猴的词汇量很小,所以每次做英语选择题的时候都很头疼。但是他找到了一种方法,经试验证明,用这种方法去选择选项的时候选对的几率非常大! 这种方法的具体描述如下:假设maxn是单词

    题目描述 笨小猴的词汇量很小,所以每次做英语选择题的时候都很头疼.但是他找到了一种方法,经试验证明,用这种方法去选择选项的时候选对的几率非常大! 这种方法的具体描述如下:假设maxn是单词中出现次数最 ...

  5. python 英语词汇量_北大保安小哥英语词汇量一万五,会用Python编程,网友:北大保安都不会招我...

    原标题:北大保安小哥英语词汇量一万五,会用Python编程,网友:北大保安都不会招我 11月11日下午3时,北大官方微博发文"遇见最强扫地僧!北大保安小哥英语词汇量一万五,会Python,准 ...

  6. python 英语词汇量_最强“扫地僧”!北大保安小哥英语词汇量一万五,会用Python编程,网友:北大保安都不会招我...

    原标题:最强"扫地僧"!北大保安小哥英语词汇量一万五,会用Python编程,网友:北大保安都不会招我 11月11日下午3时,北大官方微博发文"遇见最强扫地僧!北大保安小哥 ...

  7. 学python要有多少英语词汇量_北大保安小哥英语词汇量一万五,还有小哥会python!...

    &nbsp&nbsp&nbsp&nbsp3年积累单词量一万五千个,能与留学生流利对话,被外国人点赞--11月11日,北京大学举办第一届"争做数一数二的保安员& ...

  8. 学python要有多少英语词汇量_北大最强扫地僧:保安小哥英语词汇量一万五,会python,你成吗...

    网友们留言:"我也想去北大当保安" 从深藏功与名到一举成名,保安小哥们历经的是自己的隐忍与蛰伏,在无数个寂寞的日子里背单词,学编程,直到这种积聚的力量变成耀眼的一刻! 为什么这些保 ...

  9. 行业洞察 | 你的车载语音助手足够Smart吗?

    截止2021年,中国乘用车智能语音交互功能的搭载率已经高达86%.目前,汽车座舱正朝着智能化趋势发展,而车载语音助手是智能驾驶舱中最核心的功能.在驾驶过程中,由于驾驶员的手和眼睛都被任务所占据,因此车 ...

最新文章

  1. blf文件用什么软件打开_如何用皕杰流程创建一个blf演示流程文件?
  2. Java如何通过WSDL文件来调用这些web service
  3. Boost字符串处理
  4. python 进位_蓝桥杯-Python-高精度加法
  5. libgdx的菜单配置,以及json文件的结构
  6. window.innerHeight和document.documentElement.clientHeight区别
  7. HTML的段落与注释元素
  8. 0708 - 今天休息,顺便废了个点子
  9. 【安全】网络安全态势感知
  10. 美团外卖自动化业务运维系统建设
  11. 项目练习之利用Arraylist 实现学生管理系统(查询,添加,删除,修改)
  12. Cobalt Strike(cs) 联动 msf
  13. DELL笔记本FN键解锁
  14. 硬件探索——2FSK通信系统调制解调综合实验电路设计
  15. 【PLC编程】西门子工艺对象 – 连续控制器CONT_C的使用
  16. 知乎Redis的演进之路:从单机到2000万QPS的挑战
  17. 惠普笔记本突然读不到无线网卡
  18. 使用mclust进行聚类分析
  19. php中文手册 人间最美四月天,【心灵】人间最美四月天(散文)_江山文学网
  20. 音频基础知识 - PCM 浅析

热门文章

  1. 关于软件开发人员评价的几点思考
  2. 济南2021年高考马平烁 成绩 查询,济阳18岁女孩裸分达到704
  3. BotVS开发基础—2.5 策略交互
  4. 个人所得税java程序怎么编写_java个人所得税代码.doc
  5. 计算机网络ensp实验报告,计算机网络设计报告华为eNSP模拟器
  6. 科普Bayer滤光片
  7. hdu 6169 DP
  8. 小程序实战篇(一)——车辆使用登记
  9. es浏览器插件安装eshead
  10. Linux之常见面试题知识点批注(八)