文章目录

语音识别是什么?他有什么价值,以及他的技术原理是什么?本文将解答大家对语音识别的常见疑问。

语音识别技术(ASR)是什么?

机器要与人实现对话,那就需要实现三步:

对应的便是“耳”、“脑”、“口”的工作,机器要听懂人类说话,就离不开语音识别技术(ASR)。

语音识别已经成为了一种很常见的技术,大家在日常生活中经常会用到:苹果的用户肯定都体验过 Siri ,就是典型的语音识别

微信里有一个功能是”文字语音转文字”,也利用了语音识别

最近流行的智能音箱就是以语音识别为核心的产品

比较新款的汽车基本都有语音控制的功能,这也是语音识别

语音识别技术讲解

语音识别技术拆分下来,主要可分为“输入——编码——解码——输出 ”4个流程。

那语音识别是怎么工作的呢?

首先声音的本身是一种波,就像我们常常用一段段波形来表示音频一样。

接下来按步骤:给音频进行信号处理后,便要按帧(毫秒级)拆分,并对拆分出的小段波形按照人耳特征变成多维向量信息

将这些帧信息识别成状态(可以理解为中间过程,一种比音素还要小的过程)

再将状态组合形成音素(通常3个状态=1个音素)

最后将音素组成字词(dà jiā hǎo)并串连成句 。于是,这就可以实现由语音转换成文字了。

百度百科和维基百科

百度百科版本

语音识别技术,也被称为自动语音识别 Automatic Speech Recognition,(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。

维基百科版本

语音识别是计算语言学的跨学科子领域,其开发方法和技术,使得能够通过计算机识别和翻译口语。它也被称为自动语音识别(ASR),计算机语音识别或语音到文本(STT)。它融合了语言学,计算机科学和电气工程领域的知识和研究。

一些语音识别系统需要“训练”(也称为“登记”),其中个体说话者将文本或孤立的词汇读入系统。系统分析人的特定声音并使用它来微调对该人的语音的识别,从而提高准确性。不使用训练的系统称为“说话者无关” 系统。使用训练的系统称为“说话者依赖”。

扩展阅读

一文看懂语音识别 - ASR(基本原理 + 4个实现流程)相关推荐

  1. 一文看懂“语音识别ASR” | AI产品经理需要了解的AI技术概念

    原标题:一文看懂"语音识别ASR" | AI产品经理需要了解的AI技术概念 温馨提示:文末有[重大福利]:优惠券(金额很大) for 三节课<产品经理P2(进阶)系列课程&g ...

  2. 一文看懂:芯片IC的封装/测试流程

    一文看懂:芯片IC的封装/测试流程 流程 IC Package (IC的封装形式)指芯片(Die)和不同类型的框架(L/F)和塑封料(EMC)形成的不同外形的封装体. IC Package种类很多,可 ...

  3. 科普丨一文看懂语音识别的技术原理

    简要给大家介绍一下语音怎么变文字的吧.希望这个介绍能让所有同学看懂. 首先,我们知道声音实际上是一种波.常见的mp3.wmv等格式都是压缩格式,必须转成非压缩的纯波形文件来处理,比如Windows P ...

  4. 一文看懂“业务定制智能客服”的产品设计_团员分享_@苍狼剑歌

    前言:本文作者是"AI产品经理大本营"团员@苍狼剑歌,现任某一线大厂AI产品经理.另外,文末还有2个"hanniman读者专属福利",1)优惠券 for 三节课 ...

  5. 一文看懂“声纹识别VPR” | AI产品经理需要了解的AI技术概念_团员分享_@cony

    前言:声纹识别是AI领域中一个看似很小.但其实有机会在近期落地,且比较有意思的细分方向:本文作者是"AI产品经理大本营"团员@cony  ,她总结了AI产品经理"最必要& ...

  6. 一文看懂「生成对抗网络 - GAN」基本原理+10种典型算法+13种应用

    生成对抗网络 – Generative Adversarial Networks | GAN 文章目录 GAN的设计初衷 生成对抗网络 GAN 的基本原理 GAN的优缺点 10大典型的GAN算法 GA ...

  7. 一文看懂计算机视觉-CV(基本原理+2大挑战+8大任务+4个应用)

    2020-03-06 20:00:00 计算机视觉(Computer Vision)是人工智能领域的一个重要分支.它的目的是:看懂图片里的内容. 本文将介绍计算机视觉的基本概念.实现原理.8 个任务和 ...

  8. 一文看懂卷积神经网络-CNN(基本原理+独特价值+实际应用)

    http://blog.itpub.net/29829936/viewspace-2648775/ 2019-06-25 21:31:18 卷积神经网络 – CNN 最擅长的就是图片的处理.它受到人类 ...

  9. 一文看懂深度学习——人工智能系列学习笔记

    深度学习有很好的表现,引领了第三次人工智能的浪潮.目前大部分表现优异的应用都用到了深度学习,大红大紫的 AlphaGo 就使用到了深度学习. 本文将详细的给大家介绍深度学习的基本概念.优缺点和主流的几 ...

最新文章

  1. -16 | 12 等于多少
  2. HDU4612 Warm up
  3. 编程体系结构(02):Java异常体系
  4. 等式约束的序列二次规划(SQP)
  5. VisualStudio神级插件Resharper的基本配置和使用技巧大全+Resharper性能优化
  6. 拓端tecdat|R语言对NASA元数据进行文本挖掘的主题建模分析
  7. JS中Ajax的方法和应用
  8. linux查看网络响应时间,Linux netperf网络性能测试
  9. 惜时间_惜时间的作文
  10. 理解javaScript的数据类型之字符串类型
  11. 计算机中保存和另存为,电脑另存为在哪里
  12. 物理机安装linux系统,U盘在物理机安装linux系统
  13. 系统之家启动维护光盘v3.1[大盘版·贺岁篇]
  14. 李峋 爱心代码 点燃我温暖我
  15. 英文seo发外链的方法技巧
  16. mit 6.NULL简单记录
  17. 1、Java三员管理
  18. harris角点检测和SIFT
  19. 数字锁相环路(DPLL)介绍及其matlab仿真
  20. 【Simulink】单相电压型全桥逆变电路仿真基础实验

热门文章

  1. [译] 深入理解 JavaScript 事件循环(二)— task and microtask
  2. python3 介绍
  3. Android对话框自定义标题
  4. LJL-Solution 清空页面所有值的 (2)
  5. 模仿豆丁、百度文库播放器
  6. [小创造]“XENON”,我的JSON变种。
  7. .net Remoting(1)——起点,从示例做起
  8. WPF中改进自定义Command一些想法
  9. 信息反馈-邮件(数据库是XML) (收集)
  10. Bailian3728 Blah数集【数学+set】