语音识别    ----------   Automatic Speech Recognition,(ASR)

一、音频编解码过程

连续的模拟信号(人的声音或一切声音/声波)------>01bit的数字信号(PCM、mp3、WAV等音频文件或CD) ----->非连续的数字音频,该过程需要经过采样、量化、编码、解码;

1.1采样:

采样就是从一个时间上连续变化的模拟信号中取出若干个有代表性的样本值,来代表这个连续变化的模拟信号,如图示,按照奈奎斯特采样定理:要从采样值序列中完全恢复成原始波形,采样频率必须大于原始信号最高频率的2倍。

1.2量化

将采样后的每个点使用n个二进制数据表示,幅值相同的点所表示的二进制数据一样,比如0001表示A点和B点,0010表示C点。二进制数据位数越多,对声波幅值的纵向切分越精细。

1.3编码

采样、量化后的数据还不是数字信号,需要把它转化成数字脉冲,这个过程称为编码。

1.4采样频率和量化级

量化级:也叫量化数据位数,常见有8bit和16bit,8bit表示把纵轴划分为256个量化等级(2^8),量化位数越高,量化值越接近采样值,其精度越高,但要求的信息存储量就越大。

采样频率:采样频率高低决定了声音失真程度的大小,为保证声音不失真,采样频率应该在40kHz左右。采样频率一般有三种,44.1kHz是最常见的采样率标准(每秒取样44100次,用于CD品质的音乐);22.05kHz(适用于语音和中等品质的音乐);11.25kHz(低品质)。对于高于48KHz的采样频率人耳已无法辨别出来了,所以在电脑上没有多少使用价值。

5kHz的采样率仅能达到人们讲话的声音质量。

11kHz的采样率是播放小段声音的最低标准,是CD音质的四分之一。

22kHz采样率的声音可以达到CD音质的一半,目前大多数网站都选用这样的采样率。

44kHz的采样率是标准的CD音质,可以达到很好的听觉效果。

语音识别之--音频编解码相关推荐

  1. FFMPEG视音频编解码学习(1)

    ###开篇 看过了FFMPEG视音频编解码的基础知识,接着还有许多比如制作一个基于FFMPEG的视频播放器等,但是好像比较抽象,而且在公司的mac上很多软件也没有(重点是看的一头雾水), 还是老老实实 ...

  2. 即时通讯音视频开发(六):如何开始音频编解码技术的学习

    前言 即时通讯应用中的实时音视频技术,几乎是IM开发中的最后一道高墙.原因在于:实时音视频技术 = 音视频处理技术 + 网络传输技术 的横向技术应用集合体,而公共互联网不是为了实时通信设计的. 系列文 ...

  3. 视音频编解码学习工程:JPEG分析器

    ===================================================== 视音频编解码学习工程系列文章列表: 视音频编解码学习工程:H.264分析器 视音频编解码学习 ...

  4. 视音频编解码学习工程:TS封装格式分析器

    ===================================================== 视音频编解码学习工程系列文章列表: 视音频编解码学习工程:H.264分析器 视音频编解码学习 ...

  5. 视音频编解码学习工程:FLV封装格式分析器

    ===================================================== 视音频编解码学习工程系列文章列表: 视音频编解码学习工程:H.264分析器 视音频编解码学习 ...

  6. 视音频编解码学习工程:H.264分析器

    ===================================================== 视音频编解码学习工程系列文章列表: 视音频编解码学习工程:H.264分析器 视音频编解码学习 ...

  7. 视音频编解码技术及其实现

    核心提示:一.视音频编码国际标准化组织及其压缩标准介绍 国际上有两个负责视音频编码的标准化组织,一个是VCEG(VideocodeExpertGroup),是国际电信联合会下的视频编码专家组,一个是M ...

  8. [总结]FFMPEG视音频编解码零基础学习方法--转

    ffmpeg编解码学习 目录(?)[-] ffmpeg程序的使用ffmpegexeffplayexeffprobeexe 1 ffmpegexe 2 ffplayexe 3 ffprobeexe ff ...

  9. 基于 CoreAudio 的音频编解码(二):音频编码

    系列文章目录 基于 CoreAudio 的音频编解码(一):音频解码 基于 CoreAudio 的音频编解码(二):音频编码 前言 在 基于 CoreAudio 的音频编解码(一):音频解码 中,我们 ...

最新文章

  1. VDI序曲二十三 制作OFFICE 2003应用程序虚拟化序列
  2. Ajax请求利用jsonp实现跨域
  3. Linux监控命令之 top
  4. beeline执行sql文件_MyBatis的SQL执行流程不清楚?看完这一篇就够了
  5. sd卡测速工具_拍完照回家发现SD卡损坏,拯救你的照片就用这个办法!
  6. mysql怎样搞一个项目_程序员如何快速上手一个自己不太熟悉的新项目?有什么技巧?...
  7. 20170314--服务器监控
  8. idea打包docker镜像
  9. sendto函数深入理解
  10. mac php codesniffer,[转载]使用PHP_CodeSniffer规范php代码
  11. 初识深度信念网络DBN
  12. 实验中应该遵循的几个原则
  13. c# excel文档导入及excel存储数据库
  14. 中国大学慕课第7周测验
  15. 数据库基础知识及概念
  16. 国庆节去哪浪?让 Python 帮你分析分析
  17. 利用python制作小游戏
  18. 探寻C/C++中更快的大数(自然数集)模板
  19. 如何设计标签系统?如果构建用户画像
  20. 7-9 Jack cheng的烦恼2

热门文章

  1. mysql 垂直分表技术的实战演练,有实战代码。
  2. js中出现missing ) after argument list
  3. QT解析嵌套JSON表达式
  4. NUC1445 Euclid's Game【博弈】
  5. Bailian2765 POJ NOI0113-03 八进制小数【进制】
  6. HDU2040 亲和数【水题】
  7. Graphviz样例之集群流程图
  8. HDU2072 单词数【水题】
  9. 冷知识 —— 计算机科学及编程
  10. 郊寒岛瘦 —— 太平洋的小岛