数字编码;数字语音编码

模拟与数字信号(Analogue vs. Digital Signals)
• 所有自然信号(包括语音)都是“模拟”– 他们可以假设无限的可能值;它们在时间中连续存在
• 完美处理模拟信号需要无限分辨率和/或无限存储
• 任何实用系统(计算机或生活有机体)必须牺牲保真度才能使用有限资源处理信号
• 因此,信号必须在每个维度(幅度和时间)– 时间方向的量化称为“采样”

信号序列的量化
时间方向是通过“采样”来实现的
• 语音信号(例如来自麦克风)通常是
– 量化幅度
– 及时采样
• 信号量化过程和抽样被称为:“脉冲编码调制”(PCM)

幅度量化(Amplitude Quantisation)
• 可用于的数字范围表示信号的幅度定义了系统的“动态范围”
• 如果 n 位用于存储每个幅度值,然后 2^n 个可能的值可以是
代表(0到2^n-1)
• 动态范围为 20 log10(2^n-1) 分贝
• 例如:16 位幅度量化给出了65535 个可能的值;96 分贝动态范围

连续信号采样
• 计算机通常无法处理连续的信号
• 必须对信号进行采样和量化

采样间隔:
Ts= 1/fs
fs = 8000HZ(说话)
fs = 44100HZ(音乐)
要确定采样正弦曲线的频率,每个时期至少需要两个样本

采样率(Sample Rate)
• “奈奎斯特采样定理”表明我们需要至少两倍的样本点数
每秒作为信号中的最高频率:采样率 > 2 x 最大信号频率
• 对低于奈奎斯特速率的信号进行采样会导致“混叠”(频率高于采样的能量率被反射回较低的频率)
• 例如:混叠可能发生在数字图像中,如果空间频率高于像素分辨率(结果是“莫尔条纹”)
• 通常在采样前对信号进行低通滤波为了避免混叠:fc < 0.5 fs
fc是滤波器的“截止频率(cut-off frequency)”; fs是“采样频率”

抽样理论
• 对连续信号 s(t) 进行采样是等效的乘以“狄拉克三角函数”
• 这个冲量是单位面积的一个矩形以 t0 为中心,其宽度趋于 0
狄拉克δ函数是一个广义函数,在物理学中常用其表示质点、点电荷等理想模型的密度分布,该函数在除了零以外的点取值都等于零,而其在整个定义域上的积分等于1。
狄拉克δ函数在概念上,它是这么一个“函数”:在除了零以外的点函数值都等于零,而其在整个定义域上的积分等于1。

编码理论
• 源自“信息论”(由克劳德·香农于 1948 年创立)
• 基于概率论和统计学
• 最重要的信息量是:
–“熵entropy”(随机变量中的信息)
– “相互信息mutual information”(信息量两个随机变量之间的共同点)
• 信息通常以位( bits)表示
– 熵表示数据的容易程度‘压缩’(由于冗余)
– 互信息可用于查找通过信道的通信速率

数字编码:图像
• 示例图像:360 像素宽,480 像素高,3 种颜色 (RGB),1 字节/颜色
• 原始数据(位图)Raw data (bitmap):518.4 KB (360 x 480 x 3)
• “无损”编码‘Lossless’ coding (LZW-TIF):378 千字节
• “有损”编码‘Lossy’ coding (jpeg): 31 千字节

数字编码:信号
• “编码”一个信息所需的信息量
信号由幅度量化(以比特/样本为单位)采样率(以样本/秒为单位)和定义
• 因此,数字信号的特征在于他们的“数据速率”(以比特/秒为单位 - bps)
– 以太网 LAN = 10 Gbps
– 无线 LAN = 600 Mbps
– ADSL 调制解调器 = 24 Mbps
– 4G 移动数据 = ~10 Mbps
– 3G 移动数据 = ~4 Mbps

数字编码:语音
• 演讲有约 10 kHz 的带宽,约 50 dB 的动态范围
• 因此,最小量化和采样要求似乎是20 kHz 采样率,8 位量化, 即 160 kbps
• 但是,可以同时降低带宽和动态范围在遭受重大损失之前显着
语言清晰度下降
– 例如 电话的带宽为 ~300 Hz 至 ~3.5 kHz(这对于 [f] 和 [s] 等声音来说是个问题)
• 数字语音“编解码器”充分利用有损压缩方案(通过利用“源过滤器”语音模型)
• 数字电话:8000 Hz * 8 Bit = 64.000 Bit /sec (ISDN)
• GSM(2G 移动):4-13 kBit/秒
综合业务数字网络 (ISDN) 是一组通信标准,用于通过公共交换电话网络的数字化电路同时数字传输语音、视频、数据和其他网络服务。
全球移动通信系统 (GSM) 是由欧洲电信标准协会 (ETSI) 开发的标准,用于描述移动电话和平板电脑等移动设备使用的第二代 (2G) 数字蜂窝网络协议。 GSM 也是 GSM 协会拥有的商标。GSM 也可能指全速率语音编解码器。
Audio/Speech Codecs
• DVD audio (24 bit 192 kHz PCM) = 4,608 kbps
• CD audio (16 bit 44.1 kHz PCM) = 705.6 kbps
• 16 bit 16 kHz PCM = 256 kbps
• telephone (8 bit 8 kHz ADPCM) = 64 kbps
• MP3 of these lectures = 24 kbps
• mobile phone (GSM CELP) = 13 kbps
• VOIP (low rate) = 8 kbps
• NATO vocoder (channel) = 2400 bps
• NATO vocoder (LPC10e) = 2400 bps
• NATO vocoder (MELP) = 1200 bps

数字语音编码
• 语音中的“信息率”估计为只有~100 bps!
– 语言信息 = ~50 bps
– 副语言信息 = ~50 bps
• 那么为什么我们需要kbps 声码器?
• 以较低速率编码信号的方法是利用信号中的任何“冗余”
• 对于语音,这是通过使用预测来实现的模型(在以后的讲座中会详细介绍)
• 语音的最终预测模型是“语音识别”+“语音合成”

数字编码;数字语音编码相关推荐

  1. 计算机网络——数字数据的数字编码

    计算机网络--数字数据的数字编码 数字数据的数字编码就是如何把数字数据用物理信号的波形表示,即用高低电平表示二进制. 1.不归零码 正电平代表1,负电平代表0 2.归零码 正脉冲代表1,负脉冲代表0 ...

  2. 数字-数字编码和模拟-数字编码

    信息的编码方式依赖于它原始的格式和通信硬件采用的格式,在文本数据情况下,信号的模式可以有两类:ASCLL码和EBCDIC码. 一般来说,共有四种编码方式: 数字-数字 模拟-数字 数字-模拟 模拟-模 ...

  3. 转:数字对讲机常识介绍

    一.国内外数字对讲机发展动态 从整个移动通信的应用来划分,通信网络可分为公众移动通信和专业移动通信两大类,其中公众移动通信就是社会上广大消费者正在使用的2G.3G移动手机,它是为广大公众提供移动通信服 ...

  4. 百天记忆-数字编码记忆

    数字编码 数字 图片 0 万年魂环 1 蜡烛 2 鹅 3 猫耳朵 4 木船 5 锤石 6 勺子 7 木剑 8 眼镜 9 哨子 00 望远镜 01 小树 02 铃铛 03 凳子 04 轿车 05 手套 ...

  5. 【语音SBC算法】基于正交滤波器组的语音SBC算法设计与实现

    数字语音编码是现代数字语音通信以及数字语音存储回放的前提和基础,对数字语音通信系统和数字语音存储回放系统的性能具有决定性的作用.目前,主要从编码速率.时延.语音回放质量等指标上研究高效的数字语音编码算 ...

  6. 即时通讯音视频开发(六):如何开始音频编解码技术的学习

    前言 即时通讯应用中的实时音视频技术,几乎是IM开发中的最后一道高墙.原因在于:实时音视频技术 = 音视频处理技术 + 网络传输技术 的横向技术应用集合体,而公共互联网不是为了实时通信设计的. 系列文 ...

  7. 研究音频编解码要看什么书

    前言...... 最近总是有人问研究音频编解码要看什么书 其实这是一个很难回答的问题,原因有很多. 首先,做工程首先一个问题就是和课本学习不同,不是看书能解决的. 其次,音频编解码技术在国内研究的人很 ...

  8. gp338信令_【对讲机的那点事】 细说GP338GP328对讲机编程

    原标题:[对讲机的那点事] 细说GP338&GP328对讲机编程 摩托罗拉中不乏经典机型,其中GP328/338就是其中一款机器,应公众号对讲机微信号shuziduijiangji粉丝@此去经 ...

  9. 音视频相关的书籍,多媒体技术,语音识别

    对播放器架构演进.流媒体存储传输.视频编解码标准及图像声音信号处理,既对数学要求较高又与当时全民IT热相结合的专业--(计算机)信息安全,精妙绝伦的数论及密码学.既能应用密码学的知识技能又能和声色并茂 ...

最新文章

  1. Hyperledger Fabric PHP SDK
  2. B站疯传!拿走不谢!最全面的JAVA面试材料!完整版开放下载,叫我好人!
  3. 短序列拼接软件velvet简介
  4. VTK:图片之ImageCityBlockDistance
  5. STM32F103ZE单片机在WWDG窗口看门狗的EWI中断中喂狗导致系统复位的原因及解决办法(中断函数重入问题)
  6. flex 图片旋转(解决公转和自转问题)
  7. flask找不到css_Flask干货:访问数据库——Flask-SQLAlchemy初始化
  8. pip更新后怎么还是旧版本_双城SEO优化_百度算法更新后,企业网站外链该怎么发?...
  9. python网址编码转换_python字符串与url编码的转换实例
  10. IT男,程序猿在婚恋市场有多受欢迎?
  11. 为什么国内动漫制作多为3D动漫?3DMAX制作次时代建模主要是因为?
  12. 关于文件变化监听, 你了解多少?
  13. HyperLPR车牌识别算法学习
  14. 【转】贴片晶振挖空敷铜
  15. SpringBoot测试:pom文件版本重复和不一致导致的问题xxxConfigurationPropertySource和Assert.state(ZLjava/util/function/Supp
  16. 华三防火墙远程telnet登录设置
  17. 哪些iPhone具有纵向模式?
  18. 讲了这么多年的CPU频率,到底是什么?
  19. 光时域反射仪的选择应该从哪些方面考虑?
  20. 实习 | QQ音乐(深圳)娱乐营销实习生

热门文章

  1. iPhone手机屏幕尺寸与倍图计算公式(更新至iPhone 14 Plus)
  2. MATLAB遇到NaN
  3. Bit、Byte、KB、MB(M)、GB(G)关系
  4. 屏幕适配和百分比布局
  5. 服务器维修模板,中国直辖市服务器维修及数据恢复模板.doc
  6. 防静电手环在计算机中的功能,无线静电手环是怎样防静电的原理是什么
  7. 如何快速理解IMU积分、预积分、误差、方差
  8. 小红书携手HMS Core,畅玩高清视界,种草美好生活
  9. 国内安全厂商护航XP能力引争议
  10. 【计算机毕业设计】前台点菜系统