4G已经商用5年,但高清语音VoLTE(Voice over LTE,基于4G网络的语音业务)仍然没有普及。

图1 VoLTE与5G

如果你的手机上显示"HD"或者"VoLTE",那么表示你已经在享受高清语音服务了。

图2 高清语音的标志

同样的,5G网络也有高清语音,叫做VoNR

5G网络部署初期,语音通话"借道"4G,回落到4G,通过VoLTE甚至2/3G(CSFB)实现。但随着5G网络的普及以及发展,VoNR将逐步成为主流语音方案。具体演进过程有3条路径。

图3 VoNR演进路线

体验过VoLTE的同学都知道,相较于非高清HD语音,高清语音更加清晰与细腻。

GSM语音编码FR(全速率编码)处理的语音带宽是200~3400Hz,VoLTE的语音编码AMR-WB(自适应多速率编码)是50~7000Hz。可见VoLte的处理带宽更宽,这样意味着VoLte可以采集编码到更多低频和高频声音,还原后的声音比GSM更丰富。

VoLTE的采样率达到16kHz,码率可以支持到23.85kps。实测VoLTE电话如图4所示:

图4 VoLTE分析测试

高清语音实现的离不开采样率的提升,这也是本文的主题。

文 | 通信M班长,阅读时间预计2分钟

导读

采样是模拟信号数字信号之间的桥梁。面对一个模拟信号,我们如何合理地去将其变成离散的信号,并将其交给数字电路或者计算机去处理。

1928年,贝尔实验室的科学家哈里·尼奎斯特(Harry Nyquist)在他的论文"电报传输理论的一定论题"中首次提到了这个问题与答案。1949年,数学工程师克劳德·香农(Claude Shannon)在他的文章中证明了这一点。

图5 奈奎斯特

"模拟"信号来源于来大自然,模拟一词是指它与大自然本真的信号"相似"。

一个"真实世界"的模拟声音信号可以用麦克风捕捉到,如图6所示,声波被麦克风捕捉后转换为电信号。

图6 模拟信号的产生

麦克风中有一个薄膜(membrane),当声音传来时,声波带动薄膜振动,根据声波压力的变换,隔膜被前后推动。

图7 麦克风的工作原理

膜片的位移被转换成一个时变的电压——一种模拟电信号。当薄膜振动时,带动线圈振动,线圈和永磁铁的相对位置改变,这使得穿过线圈的磁场发生变化,磁场变化了会在线圈中产生感应电动势,也就产生了电流。特定的声音有特定的振动,特定的振动产生特定形式的电流。所以话筒就把声音"编码"成了电流的形式。

为什么要采样?

模拟信号是时间上连续的信号。

连续时间信号在任意时刻t都有瞬时的值,所以在计算机中不能存储或处理这样的连续信号。

因此,模拟信号必须被数字化(离散化)以产生用于计算机使用的数字集合。

图8 模拟到数字,数字再到模拟转换

离散时间信号具有有限(可数的)序列,每个序列都有限的可能值。

图9 采样的过程

以规则的时间间隔取连续信号的各个值的过程称为采样,如图9所示。

模拟(连续)信号被数字化(离散化)的过程称为模拟-数字转换,使用称为模数转换器(ADC)的硬件完成。

图10 输入是模拟信号,输出是数字信号

为了正确地表示模拟信号,ADC必须完成两项任务:

  • 抽样:在一定的时间间隔内取值,使连续时间变量t数字化;
  • 量化:使用有限的计算机位给样本分配一个值,数字化瞬时振幅x(t);

样本之间的时间间隔(以秒为单位)称为采样周期Ts,采样周期与采样率成反比fs=1/Ts。

图11 对模拟信号采样,用序列索引

以连续时间正弦信号x(t)=Asin(Ωt+Φ)举例,Ω称之为连续的时间频率。

当我们对其离散化,可以这样表示x(n)=Asin(ΩnTs+Φ),由整数n索引的数字序列。

我们令ω=ΩTs=Ω/fs,ω为离散时间频率,它是Ω关于fs的归一化频率。

图12 正弦信号的采样过程

需要多久采样一次原始的模拟信号?

假设我们得到一个模拟信号为图13(A)。现在我们用几种不同的采样率对原始信号(A)进行采样,如(B)(C)(D)。问题是"哪一个(BCD)最能代表原始信号(A)?"。

换句话说,如果我们将采样信号(BCD)转换回模拟信号(EFG),那么EFG中哪一个与原始信号(A)最接近(最相似)?

答案将是简单和直观的。

你很容易就会选择(C)作为最好的答案。是的,这是对的。最好的答案是(C)。

但是要对信号进行高速采样,需要高速的ADC和大容量的存储能力!

图13 不同的采样速率

那么,一定存在一个最小的采样率,按照这个采样率,我们再接收端恢复原始信号时,不会丢失关键信息。

抽样理论就是在这里开始的。

满足要求的最小采样率称为"奈奎斯特抽样率"

抽样理论的定义:

在进行模拟/数字信号的转换过程中,当采样频率fs.max大于信号中最高频率fmax的2倍时(fs.max>2fmax),采样之后的数字信号完整地保留了原始信号中的信息,一般实际应用中保证采样频率为信号最高频率的2.56~4倍;采样定理又称奈奎斯特定理。

在图14(A)情况下,原始信号只有一个频率分量。因此,任何采样率等于或大于fm的两倍(2xfm),都将保留原始信号中包含的所有关键信息。

在(B)情况下,原始信号由从0到fh的多个频率分量组成。因此,任何采样率等于或大于fh的两倍(2xfh),都将保留原始信号中包含的所有关键信息。

在(C)情况下,原始信号由多个频率分量组成,但起始频率不是0,而是从fl频率开始到fh。我们把fh和fl之间的频带称为信号的带宽,fw。因此,任何采样率等于或大于fw的两倍(2×fw),都将保留原始信号中包含的所有关键信息。

图14 奈奎斯特频率

为什么是2倍呢?

采样定理的证明

将信号进行傅里叶变换,在频域内作相关分析,很容易得出奈奎斯特的结论。

图15 冲激抽样信号的频谱

现在我们有一个信号f(t),对其求傅里叶变换得到F(ω),频率范围为-ωm~+ωm;

通过冲激抽样函数δt(t)对信号f(t)进行抽样,得到抽样函数fs(t)=f(t)δt(t)

时域的乘积,对应频域的卷积

这里用到了一般周期信号的傅里叶变换公式

其中T1是信号的周期。

Fs(ω)的表达式告诉我们,采样信号的频谱就是原始信号频谱的周期延拓,延拓的周期为ωs(或者fs)。如果ωs大于2倍的ωm,显然如图15(b)所示,互相之间不影响;如果ωs小于2倍的ωm,显然如图15(c)所示,互相之间影响"混叠"。

此时,再通过傅里叶反变换求取信号f(t)的时候,必然造成失真。

这就是前面所说的奈奎斯特定理。

观察图16,原始信号的频谱不在零频附近,而是在采样频率整数倍处,类似于图14(c)。这不影响采样定理的执行,采样信号的频谱依然是周期延拓。

图16 非零频对称的原始频谱 周期延拓

同样的,原始信号可能是多个,其对应的频谱也会是多个。图17中,原始信号的频谱为图中带"斜线"的方块,从左到右依次为"深蓝蓝色紫色红色青色黄色",这些频谱只要它的周期延拓不产生混叠,那么依然可以无失真的恢复关键信息。

图17 多个频谱的周期延拓

总结

如果想要获得好的通话体验,必须要尽可能多"采样"声音信号(当然还与编码方式有关)。GSM的采样率是8kHz,VoLTE达到16kHz。人说话的声音为300~3400Hz,按照奈奎斯特的采样定理,至少采样率为6.8kHz。

所以GSM网络采用的采样率为8kHz满足基本要求。

像CD的采样率达到44.1kHz。用44.1KHZ的采样频率进行采样,则可还原最高为22.05KHZ的频率-----这个值略高于人耳的听觉极限(20Hz~20000Hz)。这是CD为什么音质清晰的原因!

通信领域内受限于设备的处理能力和容量,并不能一味地追求高采样率与编码算法。

HD高清语音是相对传统的语音编码而言的,技术指标上要求采样频率高于传统的语音,量化方法和编码速率同样有更高的要求。从感知上说,传统语音局限于人声的表达,高清语音除人声之外还能表达更多的环境上的声响。

References

[1]Eric Jacobsen, "Frequency-Domain Periodicity and the Discrete Fourier Transform

利用函数wavread对语音信号进行采样_VoNR与VoLTE实现高清语音的奥秘,就是从小小的采样频率开始...相关推荐

  1. 利用函数wavread对语音信号进行采样_语音识别第4讲:语音特征参数MFCC

    一.MFCC概述[1] 在语音识别(SpeechRecognition)和话者识别(SpeakerRecognition)方面,最常用到的语音特征就是梅尔倒谱系数(Mel-scaleFrequency ...

  2. matlab wav合成,请问大佬们如何把合成语音信号存为wav文件?我用的语音信号是...

    该楼层疑似违规已被系统折叠 隐藏此楼查看此楼 请问大佬们如何把合成语音信号存为wav文件? 我用的语音信号是自己录的,大佬们可以自己用自己的试一试,这是我的代码,谢谢大家 clear all; clc ...

  3. volte信令流程详解_VOLTE高清语音通话,呼叫时延低于3秒是如何做到的?

    [摘要]语音呼叫建立时延是衡量VoLTE网络质量和客户感知的关键指标之一.本文基于现网研究与实践,分析了VoLTE呼叫时延的特点和影响要素,探索了相关优化思路和方法,对于指导VoLTE呼叫时延优化工作 ...

  4. 户外直播、移动直播遇到弱网信号差,如何保证流畅又高清画面传输

    户外直播.移动直播遇到弱网信号差,如何保证流畅又高清画面传输? "我从4点守到6点,牺牲了宝贵的睡眠时间,就为了看一场完整日出,画质不清晰就算了,一顿卡完之后太阳已经在半空中了,真是一天的好 ...

  5. 电信高清语音服务器,电信VoLTE高清通话来了,来电秒接通、打电话4G不掉线!...

    原标题:电信VoLTE高清通话来了,来电秒接通.打电话4G不掉线! 摘要:说起VoLTE,相信大家对它都不会陌生.早在几年前,三大运营商就已经开始着手VoLTE的工作了,但普及程度却不理想.为了带来更 ...

  6. 利用函数wavread对语音信号进行采样_语音信号处理相关知识

    本文的初衷是为后续模型介绍和论文速览提供一个过渡,核心价值在于介绍一些较为基础的概念,以使得后文中如遇到不太理解的概念通过本文查证 一.语音的表示 语音的表示形式本质为波形,从语音到波形的理解可以想象 ...

  7. 利用函数wavread对语音信号进行采样_AI大语音(一)——语音识别基础(深度解析)...

    1 声音特性​ 声音(sound)是由物体振动产生的声波.是通过介质传播并能被人或动物听觉器官所感知的波动现象.最初发出振动的物体叫声源.声音以波的形式振动传播.声音是声波通过任何介质传播形成的运动. ...

  8. 利用函数wavread对语音信号进行采样_统计与自适应信号处理知识点总结-期末考试...

    图片不好上传,需要完全版本请付费咨询我! 信号包括:确定性信号和随机信号. 确定性信号,可以清楚的用数学关系描述的信号.也就是说可以用过去的观察来预测未来值. 随机信号,以不可预见的方式实时产生,他们 ...

  9. 宽带噪声语音信号增强matlab,基于声卡和Matlab平台的语音信号增强处理系统

    基于声卡和Matlab平台的语音信号增强处理系统 摘要:计算机声卡是多媒体技术中最基本的组成部分,是实现声波/数字信号相互转换的一种硬件.文章对基于计算机声卡的谱相减语音增强系统进行分析.首先分析了基 ...

  10. 户外直播、移动直播遇到弱网信号差,如何保证流畅又高清画面传输?

    "我从4点守到6点,牺牲了宝贵的睡眠时间,就为了看一场完整日出,画质不清晰就算了,一顿卡完之后太阳已经在半空中了,真是一天的好心情都被毁掉,对这个直播太失望了!" 而随着直播行业的 ...

最新文章

  1. php使用redis持久化,Redis持久化完整版本
  2. 使用Android Studio运行项目出现 UnsupportedMethodException 错误的解决办法
  3. 员工信息增删改查程序 (大神版)
  4. android JSONObject的使用
  5. 简历中该怎么写自己了解html,我用HTML写简历
  6. 嵌入式Linux入门9:Linux系统使用
  7. CodeSmith 注册
  8. 用 Graphviz+pvtrace 可视化函数调用
  9. php tp框架文档,Thinkphp 框架基础之入口文件功能、定义与用法分析
  10. python difflib 编辑距离_LeetCode--072--编辑距离(python)
  11. FlashBuilder 4.6 破解序列号和方法
  12. Android——获取实时的手机屏幕四个点经纬度(百度地图)
  13. art-记一次提取mmd模型到max和unity
  14. 苹果7pnfc功能门禁卡_苹果NFC功能不再鸡肋?原来还能这么玩,内附门禁卡复制教程...
  15. 基于Python pdfplumber实现PDF转WORD
  16. 可折叠的table表格
  17. 手机PDF文件转换成图片教程来了,PDF转换器推荐
  18. LeetCode:求全由1构成的最大正方形面积
  19. Cesium常用知识及学习
  20. C#学习笔记-自定义控件边框颜色

热门文章

  1. CCF计算机职业资格认证考试201312-2试题及答案
  2. 14讲项目实战内页抽出切换效果的实现
  3. 空降项目经理,该如何服众?
  4. 处理器仿存带宽_CPU,内存,主板带宽是怎么计算的?网上帖子说内存和主板的带宽要大于等于CPU带宽,充分利用CPU...
  5. 20190905层析分析法matlab,未通过一致性检验时,重新构造判断矩阵再计算
  6. C语言根据汉字拼音首字母排序
  7. Maya用样条线制作面片头发
  8. html表单变灰,excel菜单灰色 excel工具栏突然变灰了 怎么办
  9. syn_sent mysql_服务器上出现大量的SYN_RECV或者SYN_SENT状态的TCP连接的问题分析
  10. word 添加手写签名