语音处理:音频入门之基础概念总结
语音处理:音频入门之基础概念总结
- 基本概念
- 语音增强
基本概念
- 过采样:超过音频本身实际带宽的采样率,如音频带宽12kHz,用96kHz采样属于过采样,用24kHz采样则较为合理。上采样,也属于过采样。常见采样率:
16/32/48/44.1/48/88.2/96kHz
。 - 上采样:从较低采样率上升至高采样率,如
16kHz
采样提高至48kHz
采样,本质采用的是插值方法。 - 下采样:从较高采样率下降至低采样率,如
48kHz
采样下降至16kHz
采样,本质采用的是抽样方法。 - 上混:多个单声道混成多声道,类似于声轨处理。
- 下混:多声道合成少声道,类似于采样值的混叠相加。
上混和下混的区别
- 上:少个声道,拆分混音成多个声道,如单声道到立体声
- 下:多个声道,合并混音成少声道,如立体声到单声道
- 类比上采样、下采样
语音增强
语音与音频的区别是?
- 人说话声为语音,大自然或者乐器声为音频,有规律的乐器声或人歌唱声或两者结合为音乐。
- 人的发音器官发出的声音称为语音,主要集中在频段 300Hz到3400Hz之间。
- 大自然和乐器产生的声音称为音频,人耳可以听到的频率在20Hz 到20KHz 之间。
语音中有效带宽的分类是?
- 窄带, NB,4k, Narrow Band
- 宽带,WB,8k
- 半超宽带,SSWB,12k,Semi Super Wide Band
- 超宽带,SWB,16k
- 全带,FB,20k
- 主要依据来自人耳听觉范围:20Hz-20kHz
何为音高?
- 基频的频率F0较大(大于500Hz)且背景的频谱能量比较低时,则认为是高音高。简单说就是基频频率大。低音高就是基频频率小。
语音增强的回声消除中远端和近端是什么概念?
- 远端:对方,对方发声传递到近端
- 近端:我方,我方采集声音反馈回远端
语音处理:音频入门之基础概念总结相关推荐
- “声音”背后的原理(3):音频信号处理的基础概念和流程小结
文章目录 基础概念 音频处理流程(获取音频) 音频特征 从音频信号到特征帧 从信号到特征的全过程 从信号到特征关键点 基础概念 如何理解音频帧?一帧的时长是多少? 如何理解采样个数和采样率? 下面通过 ...
- CUDA入门:基础概念解析
1. GPU和CUDA GPU,即图形处理器,是一种专门用于处理图像和视频的计算设备.GPU由许多小型处理器核心组成,可以同时处理许多简单的计算任务.与CPU不同,GPU具有数千个处理器核心,这使得它 ...
- Gradle入门之基础概念
Gradle是什么 Gradle是一款开源的自动化构建工具,可以灵活的构建任何类型软件(基本上),比如我们日常开发所熟知的: Java的产物(.JAR) Android Application的产物( ...
- 工作流入门(基础概念篇)
1. 工作流管理系统基本概念 近两年随着电子商务环境不断演进(例如阿里巴巴的B2B电子商务平台),从原来支持企业内部单系统的业务流程.到企业内部应用.服务的集成,再进一步向企业与合作伙伴之间业务交互 ...
- 音视频基础概念(5)——音频基础说明
现实生活中,音频(Audio)主要用在两大场景中,包括语音(Voice)和音乐(Music).语音主要用于沟通,如打电话等.目前由于语音识别技术的发展,人机语音交互也是语音的一个应用方向,很多大厂推出 ...
- 音视频开发入门基础知识(音频入门篇)
RTSP实时音视频开发实战课程:<RTSP实时音视频开发实战> 音视频开发入门基础知识(音频入门篇) 目录 前言 音频的采集和播放 音频常见的格式 音频的编码 前言 在音视频开发入门基础知 ...
- 机器学习入门 笔记(二) 机器学习基础概念
第二章 机器学习基础概念 1.机器的数据 2.机器学习的主要任务 3.监督学习和非监督学习 4.批量.在线学习.参数.非参数学习 5.哲学思考 6.环境的搭建 1.机器的数据 我们以鸢尾花的数据为例. ...
- NumPy 快速入门系列:应用统计学基础概念、相关统计指标与NumPy的实现
NumPy 快速入门系列:应用统计学基础概念.相关统计指标与NumPy的实现 前言: 统计学导论: 统计学定义: 统计学分类: 统计学基本概念: 统计过程: 统计指标与NumPy: 用 Python ...
- 【JAVA学习】1、零基础入门Java 基础语法:概念、规则、格式
[JAVA学习]1.零基础入门Java 基础语法 前言 JAVA开发环境选择 Java 基础概念 Java 标识符 Java修饰符 基础代码模板框架 命名规则 基础规则 后端开发规则 代码格式 前言 ...
最新文章
- 改变你的 KDE 桌面的外观和感觉方法介绍
- 云计算如何重塑和简化大规模IT资产
- html5如何让保存的信息立即显示出来,如何用HTML5存储用户输入的信息
- 春招实习前端面试题汇总
- HBase表创建、删除、清空
- java任务分支和合并_合并/分支战略
- 一步步编写操作系统 61 任务状态段 TSS
- Vmware上安装RedHat Linux 7.3操作系统手册
- 怎么让图片从左往右移动php,javascript - 想让图片上那个块,在增加块的宽度的时候向右边移动,而不是向左边移动。需要怎么解决?...
- VS-watch窗口
- 战争论 —— 蓝田之战
- 【系统结构】C++项目目录组织结构
- SqlServer存储过程基础
- 【电力电子技术AC-DC】单相桥式晶闸管整流电路(阻性/阻感性负载)simulink仿真
- 红外图分特点析及红外图像分割
- 点播系统加服务器加投影加音响,打造真实家庭影院 投影机+音响巧搭配
- 给自己一个不断学习的理由
- 低成本3X3拼接方案
- ubuntu打开摄像头测试
- IM群聊消息的已读未读功能在存储空间方面的实现思路探讨
热门文章
- 【我的创作纪念日—5周年】
- 首届幼教生态共融体系战略伙伴私享会在湖南省智慧教育装备展示体验中心举行
- Fiddler常用操作
- Java 制作 jar 包的基本流程
- Tracking Learning Detection (TLD)目标跟踪算法原理详解~PPT版
- 勒索攻击成美国梦魇?这份防范指南请收好
- 更改微软更新服务器地址,[WSUS]Windows更新服务器部署及使用
- 线上问题排查系列-org.apache.thrift.transport.TTransportException:java.net.SocketTimeoutExceptio
- qq头像接口网页引用
- excel表格xlsx解开权限密码,excel表格xlsx不能复制打印怎么办?