【音视频】常见的音频处理算法
【音视频】常见的音频处理算法
- 响度控制
- 短时能量检测:将连续音频信号,按固定时间(如 10ms)分成一帧帧,计算短时能量。
- 自动增益控制(AGC)
- 动态范围处理(DRC)
- 等响曲线
- 限幅器(Limiter)
- 变速不变调
- WSOLA(Waveform Similarity Overlap-Add),波形相似叠加法,实现时间拉伸效果。在一定的范围内查找待『叠加』的音频帧,该音频帧要符合与原位置处音频帧『波形最相似』的条件,符合该条件的音频帧作为输出帧进行输出视频的合成。
- 变调不变速
- WSOLA + 重采样技术
- K 歌打分
- 用算法(比如 YIN)提取基频,跟原始频率比较。只能判断准不准,不能判断好不好听(音色相关,比较主观)。
- 自动混响
- 模拟反射。重复,延时,反射率。
- 均衡器
- 改变各频段的能量分布,听感上音色会有些变化。
- 智能美声
- 用原声音色数据替换变调后的音色数据,避免变调后的音色发生改变。
- 身份识别
- 训练一个模型(GE2E)提取与身份相关的音色特征数据。
- 声音克隆
- 无参考评价
【音视频】常见的音频处理算法相关推荐
- 【网络通信 -- 直播】音视频常见封装格式 -- MEPG2 TS
[网络通信 -- 直播]音视频常见封装格式 -- MEPG2 TS [1]相关码流基本概念 ES 流(Elementary Stream)基本码流,直接取自编码器的数据流,可以为音频(AAC 等).视 ...
- 音视频基础知识---音频编码格式
音视频基础知识汇总: 音视频基础知识---协议相关RTSP RTMP HLS 音视频基础知识---封装格式 音视频基础知识---视频编码格式 音视频基础知识---音频编码格式 音视频基础知识---像素 ...
- 音视频常见概念:软解硬解、IBP帧、GOP、YUV编码
音视频常见概念 软解与硬解 IBP帧 GOP YUV编码 RGB与YUV相互转换 参考资料 软解与硬解 视频解码分为软解和硬解. 所谓"软解"就是通过软件让 CPU 进行视频解码处 ...
- Android 音视频配音之音频提取、截断、混音、合并、合成(一)——从视频中提取音频文件
目录 前言 提取前提----了解提取需要用到的工具类:MediaExtractor.MediaCodec 1.MediaExtractor 2.MediaCodec 3.释放 具体提取转码代码 调用 ...
- Android 音视频配音之音频提取、截断、混音、合并、合成(二)——将提取的PCM根据时间戳截断
前言 通过上篇文章我们知道了如何从MP4视频中如何提取出PCM或者WAV,那么这篇文章则是如何截断PCM音频 该文章系列是视频配音,涉及到把背景音频从视频中提取出来.背景音频根据台词时间戳进行截断.截 ...
- moviepy音视频开发:音频剪辑基类AudioClip
☞ ░ 前往老猿Python博文目录 ░ 一.背景知识介绍 1.1.声音三要素: 音调:人耳对声音高低的感觉称为音调(也叫音频).音调主要与声波的频率有关.声波的频率高,则音调也高. 音量:也就是响度 ...
- Android音视频开发之音频录制和播放
Android音视频开发之音频录制和播放 1.封装音频录制工具类: public class RecorderAudioManagerUtils {private static volatile Re ...
- 音视频常见术语和接口收集
说明:这些内容都来网络,有可能存在错误.收集在此,为方便在工作中理解各种需求用. 取样率:模拟信号是连续的,而数字信号是断续的.所 以,模拟信号变成数字信号的第一步就要从连续的信号中,有间隔地一点点取 ...
- 【音视频开发】音频相关概念 - 总结
音频驱动 (音频相关概念) 音频驱动 音频驱动 (音频相关概念) 声音定义 声卡 声道 编解码 PCM(脉冲编码调制) 码率 音频压缩编码 有损压缩 无损压缩 无损压缩和有损压缩 有损压缩 无损压缩 ...
- 【ZEGO即构】音视频开发进阶 — 音频要素
"风声,雨声,读书声,声声入耳",关于声音,大家肯定都不陌生.作为最基础的信息载体之一,声音被用于社交沟通.唱歌娱乐,被用于人机语音交互.智能控制,在我们生活中的方方面面都在被感知 ...
最新文章
- Java集合知识:TreeMap
- arm ffmpeg报错:Invalid data found when processing input(没解决)(在ubuntu上能正常运行)(重新交叉编译后问题解决)
- win7右键在桌面上转圈圈的解决办法
- 2018 Multi-University Training Contest 9 杭电多校第九场 (有坑待补)
- 流式细胞术及常见问题分析
- 【网址收藏】Percona-xtraDB-cluster的安装、配置和使用 PXC
- 鼠标经过图片抖动效果
- 如何找到准确的终端连接端口?(转)
- Linux内核调试的方式以及工具集锦
- python美化输出模块_python日志处理模块
- 内存问题排查手段及相关文件介绍
- java 取余_JAVA面试解析(有赞)
- Tomcat学习总结(20)—— Tomcat启动脚本收藏
- 大数据之_数据采集Flume_架构---Flume工作笔记004
- 词汇表生成(C语言)
- [置顶] Responder一点也不神秘————iOS用户响应者链完全剖析
- 深度学习之GAN对抗神经网络
- java助教_2018-2019第一学期Java助教心得
- linux 64位 虚拟内存空间,Linux在x86-64下的虚拟内存布局
- c语言中判断c是否为小写字母,C语言判断英文字符大小写的方法