【音视频】常见的音频处理算法

  • 响度控制

    • 短时能量检测:将连续音频信号,按固定时间(如 10ms)分成一帧帧,计算短时能量。
    • 自动增益控制(AGC)
    • 动态范围处理(DRC)
    • 等响曲线
    • 限幅器(Limiter)
  • 变速不变调
    • WSOLA(Waveform Similarity Overlap-Add),波形相似叠加法,实现时间拉伸效果。在一定的范围内查找待『叠加』的音频帧,该音频帧要符合与原位置处音频帧『波形最相似』的条件,符合该条件的音频帧作为输出帧进行输出视频的合成。
  • 变调不变速
    • WSOLA + 重采样技术
  • K 歌打分
    • 用算法(比如 YIN)提取基频,跟原始频率比较。只能判断准不准,不能判断好不好听(音色相关,比较主观)。
  • 自动混响
    • 模拟反射。重复,延时,反射率。
  • 均衡器
    • 改变各频段的能量分布,听感上音色会有些变化。
  • 智能美声
    • 用原声音色数据替换变调后的音色数据,避免变调后的音色发生改变。
  • 身份识别
    • 训练一个模型(GE2E)提取与身份相关的音色特征数据。
  • 声音克隆
  • 无参考评价

【音视频】常见的音频处理算法相关推荐

  1. 【网络通信 -- 直播】音视频常见封装格式 -- MEPG2 TS

    [网络通信 -- 直播]音视频常见封装格式 -- MEPG2 TS [1]相关码流基本概念 ES 流(Elementary Stream)基本码流,直接取自编码器的数据流,可以为音频(AAC 等).视 ...

  2. 音视频基础知识---音频编码格式

    音视频基础知识汇总: 音视频基础知识---协议相关RTSP RTMP HLS 音视频基础知识---封装格式 音视频基础知识---视频编码格式 音视频基础知识---音频编码格式 音视频基础知识---像素 ...

  3. 音视频常见概念:软解硬解、IBP帧、GOP、YUV编码

    音视频常见概念 软解与硬解 IBP帧 GOP YUV编码 RGB与YUV相互转换 参考资料 软解与硬解 视频解码分为软解和硬解. 所谓"软解"就是通过软件让 CPU 进行视频解码处 ...

  4. Android 音视频配音之音频提取、截断、混音、合并、合成(一)——从视频中提取音频文件

    目录 前言 提取前提----了解提取需要用到的工具类:MediaExtractor.MediaCodec 1.MediaExtractor 2.MediaCodec 3.释放 具体提取转码代码 调用 ...

  5. Android 音视频配音之音频提取、截断、混音、合并、合成(二)——将提取的PCM根据时间戳截断

    前言 通过上篇文章我们知道了如何从MP4视频中如何提取出PCM或者WAV,那么这篇文章则是如何截断PCM音频 该文章系列是视频配音,涉及到把背景音频从视频中提取出来.背景音频根据台词时间戳进行截断.截 ...

  6. moviepy音视频开发:音频剪辑基类AudioClip

    ☞ ░ 前往老猿Python博文目录 ░ 一.背景知识介绍 1.1.声音三要素: 音调:人耳对声音高低的感觉称为音调(也叫音频).音调主要与声波的频率有关.声波的频率高,则音调也高. 音量:也就是响度 ...

  7. Android音视频开发之音频录制和播放

    Android音视频开发之音频录制和播放 1.封装音频录制工具类: public class RecorderAudioManagerUtils {private static volatile Re ...

  8. 音视频常见术语和接口收集

    说明:这些内容都来网络,有可能存在错误.收集在此,为方便在工作中理解各种需求用. 取样率:模拟信号是连续的,而数字信号是断续的.所 以,模拟信号变成数字信号的第一步就要从连续的信号中,有间隔地一点点取 ...

  9. 【音视频开发】音频相关概念 - 总结

    音频驱动 (音频相关概念) 音频驱动 音频驱动 (音频相关概念) 声音定义 声卡 声道 编解码 PCM(脉冲编码调制) 码率 音频压缩编码 有损压缩 无损压缩 无损压缩和有损压缩 有损压缩 无损压缩 ...

  10. 【ZEGO即构】音视频开发进阶 — 音频要素

    "风声,雨声,读书声,声声入耳",关于声音,大家肯定都不陌生.作为最基础的信息载体之一,声音被用于社交沟通.唱歌娱乐,被用于人机语音交互.智能控制,在我们生活中的方方面面都在被感知 ...

最新文章

  1. Java集合知识:TreeMap
  2. arm ffmpeg报错:Invalid data found when processing input(没解决)(在ubuntu上能正常运行)(重新交叉编译后问题解决)
  3. win7右键在桌面上转圈圈的解决办法
  4. 2018 Multi-University Training Contest 9 杭电多校第九场 (有坑待补)
  5. 流式细胞术及常见问题分析
  6. 【网址收藏】Percona-xtraDB-cluster的安装、配置和使用 PXC
  7. 鼠标经过图片抖动效果
  8. 如何找到准确的终端连接端口?(转)
  9. Linux内核调试的方式以及工具集锦
  10. python美化输出模块_python日志处理模块
  11. 内存问题排查手段及相关文件介绍
  12. java 取余_JAVA面试解析(有赞)
  13. Tomcat学习总结(20)—— Tomcat启动脚本收藏
  14. 大数据之_数据采集Flume_架构---Flume工作笔记004
  15. 词汇表生成(C语言)
  16. [置顶] Responder一点也不神秘————iOS用户响应者链完全剖析
  17. 深度学习之GAN对抗神经网络
  18. java助教_2018-2019第一学期Java助教心得
  19. linux 64位 虚拟内存空间,Linux在x86-64下的虚拟内存布局
  20. c语言中判断c是否为小写字母,C语言判断英文字符大小写的方法

热门文章

  1. 智能制造数据分析综合应用方案
  2. 触动精灵 PLIST 文件读取 详解
  3. Java语言,从入门到放弃
  4. Java获取图像Exif信息
  5. 身份证号码检验 js
  6. oracle 中的.dbf,郑怡:请问各位大师:oracle中dbf文件是什么文件?
  7. 英语语法笔记--定语从句及同位语从句
  8. 通过bootstrap4框架制作商城网页
  9. 崂山道士、Harry Potter和人脸识别
  10. 英国essay与澳洲essay写作区别以及注意事项