主流有损音频格式横评

  • 转载声明
  • 一、准备工作
    • 1.1 Adobe Audition CS6 设置
      • 1.1.1配置说明
      • 1.1.2频谱图简介
      • 1.1.3测试音频的频谱图对比
        • a. 原wav文件的频谱图。
        • b. 无损FLAC的图片
        • c. 无损FLAC的对比图片
    • 2. Beyond Compare设置
      • 2.1 容差说明
    • 3. 注意事项
  • 二、256K大混战
    • 2.1 频谱图对比
      • a. MP3 VBR V0
      • b. Ogg q8.2
      • c. Nero aac vbr 0.69
      • d. Nero aac vbr q0.74
      • e. Nero aac vbr q0.75
      • f. Qaac tvbr 110
      • g. Qaac cvbr 256
  • 三、320K间的对决
    • 3.1 频谱图对比
      • a. Faac q500
      • b. mp3 cbr 320
      • c. Ogg q9.0
      • d. Nero aac vbr 0.83
      • e. Qaac tvbr 127
      • f. Qaac cvbr 320
  • 四、猜测与验证
    • 4.1 谁才是AAC最强?
    • 4.2 验证我们的猜测
      • a. Nero aac vbr 1.00
      • b. Nero aac abr 512k
      • c. Nero aac abr 2-pass 512k
      • d. Nero aac cbr 512k
    • 4.3. 结论
    • 4.4 有损极限的对决
      • a. Ogg q10
      • b. Opus vbr 512
  • 五、总结

转载声明

By 咣輝のま裔http://blog.sina.com.cn/u/1669168344
转载请注明作者信息,谢谢。
(原文图片挂了,另外排版不好看,我给修改下,如有冒犯请联系删除!)

一、准备工作

无聊做下各种音频格式的测试,发上来给大家分享下,独家首创,不喜勿喷,谢谢。

这次用到的工具主要有Adobe Audition CS6和Beyond Compare
需要软件的请自行网上搜索

1.1 Adobe Audition CS6 设置

首先,打开Adobe Audition CS6

在首选项里把频谱频率显示的分辨率选到最高,也就是16384,这样做能使频谱变得精致,更精确的反映音频的素质。

接着 右键右边的频率栏

选择完全线性,然后再选择 更多对数 5次左右。

1.1.1配置说明

虽然如果选择完全对数显示比较夸张,但是频率间的差距都是用对数来比较的,而不是差值。100hz和500hz;20100hz和20500hz之间都只差400hz,一个差距很大,一个只是差了一点而已。
大家平常都用着完全线性这种显示来鉴别无损等等,确实高频部分比较直观,但是如果用这个来体现有损音频的品质,就极其的不合适了。(自行脑补声学和对数。。。)
Audition提供了21个级别,如果说完全对数的显示方式为level 0 ,完全线性的显示方式为level 20的话,Audition cs5.5 和cs6默认的显示方式为level 7,也就是更接近于对数。而Audition 3 的默认是完全线性的。
一般来说为了直观的表现音频的整体素质,推荐设置为level 10 到level 15之间,而不是绝对线性这种不合适的设定。

So,我在这里设为level 15,希望大家一定要注意,别跟我说我后面的频谱有问题哦!!!

说到这里大家肯定觉得我又要开始看频谱了。

我只想说看频谱什么的都弱爆了。你能看出什么差距来么?高频被砍了一刀,中频坑坑洼洼。某某某这么小的码率,居然频谱如此好看,真是太强了。看似不错就真的不错了么?

1.1.2频谱图简介

这是一个音频数据的直观视图。横轴时间,纵轴频率,还用颜色的明暗展现了振幅的大小(声音的大小)声音的要素都在这里了,频谱足以从视觉的角度完全的展现音频的素质。
但是肉眼凡胎,跟你听音乐一样,除了特别明显的地方,你又能看出多少差别。某些看似不错的频谱隐藏着许多你看不出的差别。

1.1.3测试音频的频谱图对比

废话不多说,这次测试用的无损音频是 杜雯媞和王艺翔唱的 “雪”
这首歌属于男女对唱,频谱比较丰满,直达22k,有低潮,有高潮,高潮部分波形图直达0db,比较适合用来有损格式的测试。

a. 原wav文件的频谱图。

b. 无损FLAC的图片

c. 无损FLAC的对比图片


图挂了?这黑压压的是什么?
这是WAV和FLAC频谱的对比图片,黑色表示没有差别

这图怎么来的?
首先用Adobe Audition 打开wav和flac文件,分别截取频谱图(用qq截得,能根据窗口截图,保证两次截图对齐),保存为无损格式(切记),比如bmp或者png。

2. Beyond Compare设置

接着要介绍我刚刚说的Beyond Compare。这是一个文件对比软件,能比较各种文件。自行搜索下载。
安装完以后,选择刚刚保存的wav和flac频谱的截图,右键比较即可。

打开后记得如下设置。

箭头处选上。

2.1 容差说明

表示允许的颜色差值最大值。最大255,即2的8次方减一,这涉及到位图的结构,我就不详细解释了。

总之,容差相当于你对声音大小的敏感程度。越低的码率,应该设置越大来便于观察。

为了保持一致性和可对比性,本文全部设为3。大家也可以设置成其他值观察对比。

3. 注意事项

最后提醒下各位,某些有损格式和wav在时间长度上有毫秒级的差别,这是为了对齐到某个时间长度照成的。这会使得频谱横轴不同,照成显示上的略微差别,虽然Audition CS6也可以打开各种有损格式,但我们还是应该自己手动转换回wav格式,这时时间长度会恢复。

好了FLAC打完酱油可以走了。。。

二、256K大混战

文件格式 大小 平均码率
MP3 VBR V0 6.85M 254 kbps
Ogg q8.2 6.96M 258 kbps
Nero aac vbr 0.69 6.93M 256 kbps
Qaac tvbr 110 6.72M 248 kbps
Qaac cvbr 256 7.01M 258 kbps

2.1 频谱图对比

接下来我要上各个有损格式的频谱跟原音频频谱的对比图片了,黑色表示基本没差,红色表示有差别,容差一律为3

a. MP3 VBR V0


点评:同码率对比,mp3格式在4K以下表现最为优秀,4K以上逐渐削弱,到了16K以上削弱加剧。整体听感略微发闷。

b. Ogg q8.2


点评:19K以后开始削弱,整体平衡,中规中矩,表现好于mp3

c. Nero aac vbr 0.69

点评:10K以下的表现让人眼前一亮,10K到18k表现良好,18K以后基本切掉。如果你的纵轴是完全线性的,那你可能不会觉得Nero aac有多优秀。但在我看来,恰恰得益于抛弃了18k以上,使其在人耳敏感的部分发挥出了最佳的水平,推荐格式

最后再插一句,觉得听不到18k以上的童鞋,推荐用vbr q0.74,其18k以下的水准能达到vbr q0.82左右的水平。
觉得自己能听的到18K以上,又想频谱好看,又想体积小,就用vbr q0.75吧。

d. Nero aac vbr q0.74

e. Nero aac vbr q0.75

f. Qaac tvbr 110

g. Qaac cvbr 256


点评:首先要澄清一点,相同参数下qaac = qtaacenc = iTunes AAC。直接比较ACC文件的2进制值,除了文件头部的信息不同外,音频部分的数据完全相同。

有些童鞋说苹果用的是qtaacenc,苹果用的是qaac,等等,我想你们不要本末倒置了,qaac和qtaacenc充其量只是一个命令行前端(a command line frontend),真正负责编码的是QuickTime。所以相同参数下编出的音频完全一样是毫无悬念的。

相信看过本文早先版本的同学,肯定知道我使用旧版QuickTime照成的尴尬,我就不说了。还是更新到最新比较好。

Qaac tvbr和Qaac cvbr的区别就体现在低潮的水平上。Qaac cvbr的低潮表现更好一点(红点更少),当然这是多用了10 kbps的码率换来的,两者高潮部分一个红点不差,真的是一个红点也不差。

Qaac 在256k的表现胜过同码率的mp3和ogg。至于跟Nero acc比哪个强,我想各位看官心里都有自己的想法。我只告诉你,用耳朵去听吧,哪怕是心理安慰也好。如果连耳朵都分辨不出来,又何必在意这些呢?

三、320K间的对决

文件格式 大小 平均码率
Faac q500 8.04M 297 kbps
mp3 cbr 320 8.62M 320 kbps
Ogg q9.0 8.54M 317 kbps
Nero aac vbr 0.83 8.62M 318 kbps
Qaac tvbr 127 8.48M 313 kbps
Qaac cvbr 320 8.79M 324 kbps

3.1 频谱图对比

a. Faac q500


点评:整体比较平庸,但细心观察你就会发现,1k以下水平明显变差,不过16k以上水平不错,结果就是,频谱肉眼看起来很好看。实际上1k以下明显比16k以上来得重要。
估计也就跟Qaac tvbr 110处于同一个档次,我实在是不敢恭维。

b. mp3 cbr 320


点评:4k以下的还原依旧无敌,16K以上明显衰减,20K以上被截断。可以看作v0的升级版,谁说v0跟320k没差的?顺便鄙视那些看着频谱说着256k apple aac秒杀320k mp3的童鞋。

就听感来说同一编码器编出来的音频都比较相似,因为它们对高中低频段的取舍是一样的,码率就差在还原的精度与闸值上。

c. Ogg q9.0


点评:依旧是中庸的表现,总体胜过前两者。ogg就是这样,比上不足,比下有余。

d. Nero aac vbr 0.83


点评:ogg相对于Faac 和mp3来说表现已经很不错了,但跟Nero aac一比就分出了高下。相当优秀有木有?10k以下总是如此抢眼,弄的他10k以上都有点尴尬,其实10k以上表现也是不错的,推荐格式。

e. Qaac tvbr 127

f. Qaac cvbr 320


点评:这,这完全就是ogg的升级版。。。可怜的ogg一直给apple acc欺负。跟Nero aac比谁比较强呢?我只能说风格不同,两者互有胜负,旗鼓相当,难分高下。总之一句话,Nero aac都被推荐了,这没有不被推荐的理由,请看官自行选择

四、猜测与验证

4.1 谁才是AAC最强?

文件格式 大小 平均码率
Nero aac vbr 1.00 10.7M 396 kbps
Nero aac abr 512k 11M 407 kbps
Nero aac abr 2-pass 512k 13.2M 489 kbps
Nero aac cbr 512k 13.8M 512 kbps

在开始对比频谱之前,先跟我做个实验。

随机选20首无损,分别转换为对应格式的整轨,接着用rar最好模式进行压缩

文件格式 大小 RAR文件大小
WAV 864MB 598MB
Nero aac vbr 1.00 246MB 246MB
Nero aac abr 512k 251MB 251MB
Nero aac abr 2-pass 512k 301MB 251MB
Nero aac cbr 512k 314MB 218MB

WAV文件可以被压缩,大家都知道,这不是重点。
vbr 1.00和abr 512k 压缩前后大小基本不变,它们的码率是实打实的。abr 2-pass 512k 压缩后和abr 512k体积相当,可以想象他们实际水平差不多。亮点来了,cbr 512k压缩后体积最小,都能赶上WAV到无损的压缩比了。其实这很容易想象,cbr本来就是为网络传播的兼容性考虑的,算法上自然受到码率限制。而nero 的cbr算法并没有让那些低潮部分表现得更好,而只是做了简单的无用数据填充,来达到统一码率的目的。

问题:谁才是最强?
猜测:显然从压缩后的体积上看abr 512k和abr 2-pass 512k的表现会差不多。由于vbr面向质量的算法,不受最低码率的限制,理论上能达到最佳的音质体积比,效果上应该跟abr 512k处于同一水平。至于cbr 512k,估计是最差的,那臃肿的体积看了就心痛。

4.2 验证我们的猜测

a. Nero aac vbr 1.00


点评:相当给力有木有,红点已经少到一种水平了,绝不是上面那些320k码率能够匹敌的。

b. Nero aac abr 512k


点评:虽然红点的位置有所不同,但你能看出哪个更强一点么?反正我是觉得没什么差距。

c. Nero aac abr 2-pass 512k


点评:点评同上,外加一句,这个增加的体积是在开玩笑么?

d. Nero aac cbr 512k


点评:cbr 512k终于害羞的露出了它的真面目,弱爆了有木有?这就是现实,体积大不一定就是最好的,有时候还可能是最差的。其实很多时候你的耳朵已经无法分辨谁强谁弱了,而你的心理因素起了决定性作用。

4.3. 结论

Nero aac vbr 1.00是当之无愧的aac综合实力最强,我可以信心十足的告诉你。
vbr笑道:cbr 512k那丫就是战5渣。
vbr众人附和道:cbr 512k什么的弱爆了。
cbr 512k党辩到:这一定是图形的载入方式不对。。。

4.4 有损极限的对决

文件格式 大小 平均码率
Ogg q10 12M 447 kbps
Opus vbr 512 12.9M 480 kbps

a. Ogg q10


点评:除了20k以上淡淡的一条线以外,整体都没什么红点了,称不上完美,但也不是那么好超越的。
是谁说的faac q500跟ogg q10体积差一倍的,水准却差不多来着?一个码率300 kbps左右,一个450 kbps左右好么。差距明显么?那还真明显,当然faac高频频谱党眼力有限,分辨率再提升10倍也许能够察觉到。

b. Opus vbr 512


点评:12k以下基本黑丫丫一片,我和我的小伙伴都惊呆了。12k到20k跟nero aac vbr q1.00的水平接近。20k以上人耳已经听不见,一律一刀切,这成了高频频谱党最大的遗憾,哈哈哈。

顺便说下,这是从opus 48KHz转回44.1KHz后的对比。因为opus会把音频转为48KHz,当然这并不会照成多少失真,从上面的对比图就可以看出来。

Opus是还在不断发展的格式,根据我的测试,各种码率下的综合表现与Nero aac vbr接近,当然除了那20k的一刀切。

五、总结

码率带来的音质的提升并不像你用肉眼从频谱中看到的那样,简单的弥补那些听不见的超声波,而是高中低全频段的整体提升带来的,这是一个量变到质变的过程。

最后,如果让我给你推荐一个音频有损编码方式的话,我推荐你用Nero AAC VBR或者Qaac tvbr,这也是本文得出的结论。超过400k码率我建议你直接听无损了吧(如果你把容差设为0的话,上面的对比图将惨不忍睹,当然这已经不是金耳朵的范畴了,这是神耳朵。对于神耳朵,只有无损能满足你)。

终于看完了,如果你觉得本文写的不错,看了之后有所收获,欢迎转载。

256K,320K及以上Nero AAC,QAAC,FAAC,MP3,OGG等主流有损音频格式横评相关推荐

  1. 教你怎么把aac转化为mp3

    教你怎么把aac转化为mp3~aac作为一种高级音频编码格式,问世时间可能比在座的各位小伙伴年纪都大,因为音质好,体积小,常用作录音文件的格式.但是aac的兼容性并不怎么好,在很多播放器上都无法正常播 ...

  2. aac是什么音频格式?aac转化为mp3方法

    aac是什么音频格式?AAC是一种高级音频编码的音频文件,发布于1997年,基于MPEG-2的音频编码技术,aac采用了全新的算法进行编码,更加高效.与mp3格式相比,aac也是属于有损压缩的音频格式 ...

  3. 如何将aac转化为mp3,4种常用方法

    aac是高级音频编码格式之一,支持多声道.解析度高,与mp3相比,aac格式的音质更佳,文件更小.在手机上录音时,保存下来的录音文件通常是AAC格式的.虽然aac格式有很多优点,但是,在不同的设备上, ...

  4. 学会这3个小招式,轻松实现aac在线转换mp3

    我们在传输或者接收文件的时候会发现,现在音频也具备着各式各样的格式,并且各有各的优缺点,就以aac格式来说,虽然它是一种较高级的音频编码格式,支持多种高低音轨,且兼容和比特率方面表现的不错,体积也比常 ...

  5. aac转化为mp3,aac转mp3方法

    aac转化为mp3,aac转mp3方法!aac是一种发布比较早的音频文件格式,aac基于MPEG-2的音频编码技术,aac音频的音质比mp3要好一些,而且文件的体积也相对较小.但是aac格式的音频在使 ...

  6. 音频格式DTS 和 AC3 和 AAC简单介绍及HDTV

    DTS:全称为Digital Theater Systems(数字影院系统),是一种有损多声道家庭影院音频格式,但它用了很高的码率进行编码,通常为768-1536kbps,能够营造出比AC3更好的影院 ...

  7. 【Android RTMP】音频数据采集编码 ( AAC 音频格式解析 | FLV 音频数据标签解析 | AAC 音频数据标签头 | 音频解码配置信息 )

    文章目录 安卓直播推流专栏博客总结 一. AAC 音频格式解析 二. FLV 音频数据标签解析 1. 分析 FLV 格式中的 AAC 音频格式数据 2. AAC 音频特殊配置 3. AAC 音频数据标 ...

  8. 多媒体音频格式解析WMA WAV OGG AAC APE FLAC

    无论是MP3还是MP4,甚至手机和多媒体DC,产品所支持的各种格式往往让人眼花缭乱.特别是对于刚上手的新手玩家来说,各种格式都有哪些特性,在实际 使用当中有多少格式实用或者必须,其实有很多方面需要我们 ...

  9. AAC音频格式分析与解码

    原文地址为: AAC音频格式分析与解码 一直在做一个语音项目,到了测试阶段,近来不是很忙,想把之前做的内容整理一下. 关于AAC音频格式基本情况,可参考维基百科http://en.wikipedia. ...

  10. 什么是AAC音频格式 AAC-LC 和 AAC-HE的区别是什么

    Advanced Audio Coding(高级音频解码),是一种由MPEG-4标准定义的有损音频压缩格式,由Fraunhofer发展,Dolby, Sony和AT&T是主要的贡献者. 在使用 ...

最新文章

  1. 为什么神经网络的激活函数必须使用线性函数?
  2. linux c 实现try catch异常捕获
  3. c++ 访问控制与封装
  4. RocketMQ事务消费和顺序消费详解
  5. js 多个定时器_Node.js系列深入浅出Node模块化开发——CommonJS规范
  6. oracle 12c 取消omf,Oracle12c创建及删除PDB
  7. JVM GC调优参数说明
  8. unity怪物攻击玩家减血_Unity RPG游戏攻击的判定
  9. 简明python教程 沈洁元_Python简明教程-沈洁元
  10. Java商店管理系统
  11. linux安装yum
  12. IntelliJ IDEA配置Groovy教程
  13. 动态SQL execute immediate
  14. Excel 批量增加行高,解决打印表格部分行显示不全的问题
  15. Centos下安装SSH、FTP服务
  16. 契约锁电子签助力拍卖业务网上签约,保全证据、不可抵赖,成交快
  17. phpmyadmin 修改记录(不断更新)
  18. BeanCopier使用说明
  19. 2019智慧树python答案大全_2020智慧树Python语言应用答案
  20. UI组件库的引用方式

热门文章

  1. python读txt写入excel_python实现读Excel写入.txt的方法
  2. 美丽世界的另一面!(请保护好你身边的亲朋好友)
  3. 下列计算机程序设计语言中不属于高级语言,下列计算机程序设计语言中不属于高级语言的是()?...
  4. 会计信息质量可靠性的案例_论会计信息质量特征及其可靠性
  5. XSS Filter Evasion Cheat Sheet 中文版
  6. 千帆竞发百日角逐,玻色量子荣获“创业北京”一等奖
  7. qqpcmgr_docpro文件的删除
  8. win10启动项_win10系统开机启动项的设置教程
  9. 为UBUNTU安装一个像千千静听一样的MP3播放器
  10. 【金融项目】尚融宝项目(七)