你真能听出音乐音质的区别?简论音频压缩的原理

当你听音乐的时候,大多数时候实际被播放的格式是MP3或AAC格式。
这两种格式都是音频被处理和压缩后得到的更小的格式。为了减少大小节约空间,相比于原始的音频,它们实际移除了一部分声音信号。但你能听出来吗?
在这篇文章中,我们将介绍音乐压缩的原理,并讨论一个问题:音乐压缩真的会影响你听到的音乐吗?
音乐压缩的原理
我们日常接收到的大多数字音频,不管是在线播放的还是存储为文件的,都采用了有损压缩的原理。有损压缩不仅会压缩数据,还会对原始数据进行删减,进行有损压缩后,有些数据就永远消失了。
但要知道,这些被删减数据不是被随机剔除的。音频压缩格式应用了心理声学,移除的是那些超出我们听觉范围之外以至于我们意识不到它存在的声音。

人类的耳朵听觉范围大约是20Hz到20kHz,超过这个范围的声音信号即便被移除,我们也无法察觉到。而随着我们年龄的衰老,听觉范围会逐渐缩小。因此可以说,每个人实际听到的声音都不是绝对相同的,即便它们来自相同的声源。
下面的音频可以帮助你找到自己的听力范围,你可以戴上耳机听一听,看你能听到多大范围的声音信号。在听的过程中注意随时控制音量,否则可能会损害你的听力。
另外,当高频声音和中低频声音同时存在的时候,高频声音会更难被听清楚。举例来说,音乐中持续的鼓声,可能会让你忽略旋律之间略微的差别。
这种现象被称为“遮蔽”,它被应用在了压缩原理中。如果存在更响的低频声音,它就可以掩盖掉高频声音的音质损失。这里的高低是相对的,因此这个原理可以全局应用。但15kHz以上的声音更容易受到遮蔽的影响,因此它也是主要的压缩对象。
尽管很显然,有损压缩移除的声音信号应该大多都是无用数据,但是仍然有人相信,被移除的这些“环境声音”会影响声音的立体性,让声音变得扁平。
总的来说,有损压缩的关键,是在降低大小和保障音质之间找到平衡。
何谓比特率
文件的尺寸是由市场和比特率决定的。很多人认为比特率和质量是一一对应的,但事实并非这么简单。比特率可以告知你音频的压缩等级,让你对音频的压缩有一个整体性的概念,但最终质量却是受到多方面影响的。

- 不同的编码方式有不同的的效率,因此两个不同格式的音频文件即便有相同的比特率,在质量上也是不同的。
- 即便是相同的文件格式,也可能有不同的编码方式。不同编码器的效果不同,即便比特率是一样的,得到的质量也可能不一样。通常来说,速度越快的编码器,得到的质量就相对越低。
- 被压缩的是怎样的音频,也是很重要的因素。比如,人声的频率范围大约在85Hz到300Hz之间,纯人声相对频率范围更大的管弦乐,能在相同比特率下压缩更多的细节。
比特率的单位是千比特每秒(kbps),CD音频的比特率是1411kbps,这意味着歌曲的每秒钟会容纳1,411,000比特的内容。MP3文件通常使用320kbps,这大概是原始音频信号的40%左右,也就是会带来60%的损耗。而当MP3文件使用128kbps的比特率时,损耗将达到90%。
音频设备的影响
我们能听到什么声音,并不仅在于我们的耳朵如何,我们用于产生或播放声音的设备也起到了非常关键的作用。
在有些情况下,使用便宜的耳机播放无损的音乐,比使用较好的耳机播放有损的音乐音质还要差。不好的音频硬件会让任何东西的音质变差,不论是耳机、音箱、麦克风还是声卡。
音频设备还会影响各频率的声音被渲染的结果。有些昂贵的耳机,可能会加强对某些声音的渲染,比如让低音的贝司变得更加清楚。
那些最高级别的耳机则可以渲染所有音频信号包含的声音,使用这类耳机,你会更容易听出有损压缩和无损压缩音频的区别。
MP3,Ogg Voribs和AAC
MP3是最常见的数字音乐格式,包括Amazon MP3和Google Play在内的音频服务都使用MP3格式。世界上大多数可播放音频的电子设备、APP甚至云存储服务都有播放MP3音乐的能力。
Ogg Vorbis是作为MP3的开源版本被开发的,Spotify就使用这种格式。Spotify把音质分为了3档:用于移动端的普通(Normal)品质,使用96kbps存储;用于桌面端的标准(Standard)品质,使用160kbps存储,在移动端相同的品质被称为高(High)品质;用于桌面端的高(High)音质和或用于高品质设备的超高(Extreme)品质,使用320kbps存储。

AAC被苹果公司用于iTunes,因而更加广为人知,现在包括Apple Music在内的苹果音乐流媒体服务都使用ACC格式。其他比较知名的音乐平台,包括Tidal、Deezer和Pandora都使用AAC格式。在Apple Music中,提供的AAC文件为256kbps,而在上述其他平台中,最高品质的版本为320kbps。
这三种格式采用的是相同的原则,即有损压缩,但它们舍弃的部分是不同的。因此,你不应尝试在不同的有损压缩格式间进行转换,这只会让品质变得更糟。
在这三种格式里,MP3格式是出现最早的,因此尽管它是现在数字音乐的主流格式,但它同时也是效率最低的。
导致MP3低效的原因有很多。比如Ogg Vorbis和ACC使用的都是平均比特率,而MP3是使用的则是常数比特率。这一特性让前两者的比特率是“可分配”的,也就更有利于压缩特定区块,获得更小的质量。
320kbps可以认为是行业标准,许多人把320kbps称为CD品质。在320kbps下,你无法分辨320kbps和无损压缩的区别。
无损压缩
并非所有的压缩方式都会造成损失。FLAC就是一种无损压缩格式,在Tidal上可以花费特殊点数下载;另一种有名的无损压缩格式是ALAC,即Apple Lossless。无损压缩格式可以和WAV格式提供相同的声音品质,且占用空间更小(但它仍然要占用相对于有损压缩格式两倍以上的空间)。
这种格式和ZIP文件的原理相似,它通过对文件中重复的冗余部分进行字典化,可以实现多达50%的压缩率。但同时,在读取和播放的时候它也依赖于解码。
你能否听出区别?
不论你常用的是哪一种有损压缩格式,关键问题在于你是否能区分不同比特率版本之间的区别?又或者,你是否能分辨有损压缩和无损压缩的音质区别?
诚然在128kbps的压缩率下,音质的差别是比较容易被分辨出的。但是在更高的192kbps甚至300kbps下,分辨它们就比较困难,你需要更好的耳机或扬声器。

是否能听出区别是因人、因设备而异的,但你可以测试一下。在mp3ornot.com上,你可以比较128kbps和320kpbs的MP3文件之间的区别。在Tidal上,你可以测试无损压缩音频和有损压缩音频间的区别(你可以用这个功能看看你的音频设备是否合格)。
当然,如果你能搞到一首歌的多个版本,也可以用自己喜欢的方式比较。