为了进一步节省一些空间,MP3 文件使用了更多的技巧。音频工程师使用基于人耳和大脑心理声学效应的噪声整形算法来去除我们不应该听到的部分音乐。例如,大脑无法区分相邻的两个频率。此外,成年人的耳朵很难识别高频声音的方向。它在 16kHz 以上也开始失去灵敏度。另外,响亮的声音可以掩盖更安静的声音。所有这些都可以删除,最终听众几乎没有明显的区别。
基本上,MP3 文件会删除我们听不到的频率和我们可以单独听到的频率,但不能因为它们在特定歌曲中的组合方式。MP3 将轨道分成 576 个样本帧,并使用快速傅里叶变换 (FFT)从这些帧中获取频率数据。然后分析频率数据以查看是否存在任何机会来应用如上所述的基于人类听力的压缩规则。如果是这样,则将这些部分向下舍入(量化)以降低比特率,这有助于节省空间。有关如何将每个帧恢复为其完整声波表示的数据将保存到 32 位标头中。
比特率决定了每帧允许的最大文件大小。压缩越激进,算法就越有可能删除可听得见的东西。此外,这种类型的过滤和切割并不完美,量化可能会留下一些人可以听到的伪影。这种有损心理声学压缩之后是类似于 .zip 文件的无损Huffman 编码压缩,以节省更多空间。
如果这听起来太复杂,那么 MP3 文件会删除我们听不到的频率以及我们理论上可以单独听到的频率,但由于听觉掩蔽而不能在特定歌曲中听到。这可能会导致文件非常小。但是,如果它过于激进或比特率太低,质量可能会受到影响。因此,MP3 对于流媒体来说不再那么流行了。
AAC、m4a 和 OGG Vorbis 音频格式音频压缩可以采用多种形式,并且已经开发了其他格式。它们使用略有不同的算法和技术来完成任务,因此我们不能仅根据比特率来比较它们。
OGG Vorbis 是 MP3 的开源替代品。它仍然使用 FFT 和类似方法来分析和量化可屏蔽频率信息,但采用了不同的算法。Vorbis 还考虑了本底噪声以提高低比特率性能。Spotify以 320kbps 的速度使用这种格式。
还有 AAC,被Apple Music、Tidal、Pandora 和YouTube Music使用。它是 MPEG (MP3) 格式的演变,允许高达 96kHz 的更高采样率。此外,它可以在需要时在 1024/960 或 128/120 样本之间动态切换帧长度以获得更好的分辨率。与 MP3 相比,它在较小的文件大小下表现更好,以启动。
您可能会遇到的另一种文件类型是 M4A 文件。这些文件使用 AAC 格式编码,然后存储在 MPEG-4 容器中,因此文件扩展名为 .m4a。Apple 创建这种类型是对 MP3 的回应。虽然没有得到普遍支持,但无论如何都不少见。
由于这些原因,例如,您不能直接比较比特率并声称更高的比特率将是 AAC 和 MP3 之间听起来更好的文件。较低比特率的 AAC 和 M4A 文件在占用较少空间的同时听起来仍然不错。
这使得 OGG Vorbis 和 AAC 等格式对流媒体服务具有吸引力。它们可以提供更高质量的声音,同时消耗更少的移动数据。
FLAC