1995年,调制解调器还在刺耳地尖叫。但真正的拦路虎,其实就摆在卡尔海因茨·布兰登贝格的办公桌上。那时候,一首光盘音质的歌足足要占五十兆。拨号网络每秒只能挤过去几千字节,想在网上发首歌,简直像拿花园水管去推一辆大卡车。

卡尔海因茨一开始也没多想,直接上了最笨的办法:把音频文件里最不起眼的数据位砍掉,反正人耳应该听不出差别。结果呢?音箱里直接炸出一阵刺耳的金属杂音。数学公式算得挺漂亮,声音却彻底毁了。

问题不在数字,而在人耳。他干脆不盯那些干巴巴的波形图了,转头去研究人到底是怎么听声音的。他把完整的音轨输进程序,让软件去抓那些最响的音符。只要出现一个强音,程序就会自动画出一条阈值曲线,把藏在它声学阴影里的那些频率全扫掉。音源还是那么饱满,算法专挑人耳的生理盲区下手,文件体积瞬间缩水到原来的十分之一。他删掉的根本不是音乐,而是耳朵本来就会自动忽略的“静音”。

但这招得卡准一条数学红线。算法靠的是心理声学里的掩蔽效应:比如一个响亮的一千赫兹音调,能直接盖住附近低于特定分贝的其他频率。卡尔海因茨花了几个星期反复调这条曲线。他一遍遍试听,微调阈值,只删掉刚好能缩小文件、又不会破坏旋律的那部分数据。早期的版本听起来还是发虚。他继续收紧算法,重新跑一遍,眼看着文件越来越小,旋律却一点没走样。五十兆的庞然大物,最后稳稳缩成了4.8兆。

他点下播放键。干净的立体声瞬间灌满房间,跟原版光盘听起来一模一样。这一下彻底证明,只要把生理上多余的数据剥掉,听众在乎的听感一点都不会少。1995年,弗劳恩霍夫研究所正式对外发布了第一款公开的MP3编码软件,把这套第三层压缩格式定成了行业标准。卡尔海因茨往椅背上一靠,听着机器平稳运转的低鸣,没再说话。