砍掉十分之一的声音，为什么耳朵听不出？

👤 Karlheinz Brandenburg 📅 May 12, 2026 🕐 5 分钟 👁 0 views

1995年拨号上网时代，一首光盘歌曲高达50兆。卡尔海因茨如何利用人耳听觉盲区，将音频压缩至十分之一，最终催生了MP3格式？

五十兆的文件用拨号网传要几个小时。必须缩小体积，但音质不能丢。

硬砍数据只会毁掉音乐。我们删错了地方。

人耳会自动忽略大音量旁边的微弱声音。只删掉这些被掩蔽的频段就行。

体积缩到十分之一，听感却完全一样。互联网时代来了。

点击图片后可左右滑动查看漫画

如果(孩子.学习){ → 乐趣++ 排序(小鱼); 迷宫.通关()

儿童编程启蒙

让孩子爱上
编程与逻辑思维

算法闯关迷宫探险创意绘画游戏化学习

立即下载 App Store

免费下载

1995年，调制解调器还在刺耳地尖叫。但真正的拦路虎，其实就摆在卡尔海因茨·布兰登贝格的办公桌上。那时候，一首光盘音质的歌足足要占五十兆。拨号网络每秒只能挤过去几千字节，想在网上发首歌，简直像拿花园水管去推一辆大卡车。

卡尔海因茨一开始也没多想，直接上了最笨的办法：把音频文件里最不起眼的数据位砍掉，反正人耳应该听不出差别。结果呢？音箱里直接炸出一阵刺耳的金属杂音。数学公式算得挺漂亮，声音却彻底毁了。

问题不在数字，而在人耳。他干脆不盯那些干巴巴的波形图了，转头去研究人到底是怎么听声音的。他把完整的音轨输进程序，让软件去抓那些最响的音符。只要出现一个强音，程序就会自动画出一条阈值曲线，把藏在它声学阴影里的那些频率全扫掉。音源还是那么饱满，算法专挑人耳的生理盲区下手，文件体积瞬间缩水到原来的十分之一。他删掉的根本不是音乐，而是耳朵本来就会自动忽略的“静音”。

但这招得卡准一条数学红线。算法靠的是心理声学里的掩蔽效应：比如一个响亮的一千赫兹音调，能直接盖住附近低于特定分贝的其他频率。卡尔海因茨花了几个星期反复调这条曲线。他一遍遍试听，微调阈值，只删掉刚好能缩小文件、又不会破坏旋律的那部分数据。早期的版本听起来还是发虚。他继续收紧算法，重新跑一遍，眼看着文件越来越小，旋律却一点没走样。五十兆的庞然大物，最后稳稳缩成了4.8兆。

他点下播放键。干净的立体声瞬间灌满房间，跟原版光盘听起来一模一样。这一下彻底证明，只要把生理上多余的数据剥掉，听众在乎的听感一点都不会少。1995年，弗劳恩霍夫研究所正式对外发布了第一款公开的MP3编码软件，把这套第三层压缩格式定成了行业标准。卡尔海因茨往椅背上一靠，听着机器平稳运转的低鸣，没再说话。

砍掉十分之一的声音，为什么耳朵听不出？

更多故事