如何评价 FFmpeg 之父发布音频压缩工具 TSAC?
41 个回答
前两天 FFmpeg 之父 Fabrice Bellard 刚发布,我就在第一时间试用了这个 TSAC 音频压缩工具,总体感觉是“非常牛逼”!官网如下,有几个音频试听的样本:
首先,这是一个有损音乐压缩工具。它还需要调用 CUDA,因此你的电脑需要配备强大的 nVidia 显卡。当然,纯 CPU 计算也不是不行,但是非常非常非常的慢,且 CPU 必须支持 AVX2 指令集。
顺便一提,官网下载的 Windows 版本有一点 BUG。因为,它输入格式要求 44.1 kHz 的 wav 音频,故默认会先调用 FFmpeg 进行转码,结果硬编码进 exe 的命令没空格,导致报错。因此,我们得手动先转 wav 格式,操作代码如下:
ffmpeg -i 输入文件 -ar 44100 -f wav 输出文件.wav
接着才能用 TSAC 来压缩,不加 --cuda 的话就是纯 CPU 计算,命令如下:
tsac --cuda c 输入文件.wav 输出文件.tsac
这里我测试了一首《沧元图》插曲“野草”,时长为 4:31 的 flac 无损歌曲体积 54.1 MB。最终压缩得到的 tsac 文件,只有 252 KB!
但十分遗憾的是,当前还没有任何播放器支持播放 tsac 文件。所以呢,我们只能再用该工具转回 wav,再转 flac,来看看其音乐频谱的变化。
上为原文件,下为压缩后文件。我们可以看到,这是一个典型的有损压损,并且很像 mp3,高频部分被切了几刀。其牛逼的地方在于,虽然音质没啥明显提升,但是体积惊人的下降!
最后,个人觉得这个东西有点生不逢时,随着硬盘技术的大幅提升,大家对文件体积已经不那么敏感了。当然,TSAC 惊人的压缩率,可以节省巨大的带宽,用于流媒体传输或者以后 8K 电视普及,可能是一个很好的应用场景。如果作者能牺牲一些压缩率,换来无损支持,也是一个优秀的音乐格式选择呢。
这其实是neural compression的应用,原理基于neurlIPS2023的RVQGAN,由于用了比较复杂的Transformer对计算力有所需求,因此对于老设备不太友好,而且没啥好的低延迟解码工具,只能转回别的格式听,当然不是说这玩意没用,在微信语音或者短报文卫星通信之类应用这种技术挺好的。