如何评价 FFmpeg 之父发布音频压缩工具 TSAC?

FFmpeg 之父 Fabrice Bellard 发布全新音频压缩工具 TSAC ,可实现非常低的比特率。针对 44.1 kHz 的音频,立体声模式…
关注者
490
被浏览
297,500

41 个回答

前两天 FFmpeg 之父 Fabrice Bellard 刚发布,我就在第一时间试用了这个 TSAC 音频压缩工具,总体感觉是“非常牛逼”!官网如下,有几个音频试听的样本:

首先,这是一个有损音乐压缩工具。它还需要调用 CUDA,因此你的电脑需要配备强大的 nVidia 显卡。当然,纯 CPU 计算也不是不行,但是非常非常非常的慢,且 CPU 必须支持 AVX2 指令集。

顺便一提,官网下载的 Windows 版本有一点 BUG。因为,它输入格式要求 44.1 kHz 的 wav 音频,故默认会先调用 FFmpeg 进行转码,结果硬编码进 exe 的命令没空格,导致报错。因此,我们得手动先转 wav 格式,操作代码如下:

ffmpeg -i 输入文件 -ar 44100 -f wav 输出文件.wav

接着才能用 TSAC 来压缩,不加 --cuda 的话就是纯 CPU 计算,命令如下:

tsac --cuda c 输入文件.wav 输出文件.tsac

这里我测试了一首《沧元图》插曲“野草”,时长为 4:31 的 flac 无损歌曲体积 54.1 MB。最终压缩得到的 tsac 文件,只有 252 KB!

体积对比

但十分遗憾的是,当前还没有任何播放器支持播放 tsac 文件。所以呢,我们只能再用该工具转回 wav,再转 flac,来看看其音乐频谱的变化。

频谱对比

上为原文件,下为压缩后文件。我们可以看到,这是一个典型的有损压损,并且很像 mp3,高频部分被切了几刀。其牛逼的地方在于,虽然音质没啥明显提升,但是体积惊人的下降!

最后,个人觉得这个东西有点生不逢时,随着硬盘技术的大幅提升,大家对文件体积已经不那么敏感了。当然,TSAC 惊人的压缩率,可以节省巨大的带宽,用于流媒体传输或者以后 8K 电视普及,可能是一个很好的应用场景。如果作者能牺牲一些压缩率,换来无损支持,也是一个优秀的音乐格式选择呢。

这其实是neural compression的应用,原理基于neurlIPS2023的RVQGAN,由于用了比较复杂的Transformer对计算力有所需求,因此对于老设备不太友好,而且没啥好的低延迟解码工具,只能转回别的格式听,当然不是说这玩意没用,在微信语音或者短报文卫星通信之类应用这种技术挺好的。