高效的音频编码器: Wolfram 语言 12 的新功能

高效的音频编码器

为了使大规模训练变得切实可行，需要一种有效的方法将数据输入网络。音频 NetEncoder 提供了这种情况所需的高效、低等级功能。

可以使用 Wolfram Data Repository 中提供的数据集来测量编码器的效率。数据集相当小（它是 Google 语音命令数据集的子集），包含 10,000 个简短的训练样例。

选择一个样本。

音频编码器支持在线预处理操作，如归一化、重采样和修剪/填充。比较使用归一化的 "Audio" 编码器和调用 AudioNormalize 进行计算所花费的时间。

在整个数据集上比较 "AudioSpectrogram" 编码器和等效系统函数的计算用时。

显示完整的 Wolfram 语言输入

在一组核外 Audio 对象上比较 "AudioSpectrogram" 编码器和等效系统函数的计算用时。

显示完整的 Wolfram 语言输入

比较用顶级代码对核内 Audio 对象数据集进行编码与使用 NetEncoder 所花费的（作为数据集大小的函数）总时间。

比较用顶级代码对核外音频文件数据集进行编码与使用 NetEncoder 所花费的（作为数据集大小的函数）总时间。