Wolfram 语言

高效的音频编码器

为了使大规模训练变得切实可行,需要一种有效的方法将数据输入网络。音频 NetEncoder 提供了这种情况所需的高效、低等级功能。

可以使用 Wolfram Data Repository 中提供的数据集来测量编码器的效率。数据集相当小(它是 Google 语音命令数据集的子集),包含 10,000 个简短的训练样例。

选择一个样本。

音频编码器支持在线预处理操作,如归一化、重采样和修剪/填充。比较使用归一化的 "Audio" 编码器和调用 AudioNormalize 进行计算所花费的时间。

在整个数据集上比较 "AudioSpectrogram" 编码器和等效系统函数的计算用时。

显示完整的 Wolfram 语言输入

在一组核外 Audio 对象上比较 "AudioSpectrogram" 编码器和等效系统函数的计算用时。

显示完整的 Wolfram 语言输入

比较用顶级代码对核内 Audio 对象数据集进行编码与使用 NetEncoder 所花费的(作为数据集大小的函数)总时间。

比较用顶级代码对核外音频文件数据集进行编码与使用 NetEncoder 所花费的(作为数据集大小的函数)总时间。

相关范例

de en es fr ja pt-br