高效的音频编码器
为了使大规模训练变得切实可行,需要一种有效的方法将数据输入网络。音频 NetEncoder 提供了这种情况所需的高效、低等级功能。
可以使用 Wolfram Data Repository 中提供的数据集来测量编码器的效率。数据集相当小(它是 Google 语音命令数据集的子集),包含 10,000 个简短的训练样例。
选择一个样本。
音频编码器支持在线预处理操作,如归一化、重采样和修剪/填充。比较使用归一化的 "Audio" 编码器和调用 AudioNormalize 进行计算所花费的时间。
在整个数据集上比较 "AudioSpectrogram" 编码器和等效系统函数的计算用时。
显示完整的 Wolfram 语言输入
在一组核外 Audio 对象上比较 "AudioSpectrogram" 编码器和等效系统函数的计算用时。
显示完整的 Wolfram 语言输入
比较用顶级代码对核内 Audio 对象数据集进行编码与使用 NetEncoder 所花费的(作为数据集大小的函数)总时间。
比较用顶级代码对核外音频文件数据集进行编码与使用 NetEncoder 所花费的(作为数据集大小的函数)总时间。