音频网络编码器
现在有各种音频专用的 NetEncoder 对象,可以将 Audio 对象与神经网络框架牢固地集成在一起。编码器是框架的关键部分,因为它们提供了一种将数据注入神经网络的简便方法。
检查根据鸟类录音计算的每个编码器的特征。
"Audio" 网络编码器只是返回重采样和缩混步骤之后的波形。
显示完整的 Wolfram 语言输入
"AudioSTFT" 网络编码器可计算输入信号分区上的傅里叶变换。此功能包含时间和频率信息。
显示完整的 Wolfram 语言输入
"AudioSpectrogram" 网络编码器可返回在输入信号的分区上计算的功率谱。
显示完整的 Wolfram 语言输入
"AudioMelSpectrogram" 网络编码器可返回已过滤的频谱图,使得频率区间呈现非线性的间隔以模仿人类的音高感知。
显示完整的 Wolfram 语言输入
"AudioMFCC" 网络编码器可对梅尔频谱图执行进一步的降维操作,同时保留信号中包含的大部分信息。
显示完整的 Wolfram 语言输入