Wolfram 语言

音频网络编码器

现在有各种音频专用的 NetEncoder 对象,可以将 Audio 对象与神经网络框架牢固地集成在一起。编码器是框架的关键部分,因为它们提供了一种将数据注入神经网络的简便方法。

检查根据鸟类录音计算的每个编码器的特征。

"Audio" 网络编码器只是返回重采样和缩混步骤之后的波形。

显示完整的 Wolfram 语言输入

"AudioSTFT" 网络编码器可计算输入信号分区上的傅里叶变换。此功能包含时间和频率信息。

显示完整的 Wolfram 语言输入

"AudioSpectrogram" 网络编码器可返回在输入信号的分区上计算的功率谱。

显示完整的 Wolfram 语言输入

"AudioMelSpectrogram" 网络编码器可返回已过滤的频谱图,使得频率区间呈现非线性的间隔以模仿人类的音高感知。

显示完整的 Wolfram 语言输入

"AudioMFCC" 网络编码器可对梅尔频谱图执行进一步的降维操作,同时保留信号中包含的大部分信息。

显示完整的 Wolfram 语言输入

相关范例

de en es fr ja ko pt-br