音频网络编码器: Wolfram 语言 12 的新功能

音频网络编码器

现在有各种音频专用的 NetEncoder 对象，可以将 Audio 对象与神经网络框架牢固地集成在一起。编码器是框架的关键部分，因为它们提供了一种将数据注入神经网络的简便方法。

检查根据鸟类录音计算的每个编码器的特征。

"Audio" 网络编码器只是返回重采样和缩混步骤之后的波形。

显示完整的 Wolfram 语言输入

"AudioSTFT" 网络编码器可计算输入信号分区上的傅里叶变换。此功能包含时间和频率信息。

显示完整的 Wolfram 语言输入

"AudioSpectrogram" 网络编码器可返回在输入信号的分区上计算的功率谱。

显示完整的 Wolfram 语言输入

"AudioMelSpectrogram" 网络编码器可返回已过滤的频谱图，使得频率区间呈现非线性的间隔以模仿人类的音高感知。

显示完整的 Wolfram 语言输入

"AudioMFCC" 网络编码器可对梅尔频谱图执行进一步的降维操作，同时保留信号中包含的大部分信息。

显示完整的 Wolfram 语言输入