Wolfram 语言

用神经网络提取特征

AudioIdentify 中使用的网络不仅可用于识别声音,还可用于从录音中提取特征。因而可将任何信号嵌入到有语义意义的空间中,并在其中计算相似性和距离。

Wolfram Neural Net Repository 获取用于 AudioIdentify 的网络。

提取网络的核心功能:信号被分成固定大小的块,将该网络应用于每个块的梅尔频谱。用 NetExtract 完成此项任务。

删除负责分类任务的最后几层,然后将生成的网络重新插入到原来的 NetChain 中。该网络将为每个音频输入产生一个大小固定,语义上有意义的向量。

可视化一段录音的特征。

将网络作为特征提取器。

使用库中另一个预先训练过的特征提取器。

相关范例

de en es fr ja ko pt-br