用神经网络提取特征
AudioIdentify 中使用的网络不仅可用于识别声音,还可用于从录音中提取特征。因而可将任何信号嵌入到有语义意义的空间中,并在其中计算相似性和距离。
从 Wolfram Neural Net Repository 获取用于 AudioIdentify 的网络。
提取网络的核心功能:信号被分成固定大小的块,将该网络应用于每个块的梅尔频谱。用 NetExtract 完成此项任务。
删除负责分类任务的最后几层,然后将生成的网络重新插入到原来的 NetChain 中。该网络将为每个音频输入产生一个大小固定,语义上有意义的向量。
可视化一段录音的特征。
将网络作为特征提取器。
使用库中另一个预先训练过的特征提取器。