用音频识别网络检查信号: Wolfram 语言 12 的新功能

用音频识别网络检查信号

可将 AudioIdentify 中使用的网络作为执行其他音频分析任务的强大工具。下面的例子对网络进行修改，获取作为时间分辨结果的概率随时间变化的情况。

对 Audio 对象应用网络。

在 AudioSet 数据集上训练网络，用录音中存在的声音类别和源对每个音频信号进行注释。

因此，输出中每个类的概率不是互斥的。

网络的核心采用固定大小的输入信号的梅尔频谱，并用 NetMapOperator映射到重叠的块上。

这是核心网络。

可在样例信号上运行该网络。

其结果是在每个块上计算的每个类的独立概率序列。由于要找出信号中存在的所有类，因此请使用最大值而不是平均值。

通过做一些网络外科手术，可以生成一个网络，输出每个块的类概率。

用 WebAudioSearch 收集一些乐器的声音并将它们放在一起。

可以定义一个函数，对网络运行的结果进行计算，查看整个序列中的 n 个最可能的类，并输出这些概率随时间变化的情况。

可视化波形，以及 10 个最可能的类的概率随时间演进的情况。