Wolfram 语言

用音频识别网络检查信号

可将 AudioIdentify 中使用的网络作为执行其他音频分析任务的强大工具。下面的例子对网络进行修改,获取作为时间分辨结果的概率随时间变化的情况。

Wolfram Neural Net Repository 导入网络。

Audio 对象应用网络。

AudioSet 数据集上训练网络,用录音中存在的声音类别和源对每个音频信号进行注释。

因此,输出中每个类的概率不是互斥的。

网络的核心采用固定大小的输入信号的梅尔频谱,并用 NetMapOperator映射到重叠的块上。

这是核心网络。

可在样例信号上运行该网络。

其结果是在每个块上计算的每个类的独立概率序列。由于要找出信号中存在的所有类,因此请使用最大值而不是平均值。

通过做一些网络外科手术,可以生成一个网络,输出每个块的类概率。

WebAudioSearch 收集一些乐器的声音并将它们放在一起。

可以定义一个函数,对网络运行的结果进行计算,查看整个序列中的 n 个最可能的类,并输出这些概率随时间变化的情况。

可视化波形,以及 10 个最可能的类的概率随时间演进的情况。

相关范例

de en es fr ja ko pt-br