Wolfram 语言

识别音高

信号的音高对于诸如语音或乐器之类的信号是非常重要的描述符。现代机器学习技术一直在提高该操作的可靠性。

PitchRecognize 识别单声道信号的音高。

使用基于神经网络的方法。

还可以从 Wolfram Neural Net Repository 导入和使用 CREPE 音高识别神经网络。可用 HiddenMarkovProcess 将网络输出解释为估计频率序列及其置信度。

训练网络,按一组 360 个对数音高类别的概率分布预测音高的估计值。定义一个效用函数,在网络提供的类预测之间进行插值,并输出识别出的频率及其置信度。

显示完整的 Wolfram 语言输入

识别音高并计算相应的置信度。

绘制识别出的频率,并将置信度映射为颜色。

相关范例

de en es fr ja ko pt-br