识别音高
信号的音高对于诸如语音或乐器之类的信号是非常重要的描述符。现代机器学习技术一直在提高该操作的可靠性。
用 PitchRecognize 识别单声道信号的音高。
使用基于神经网络的方法。
还可以从 Wolfram Neural Net Repository 导入和使用 CREPE 音高识别神经网络。可用 HiddenMarkovProcess 将网络输出解释为估计频率序列及其置信度。
训练网络,按一组 360 个对数音高类别的概率分布预测音高的估计值。定义一个效用函数,在网络提供的类预测之间进行插值,并输出识别出的频率及其置信度。
显示完整的 Wolfram 语言输入
识别音高并计算相应的置信度。
绘制识别出的频率,并将置信度映射为颜色。