Wolfram言語

ピッチを認識する

信号のピッチは,人の声や楽器にとって非常に重要な記述子である.最新の機械学習技術では,この操作の信頼性が絶えず改善されている.

PitchRecognizeを使ってモノラル信号のピッチを認識する.

ニューラルネットワークベースのメソッドを使う.

Wolfram Neural Net RepositoryのCREPEピッチ認識ニューラルネットをインポートして使うこともできる.ネットワークの出力を周波数推定の列およびその信頼度に変換するためにHiddenMarkovProcessを使うことができる.

このネットワークは,ピッチの推定値を360の対数ピッチクラスの集合の確率分布として予測するように訓練されている.ネットワークによって与えられたクラス予想の間を補間する効用関数と認識された周波数とその信頼度を出力する関数を定義することができる.

完全なWolfram言語入力を表示する

ピッチを認識し,対応する信頼度を計算する.

信頼度を色にマッピングして,認識された周波数をプロットする.

関連する例

de en es fr ko pt-br zh