音声データ集合を分類する
強力な音声分類子の作成は,すべての高レベル機械学習関数に存在する自動特徴抽出で簡単になった.この例は,Environmental Sound Classification (ESC-50)の標準的なデータ集合を自動的に分類する.
データ集合をダウンロードする.
完全なWolfram言語入力を表示する
メタデータをインポートする.データ集合は,2000本の環境音声録音のラベル付きのデータ集合である.各ファイルは5秒間の音声録音で,それらが50種類の意味クラスにまとめられている.
完全なWolfram言語入力を表示する
メタデータからのサンプルを調べる.
データ集合を訓練データと検証データに分ける.
Classifyを使ってClassifierFunctionを訓練データで訓練する.前処理,特徴抽出,分類アルゴリズムのすべてが,入力データに従って自動的に選択される.
検証データの正解率を計算し,混同行列をプロットする.明示的なユーザ入力がないにもかかわらず,分類の正解率は90%を超える.