WolframのWebサイトのコンテンツとインタラクトしたりフォームを送信したりするためには，JavaScriptを有効にしてください．方法

Wolfram言語™

音声データ集合を分類する

強力な音声分類子の作成は，すべての高レベル機械学習関数に存在する自動特徴抽出で簡単になった．この例は，Environmental Sound Classification (ESC-50)の標準的なデータ集合を自動的に分類する．

データ集合をダウンロードする．

完全なWolfram言語入力を表示する

メタデータをインポートする．データ集合は，2000本の環境音声録音のラベル付きのデータ集合である．各ファイルは5秒間の音声録音で，それらが50種類の意味クラスにまとめられている．

完全なWolfram言語入力を表示する

メタデータからのサンプルを調べる．

データ集合を訓練データと検証データに分ける．

Classifyを使ってClassifierFunctionを訓練データで訓練する．前処理，特徴抽出，分類アルゴリズムのすべてが，入力データに従って自動的に選択される．

検証データの正解率を計算し，混同行列をプロットする．明示的なユーザ入力がないにもかかわらず，分類の正解率は90%を超える．

関連する例

ニューラルネットを使って音声（スピーチ）を調べる

音声に含まれるキーワードを認識する

音声に対応する質問応答システムを構築する

ピッチを認識する

サウンドを識別する

動物の鳴き声を識別する

音声識別ネットを使って信号を調べる

音声認識機能を使って楽器を分類する

音声の特徴を自動的に抽出する

特定の特徴を抽出する

ニューラルネットを使って特徴を抽出する

音声特徴を使ってサウンドをクラスタ化する

音読される数字を分類する

音声データ集合を分類する

転移学習を使って音声データ集合を分類する

音事象の検出ネットを訓練する

音声のネットエンコーダ

ネットエンコーダのデータ拡張

効率的な音声エンコーダ

カスタムの音声エンコーダの構築