WolframのWebサイトのコンテンツとインタラクトしたりフォームを送信したりするためには，JavaScriptを有効にしてください．方法

Wolfram言語™

音声のネットエンコーダ

音声特有のさまざまなNetEncoderオブジェクトが，Audioオブジェクトとニューラルネットフレームワークを確実に統合するために利用できるようになった．エンコーダは，データをニューラルネットに注入する簡単な方法を提供するので，このフレームワークの中心に位置する．

鳥の鳴き声の録音で計算された，各エンコーダからの特徴を調べる．

"Audio"ネットエンコーダは，リサンプリングとダウンミキシングのステップ後に波形を返すだけである．

完全なWolfram言語入力を表示する

"AudioSTFT"ネットエンコーダは入力信号の分割部分のフーリエ(Fourier)変換を計算する．この特徴には時間と周波数の両方の情報が含まれている．

完全なWolfram言語入力を表示する

"AudioSpectrogram"ネットエンコーダは，入力信号の分割部分について計算されたパワースペクトルを返す．

完全なWolfram言語入力を表示する

"AudioMelSpectrogram"ネットエンコーダは，人間のピッチ知覚を模倣するために周波数のビンが非線形間隔になるようなフィルタがかけられたスペクトログラムを返す．

完全なWolfram言語入力を表示する

"AudioMFCC"ネットエンコーダは，信号に含まれる情報のほとんどを保持しながら，メルスペクトログラムに対してさらに次元削減を行う．

完全なWolfram言語入力を表示する

関連する例

ニューラルネットを使って音声（スピーチ）を調べる

音声に含まれるキーワードを認識する

音声に対応する質問応答システムを構築する

ピッチを認識する

サウンドを識別する

動物の鳴き声を識別する

音声識別ネットを使って信号を調べる

音声認識機能を使って楽器を分類する

音声の特徴を自動的に抽出する

特定の特徴を抽出する

ニューラルネットを使って特徴を抽出する

音声特徴を使ってサウンドをクラスタ化する

音読される数字を分類する

音声データ集合を分類する

転移学習を使って音声データ集合を分類する

音事象の検出ネットを訓練する

音声のネットエンコーダ

ネットエンコーダのデータ拡張

効率的な音声エンコーダ

カスタムの音声エンコーダの構築