WolframのWebサイトのコンテンツとインタラクトしたりフォームを送信したりするためには，JavaScriptを有効にしてください．方法

Wolfram言語™

ニューラルネットを使って音声（スピーチ）を調べる

この例では，組込みのSpeechRecognize関数を使って音声を認識する．信号から文字リストへの音声転写にはWolfram Neural Net Repositoryからのニューラルネットも使われる．

合成された音声信号から始める．

音声オブジェクトに含まれる音声を認識する．

次に，訓練済みの音声認識ネットを入手する．

ニューラルネットを次の合成音声で評価する．このネットワークは音声録音から認識された文字のリストを返す．

文字を繋げて認識した音声の最初のバージョンを得る．

このネットワークは，一字が複数のフレームにまたがることも考慮して，CTC損失を使って入力からのフレームのリストを文字のリストにマッピングするように訓練されている．

CTCの復号化の直前にこのネットワークの出力を可視化して任意の時点におけるすべての文字の確率を得ることができる．下の軸は，各フレームに確率が最大の文字を割り当てた中間段階の復号化でラベルが付けられている．

関連する例

ニューラルネットを使って音声（スピーチ）を調べる

音声に含まれるキーワードを認識する

音声に対応する質問応答システムを構築する

ピッチを認識する

サウンドを識別する

動物の鳴き声を識別する

音声識別ネットを使って信号を調べる

音声認識機能を使って楽器を分類する

音声の特徴を自動的に抽出する

特定の特徴を抽出する

ニューラルネットを使って特徴を抽出する

音声特徴を使ってサウンドをクラスタ化する

音読される数字を分類する

音声データ集合を分類する

転移学習を使って音声データ集合を分類する

音事象の検出ネットを訓練する

音声のネットエンコーダ

ネットエンコーダのデータ拡張

効率的な音声エンコーダ

カスタムの音声エンコーダの構築