Wolfram言語

音声を識別する

新しいAudioIdentify関数は訓練されたニューラルネットを使って,音声信号から約600のサウンドカテゴリを識別する.音声識別を使うと,音声キャプションの作成,監視データのモニタ等を行うことができる.

ドラムの録音に対して識別を実行する.

識別を,オントロジーの特定カテゴリに限定する.

複数の識別をそれに関連付けられた確率とともに得ることもできる.

さまざまな音声を含む信号を作成する.

AudioBlockMapを使って,複数の1秒間の区間について識別を行う.

結果をプロットする.

関連する例

de en es fr ko pt-br zh