Wolfram言語

ニューラルネットを使って特徴を抽出する

AudioIdentifyで使われているネットワークは,サウンドの認識にも録音からの特徴抽出にも使うことができる.これを使うと,類似度と距離が計算できる意味的に重要な空間に任意の信号を埋め込むことができる.

Wolfram Neural Net RepositoryからAudioIdentifyで使われるネットワークを得る.

信号を固定サイズのチャンクに分け,このネットをそれぞれのチャンクのメルスペクトログラムに適用することによって,ネットワークのコアを抽出する.これにはNetExtractを使う.

分類タスクを担当する最後のいくつかの層を削除し,結果のネットワークをもとのNetChainに再挿入する.このネットは,各音声入力について,固定の大きさの意味的に重要なベクトルを生成する.

単独の音声録音についての特徴を可視化する.

このネットワークを特徴抽出器として使う.

リポジトリからの別の訓練済み特徴検出器を使う.

関連する例

de en es fr ko pt-br zh