スペクトルの特徴に基づいた音声のクラスタリング: Wolfram言語 11の新機能

‹›

スペクトルの特徴に基づいた音声のクラスタリング

スペクトルの特徴を使って，音声オブジェクトのリスト内のクラスタを見付ける．

In[1]:=

a = ExampleData[{"Audio", "Drums"}, "Audio"]

Out[1]=

過渡信号が発声するところで録音音声を分割する．

In[2]:=

samples = 
  Select[AudioSplit[a, 
    FindPeaks[AudioLocalMeasurements[a, "Novelty"]]["Times"]], 
   Duration@# > Quantity[50, "ms"] &];
samples = Audio[#, Appearance -> "Minimal"] & /@ samples

Out[2]=

スペクトル中心およびスペクトル拡散によって定義された位置での結果のサンプルをプロットする．

In[3]:=

ListPlot[Partition[
  AudioMeasurements[#, {"SpectralCentroid", "SpectralSpread"}, 
     "List"] & /@ samples, 1], 
 PlotMarkers -> (Audio[#, Appearance -> "Minimal"] & /@ samples), 
 AxesLabel -> {Style["Centroid", Italic], Style["Spread", Italic]}, 
 ImageSize -> Medium]

Out[3]=

"SpectralCentroid"および"SpectralSpread"の測定値を使って，類似のサウンドを求める．

In[4]:=

FindClusters[
 AudioMeasurements[#, {"SpectralCentroid", "SpectralSpread"}, 
     "List"] & /@ samples -> samples]

Out[4]=

関連する例

メル周波数ケプストラム係数に基づく特徴から音声シグネチャを計算する

線形予測分析(LPC)に基づく特徴を使って音声信号を比較する

動的時間伸縮法(DTW)を使って録音音声を比較する

スペクトルの特徴に基づいた音声のクラスタリング