Utilisez DTW pour comparer des enregistrements
Importez, recoupez et prétraitez quatre enregistrements de la première phrase d'Alice aux pays des merveilles.
Afficher l'entrée complète de Wolfram Language
In[2]:=
alice = ConformAudio[
MapThread[
AudioNormalize[
AudioChannelMix[AudioTrim[AudioResample[Import[#1], 11025], #2],
1]] &, {urls, times}]]
Out[2]=
Affichez les tracés des signaux.
In[3]:=
AudioPlot[alice, ImageSize -> Medium]
Out[3]=
Calculez et tracez les caractéristiques de MFCC pour les échantillons.
In[4]:=
mfcc = AudioLocalMeasurements[#, "MFCC",
PartitionGranularity -> {.05, .01}]["Values"] & /@ alice;
In[5]:=
Column[MatrixPlot[#, PlotTheme -> "Minimal", ImageSize -> Medium] & /@
Transpose /@ mfcc]
Out[5]=
Calculez la distance de déformation de temps dynamique entre les enregistrements en utilisant WarpingDistance.
In[6]:=
DistanceMatrix[mfcc,
DistanceFunction -> WarpingDistance] // MatrixPlot
Out[6]=
Calculez la distance de déformation de temps dynamique entre deux des enregistrements en utilisant WarpingCorrespondence.
In[7]:=
{n, m} = WarpingCorrespondence[mfcc[[1]], mfcc[[2]]];
Afficher l'entrée complète de Wolfram Language
Out[8]=