Wolfram 언어

계산 음성

선형 예측 부호 (LPC) 기능을 사용한 음성 신호의 비교

두개의 레코딩을 가져와 전처리합니다.

In[1]:=
Click for copyable input
alice1 = AudioResample[ AudioTrim[ Import["http://ia800503.us.archive.org/3/items/alices_adventures/\ aliceinwonderland_01_carroll.mp3"], {27, 27 + 60}], 11025]
Out[1]=
In[2]:=
Click for copyable input
alice2 = AudioResample[ AudioTrim[ Import["http://ia800306.us.archive.org/25/items/alice_wonderland_\ 0711_librivox/alice_01_carroll.mp3"], {16.5, 16.5 + 60}], 11025]
Out[2]=

두 레코딩의 LPC 기능을 계산하고 이를 플롯합니다.

In[3]:=
Click for copyable input
{lpc1, lpc2} = AudioLocalMeasurements[#, "LPC", PartitionGranularity -> {.04, .01}]["Values"] & /@ {alice1, alice2};
In[4]:=
Click for copyable input
MatrixPlot[Transpose[lpc1], Frame -> True, FrameTicks -> {None, Automatic}, DataRange -> {{0, QuantityMagnitude[Duration@alice1, "s"]}, {1, 12}}, AspectRatio -> 1/8, ImageSize -> Medium]
Out[4]=
In[5]:=
Click for copyable input
MatrixPlot[Transpose[lpc2], Frame -> True, FrameTicks -> {None, Automatic}, DataRange -> {{0, QuantityMagnitude[Duration@alice1, "s"]}, {1, 12}}, AspectRatio -> 1/8, ImageSize -> Medium]
Out[5]=

계산된 기능에 대한 거리 행렬을 계산합니다.

In[6]:=
Click for copyable input
MatrixPlot[DistanceMatrix[lpc1, lpc2], DataRange -> {{0, QuantityMagnitude[Duration@alice1, "s"]}, {0, QuantityMagnitude[Duration@alice2, "s"]}}, ImageSize -> 300, FrameTicks -> {Automatic, Automatic}]
Out[6]=

관련 예제