유성음과 무성음의 검출: Wolfram Language 11의 신기능

유성음과 무성음의 검출

무성음 부분을 감지하고 그것을 감쇠시킵니다.

In[1]:=

a = ExampleData[{"Audio", "NoisyTalk"}, "Audio"]

Out[1]=

AudioIntervals을 사용하여 RMS 진폭이 낮은 부분과 평탄도가 높은 부분을 찾습니다.

In[2]:=

nonVoicedIntervals = 
 AudioIntervals[
  a, #RMSAmplitude < .02 && #SpectralFlatness > .0001 &, .1, 
  PartitionGranularity -> {.06, .01}]

Out[2]=

검출된 구간을 시각화합니다.

In[3]:=

AudioPlot[a, 
 Epilog -> {RGBColor[1, 0, 0, .3], 
   Rectangle[{#[[1]], -1}, {#[[2]], 1}] & /@ nonVoicedIntervals}, 
 ImageSize -> Medium]

Out[3]=

검출된 부분을 감쇠시킵니다.

In[4]:=

AudioJoin[
 Riffle[AudioFade /@ AudioTrim[a, Except@nonVoicedIntervals], 
  0.3*AudioTrim[a, nonVoicedIntervals]]]

Out[4]=