Wolfram Language

Töne erkennen

Die Tonhöhe eines Signals ist ein äußerst wichtiger Deskriptor für Signale wie Sprache oder Musikinstrumente. Moderne maschinelle Lerntechniken haben die Zuverlässigkeit dieser Operation kontinuierlich verbessert.

Erkennen Sie die Tonhöhe eines monophonen Signals mit PitchRecognize.

Verwenden Sie eine neuronale Netzwerk-Methode.

Sie können auch das neuronale Netz der CREPE-Tonhöhen-Erkennung aus dem Wolfram Neural Net Repository importieren und verwenden. Ein HiddenMarkovProcess kann verwendet werden, um die Ausgabe des Netzes in eine Sequenz von Frequenzschätzungen und deren Zuverlässigkeit zu interpretieren.

Das Netzwerk wurde trainiert, um eine Schätzung der Tonhöhe als Wahrscheinlichkeitsverteilung auf einem Satz von 360 logarithmischen Tonhöhen-Klassen vorherzusagen. Sie können eine Hilfsfunktion definieren, um zwischen den vom Netz bereitgestellten Klassenvorhersagen zu interpolieren, sowie eine Funktion, die die erkannte Frequenz und ihre Zuverlässigkeit ausgibt.

Den kompletten Wolfram Language-Input zeigen

Erkennen Sie die Tonhöhe und berechnen Sie die entsprechende Zuverlässigkeit.

Plotten Sie die erkannte Frequenz mit der Zuvelässigkeit, die der Farbe zugeordnet ist.

Verwandte Beispiele

en es fr ja ko pt-br zh