Wolfram Language

Merkmale mit einem KNN extrahieren

Das in AudioIdentifyverwendete Netzwerk kann nicht nur zum Erkennen von Geräuschen verwendet werden, sondern auch zum Extrahieren von Merkmalen aus einer Aufnahme. So kann jedes Signal in einen semantisch sinnvollen Raum eingebettet werden, in dem Ähnlichkeiten und Entfernungen berechnet werden können.

Rufen Sie das in AudioIdentify verwendete Netz aus dem Wolfram Neural Net Repository aus.

Extrahieren Sie den Kern des Netzwerks: Das Signal wird in Blöcke fester Größe unterteilt, und dieses Netz wird auf das Mel-Spektrogramm jedes dieser Blöcke angewendet. Dazu können Sie NetExtract verwenden.

Entfernen Sie die letzten Schichten, die für die Klassifikationsaufgabe zuständig sind, und fügen Sie das resultierende Netzwerk wieder in die ursprüngliche NetChain ein. Dieses Netz erzeugt für jeden Audioeingang einen Vektor mit fester Größe und semantischer Aussagekraft.

Visualisieren Sie die Funktionen für eine einzelne Audioaufnahme.

Verwenden Sie das Netzwerk als Merkmalsextraktor.

Verwenden Sie einen anderen vortrainierten Merkmalsextraktor aus dem Repository.

Verwandte Beispiele

en es fr ja ko pt-br zh