Wolfram Language

Effiziente Audio-Encoder

Damit eine groß angelegte Schulung praktikabel ist, ist eine effiziente Art und Weise erforderlich, Daten in das Netzwerk zu bringen. Der Audio-NetEncoder bietet die effiziente, low-level Funktionalität, die in diesen Fällen erforderlich ist.

Sie können einen im Wolfram Data Repository verfügbaren Datensatz verwenden, um die Effizienz der Encoder zu messen. Der Datensatz ist ziemlich klein (er ist eine Teilmenge des Datensatzes Sprachbefehle von Google) und enthält 10.000 kurze Trainingsbeispiele.

Wählen Sie ein einzelnes Beispiel aus.

Die Audio-Encoder unterstützen Online-Vorverarbeitungsvorgänge wie Normalisierung, Resampling und Trimmen/Padding. Vergleichen Sie das Timing des "Audio"-Encoders mit der Normalisierung mit einem einfachen Aufruf von AudioNormalize.

Vergleichen Sie das Timing des Encoders "AudioSpectrogram" und der entsprechenden Systemfunktion in Verbindung mit dem gesamten Datensatz.

Den kompletten Wolfram Language-Input zeigen

Vergleichen Sie das Timing des Encoders "AudioSpectrogram" und der entsprechenden Systemfunktion auf einer Sammlung von nicht zum Kern gehörenden Audio-Objekten.

Den kompletten Wolfram Language-Input zeigen

Vergleichen Sie die Gesamtzeit, die benötigt wird, um einen Datensatz von In-core-Audio-Objekten mit Top-Level-Code und NetEncoder als Funktion der Größe des Datensatzes zu kodieren.

Vergleichen Sie die Gesamtzeit, die benötigt wird, um einen Datensatz von Out-of-Core-Audiodateien mit Top-Level-Code und NetEncoder als Funktion der Datensatzgröße zu kodieren.

Verwandte Beispiele

en es fr ja pt-br zh