Wolfram Language

Codificadores de audio eficientes

Para que el entrenamiento a gran escala sea práctico, se requiere una forma eficiente de pasar datos a la red. El NetEncoder de audio proporciona la funcionalidad eficiente de bajo nivel que se requiere en dichos casos.

Usted puede usar un conjunto de datos disponible en el Repositorio de datos Wolfram para medir la eficiencia de los codificadores. El conjunto de datos es relativamente pequeño (es un subconjunto del conjunto de datos de comandos de voz de Google), que contiene 10 000 ejemplos cortos de entrenamiento.

Seleccione un solo ejemplo.

Los codificadores de audio dan soporte en línea a operaciones de preprocesamiento tales como normalización, remuestreo y recorte/relleno. Compare los tiempos del codificador "Audio" usando normalización para una simple llamada a AudioNormalize.

Compare los tiempos del codificador "AudioSpectrogram" y la función de sistema equivalente en todo el conjunto de datos.

muestre la entrada completa de Wolfram Language

Compare los tiempos del codificador "AudioSpectrogram" y la función de sistema equivalente en una colección de objetos de Audio fuera de núcleo.

muestre la entrada completa de Wolfram Language

Compare el tiempo total que toma codificar un conjunto de datos en objetos de Audio dentro del núcleo con código de alto nivel y NetEncoder como una función de tamaño del conjunto de datos.

Compare el tiempo total que toma codificar un conjunto de datos de archivos de audio fuera del núcleo con código de alto nivel y NetEncoder como una función de tamaño del conjunto de datos.

Ejemplos relacionados

de en fr ja ko pt-br zh