Wolfram Language

Codificadores de red para audio

Una variedad de objetos específicos de audio NetEncoder ahora están disponibles para ayudar a integrar sólidamente el objeto Audio con el marco de redes neuronales. Los codificadores son parte clave del marco, dado que proporcionan una forma fácil de inyectar datos en la red neuronal.

Inspeccione los atributos desde cada codificador calculado en una grabación de un pájaro.

El codificador de red "Audio" simplemente regresa la forma de onda luego de remuestrear y mezclar de forma descendente.

muestre la entrada completa de Wolfram Language

El codificador de red "AudioSTFT" calcula la transformada de Fourier en particiones de la señal de audio. Este atributo contiene tanto información de tiempo como de frecuencia.

muestre la entrada completa de Wolfram Language

El codificador de red "AudioSpectrogram" regresa el espectro de poder calculado en particiones de la señal de entrada.

muestre la entrada completa de Wolfram Language

El codificador de red "AudioMelSpectrogram" regresa un espectrograma que ha sido filtrado con tal que los contenedores de frecuencia estén esparcidos de forma no lineal para imitar la percepción de tono en humanos.

muestre la entrada completa de Wolfram Language

El codificador de red "AudioMFCC" realiza algunas reducciones de dimensiones extras en el espectograma de mel, mientras preserva la mayoría de la información contenida en la señal.

muestre la entrada completa de Wolfram Language

Ejemplos relacionados

de en fr ja ko pt-br zh