Codificadores de red para audio
Una variedad de objetos específicos de audio NetEncoder ahora están disponibles para ayudar a integrar sólidamente el objeto Audio con el marco de redes neuronales. Los codificadores son parte clave del marco, dado que proporcionan una forma fácil de inyectar datos en la red neuronal.
Inspeccione los atributos desde cada codificador calculado en una grabación de un pájaro.
El codificador de red "Audio" simplemente regresa la forma de onda luego de remuestrear y mezclar de forma descendente.
El codificador de red "AudioSTFT" calcula la transformada de Fourier en particiones de la señal de audio. Este atributo contiene tanto información de tiempo como de frecuencia.
El codificador de red "AudioSpectrogram" regresa el espectro de poder calculado en particiones de la señal de entrada.
El codificador de red "AudioMelSpectrogram" regresa un espectrograma que ha sido filtrado con tal que los contenedores de frecuencia estén esparcidos de forma no lineal para imitar la percepción de tono en humanos.
El codificador de red "AudioMFCC" realiza algunas reducciones de dimensiones extras en el espectograma de mel, mientras preserva la mayoría de la información contenida en la señal.