Wolfram Language

Codificadores de rede para áudio

Uma variedade de objetos NetEncoder específicos de áudio estão agora disponíveis para ajudar a integrar de forma sólida objeto de Audio com a estrutura de rede neural. Os codificadores são uma parte essencial da estrutura, pois oferecem uma maneira fácil de injetar dados em uma rede neural.

Inspecione os recursos de cada codificador computado em uma gravação de um pássaro.

O codificador de rede "Audio" simplesmente retorna a forma de onda após uma etapa de reamostragem e downmixing.

mostre o input completo da Wolfram Language

O codificador de rede "AudioSTFT" calcula a transformada de Fourier nas partições do sinal de entrada. Este recurso contém informações de hora e frequência.

mostre o input completo da Wolfram Language

O codificador de rede "AudioSpectrogram" retorna o espectro de potência calculado nas partições do sinal de entrada.

mostre o input completo da Wolfram Language

O codificador de rede "AudioMelSpectrogram" retorna um espectrograma que foi filtrado para que os intervalos de frequência sejam espaçados de maneira não-linear para imitar a percepção do tom em humanos.

mostre o input completo da Wolfram Language

O codificador de rede "AudioMFCC" realiza alguma redução de dimensionalidade adicional no espectrograma de mel, enquanto preserva a maioria das informações contidas no sinal.

mostre o input completo da Wolfram Language

Exemplos Relacionados

de en es fr ja ko zh