Wolfram Language

Codificadores de áudio eficientes

Para que o treinamento em larga escala seja prático, é necessário uma maneira eficiente de obter dados na rede. O NetEncoder de áudio oferece o recurso eficiente e de baixo nível necessário nesses casos.

Você pode usar um conjunto de dados disponível no Wolfram Data Repository para medir a eficiência dos codificadores. O conjunto de dados é muito pequeno (é um subconjunto do conjunto de dados Speech Commands do Google), contendo 10.000 exemplos de treinamento curtos.

Selecione um único exemplo.

Os codificadores de áudio suportam operações de pré-processamento on-line, como normalização, reamostragem e ajuste/preenchimento. Compare o tempo do codificador "Audio" usando a normalização para uma simples chamada para AudioNormalize.

Compare o tempo do codificador "AudioSpectrogram" e a função de sistema equivalente em todo o conjunto de dados.

mostre o input completo da Wolfram Language

Compare o tempo do codificador "AudioSpectrogram" e a função de sistema equivalente em uma coleção de objetos de Audio fora do núcleo.

mostre o input completo da Wolfram Language

Compare o tempo total gasto para codificar um conjunto de dados de objetos de Audio internos com código de nível superior e NetEncoder como uma função do tamanho do conjunto de dados.

Compare o tempo total gasto para codificar um conjunto de dados de arquivos de áudio fora do núcleo com código de nível superior e NetEncoder como uma função do tamanho do conjunto de dados.

Exemplos Relacionados

de en es fr ja zh