Codificadores de áudio eficientes
Para que o treinamento em larga escala seja prático, é necessário uma maneira eficiente de obter dados na rede. O NetEncoder de áudio oferece o recurso eficiente e de baixo nível necessário nesses casos.
Você pode usar um conjunto de dados disponível no Wolfram Data Repository para medir a eficiência dos codificadores. O conjunto de dados é muito pequeno (é um subconjunto do conjunto de dados Speech Commands do Google), contendo 10.000 exemplos de treinamento curtos.
Selecione um único exemplo.
Os codificadores de áudio suportam operações de pré-processamento on-line, como normalização, reamostragem e ajuste/preenchimento. Compare o tempo do codificador "Audio" usando a normalização para uma simples chamada para AudioNormalize.
Compare o tempo do codificador "AudioSpectrogram" e a função de sistema equivalente em todo o conjunto de dados.
Compare o tempo do codificador "AudioSpectrogram" e a função de sistema equivalente em uma coleção de objetos de Audio fora do núcleo.
Compare o tempo total gasto para codificar um conjunto de dados de objetos de Audio internos com código de nível superior e NetEncoder como uma função do tamanho do conjunto de dados.
Compare o tempo total gasto para codificar um conjunto de dados de arquivos de áudio fora do núcleo com código de nível superior e NetEncoder como uma função do tamanho do conjunto de dados.