Des encodeurs audio efficaces
Pour que l'entraînement à large échelle soit pratique, il est nécessaire de disposer d'un moyen efficace pour acheminer les données dans le réseau. NetEncoder audio fournit la fonctionnalité efficace et de bas niveau qui est requise dans ces cas.
Vous pouvez utiliser un jeu de données disponible dans Wolfram Data Repository pour mesurer l'efficacité des encodeurs. Le jeu de données est relativement petit (il s'agit d'un sous-ensemble du jeu de données des commandes vocales de Google) et contient 10 000 exemples d'entraînement courts.
Sélectionnez un seul exemple.
Les encodeurs audio prennent en charge les opérations de prétraitement en ligne telles que la normalisation, le ré-échantillonnage, le rognage et le remplissage. Comparez le chronométrage de l'encodeur "Audio" en utilisant la normalisation avec un simple appel à AudioNormalize.
Comparez la synchronisation de l'encodeur "AudioSpectrogram" et la fonction système équivalente sur l'ensemble du jeu de données.
Comparez la synchronisation de l'encodeur "AudioSpectrogram" et de la fonction système équivalente sur une collection d'objets Audio qui ne sont pas dans le cœur.
Comparez le temps total nécessaire pour encoder un jeu de données d'objets Audio se trouvant dans le cœur avec le code de niveau supérieur et NetEncoder comme une fonction de la taille des jeux de données.
Comparez le temps total d'encodage d'un jeu de données de fichiers audio se trouvant à l'extérieur du cœur avec le code de niveau supérieur et NetEncoder comme une fonction de la taille des jeux de données.