Wolfram Language

Utilisez les réseaux de capsules

Les réseaux de capsules (CapsNet) sont une classe récente de réseaux neuronaux visant à fournir une alternative aux réseaux neuronaux convolutifs classiques dans le domaine de la vision par ordinateur. Les CapsNets ne sont pas encore utilisés dans des applications réelles, mais constituent un sujet de recherche prometteur. Cet exemple illustre le réseau de capsules original qui a été entraîné à la tâche de classification MNIST et explore les propriétés des vecteurs de capsules qu'il calcule.

Récupérez un modèle CapsNet pré-entraîné à partir de Wolfram Neural Net Repository.

Un capsNet n'est pas un pur classifieur, il est également un encodeur automatique et peut donc recréer ses données d'entrée.

Au lieu d'avoir des neurones scalaires contenant les résultats finaux pour chaque classe, un CapsNet produit des vecteurs de capsules, qui encodent le résultat dans leur norme. En plus du cas scalaire, les informations sur les caractéristiques de l'instance détectée sont encodées dans l'orientation des vecteurs de capsules, de la même manière que les vecteurs de caractéristiques. Extrayez le vecteur de capsules de longueur 16 avec la norme la plus élevée du bloc "Pick" du réseau.

Le bloc "Reconstruct" est entraîné à reconstruire l'image d'entrée à partir des informations contenues dans le vecteur de capsules, en agissant comme un régularisateur. Une reconstruction réussie prouve que les vecteurs de capsules encodent les caractéristiques de l'instance spécifique détectée dans leur orientation. Récupérez le reconstructeur.

Introduisez le vecteur de capsules précédemment obtenu dans le reconstructeur.

L'espace traversé par les vecteurs de capsules possède des caractéristiques qui rappellent les espaces latents des encodeurs automatiques classiques et variables. Essayez de changer le vecteur de capsules. Le changement du vecteur de capsules peut entraîner des variations de caractéristiques telles que l'épaisseur ou peut entièrement transformer l'instance en une autre classe.

Interpolez entre les vecteurs de capsules de différents chiffres.

Exemples connexes

de en es ja ko pt-br zh