Empêchez automatiquement le surapprentissage
Le surapprentissage est l'incapacité d'un modèle à généraliser les données à l'extérieur de l'ensemble de l'apprentissage. Une façon d'éviter le surapprentissage consiste à surveiller la performance d'un modèle sur un jeu de données de validation et d'arrêter l'apprentissage si la performance de l'ensemble de validation cesse de s'améliorer. Cet exemple illustre comment l'option TrainingStoppingCriterion pour NetTrain vous permet de spécifier un critère permettant de déterminer si un réseau s'améliore ou pas, et d'éviter ainsi un surapprentissage.
Créez un réseau simple.
Entraînez le réseau sur le jeu de données Iris, en vous arrêtant si le résultat de la validation F1 ne s'améliore pas pendant plus de 100 tours.
Comparez cela à l'entraînement avec le même réseau sans arrêt précoce. Vous obtenez un résultat F1 similaire mais vous l'entraînez beaucoup plus longtemps. Remarquez que cet exemple n'est pas approprié pour l'ensemble d'apprentissage : le résultat F1 de la validation a diminué.