Robustesse des mesures de position pour les données à queue lourde
Les données sur le revenu peuvent être modélisées à l'aide de distributions à queue lourde qui comportent une mesure significative de la probabilité (poids) dans leur queue. Pour de telles données, la moyenne de l'échantillon n'est pas une mesure représentative du revenu d'une personne moyenne.
Comparez la performance de la moyenne de l'échantillon et certaines mesures robustes de la position à l'aide des données américaines sur le revenu provenant d'une enquête de recensement.
La moyenne n'est pas une mesure représentative du revenu typique.
La médiane donne le revenu de la personne se situant au milieu de la distribution des revenus.
Le fait de supprimer les 5 % des salariés les mieux rémunérés donne une meilleure image de la vie d'une personne moyenne.
Au lieu de supprimer des données, l'échantillon peut être censuré.
Estimez le revenu d'une personne moyenne qui se situe dans la moitié inférieure de la distribution des revenus.
Affichez les moyennes à l'aide de l'histogramme des revenus.