Wolfram Language

L'avantage de la robustesse des mesures de position pour les distributions à queue lourde

Certaines distributions, comme Pareto ou Cauchy, ont la probabilité relativement élevée que des événements "rares" se produisent. Lorsque les données suivent une telle distribution à queue lourde, les mesures de position non robustes, comme la moyenne de l'échantillon, donnent de mauvais résultats. Dans de tels cas, des mesures robustes de la position, comme la médiane ou l'emplacement bipoids, sont plus appropriées.

Comparez le PDF de la distribution de Cauchy avec le PDF de la distribution NormalDistribution correspondante qui n'a pas de queues "grasses".

Montrer l'entrée complète de Wolfram Language

L'une des caractéristiques d'une distribution à queue "grasse" est que certains moments, par exemple la moyenne, peuvent ne pas être définis. Par conséquent, la moyenne de l'échantillon ne sera pas fiable.

Examinez la performance des mesures de position des données, simulées à partir d'une distribution de Cauchy.

Calculez la valeur centrale avec la position moyenne (non robuste), la position médiane (robuste) et la position bipoids (robuste).

Les statistiques robustes de la position sont "en moyenne" plus proches de la valeur centrale dans une distribution à queue lourde.

Montrer l'entrée complète de Wolfram Language

Pour les données distribuées normalement, la position bipoids est proche de la moyenne.

Exemples connexes

de en es ja ko pt-br zh