Ventaja de las medidas de ubicación robustas para distribuciones de cola pesada
Algunas distribuciones, como la distribución de Pareto o la de Cauchy, tienen una probabilidad relativamente alta de que ocurran eventos "raros". Cuando los datos siguen una distribución de cola tan pesada las medidas de ubicación no robustas, como por ejemplo una media de muestra, tienen un rendimiento deficiente. En tales casos, son más apropiadas las medidas robustas de ubicación, como la mediana o la ubicación comparada entre dos pesos.
Compare el PDF de la distribución de Cauchy con el PDF de la NormalDistribution correspondiente, la cual no tiene colas "gordas".
Una de las características de una distribución de cola "gorda" es que algunos momentos, por ejemplo la media, pueden no estar definidos. Como consecuencia, la media de muestra no será confiable.
Observe el rendimiento de las medidas de ubicación de los datos simulados de una distribución de Cauchy.
Calcule la ubicación central con la ubicación media (no robusta), mediana (robusta) y comparada entre dos pesos (robusta).
Las estadísticas robustas de ubicación soon más cercanas a la ubicación central de la distribución de cola pesada, "en promedio".
Para datos distribuidos de manera regular, la ubicación comparada entre dos pesos se acerca a la media.