Cuando la media es inútil - Medidas de ubicación robustas
Las distribuciones de cola pesada, como las distribuciones de Cauchy o Pareto, llevan una medida de probabilidad significativa (peso) en sus colas, lo que significa que los eventos que ocurren raramente tienen una probabilidad no despreciable. Tales distribuciones a menudo tienen algunos momentos indefinidos, por ejemplo, la media. Puede usar medidas robustas como la media truncada o la media winsorizada para estimar la ubicación central de la distribución.
Medidas robustas de ubicación y dispersión en la versión 12.
Examine un ejemplo de una distribución de cola pesada.
La media no está definida.
Esta es una distribución de cola pesada y la mayor parte del peso está en la cola. Calcule los cuartiles.
Calcule la media después de eliminar el 10% de la cola larga.
Esto equivale a truncar la distribución.
Calcule la media después de recortar el 10% de la cola larga.
Esto corresponde a la censura.
La diferencia entre descartar el 10% de los valores más grandes y recortarlos es significativa, lo que explica la "cola pesada" de esta distribución.