Vantagem de medidas de localização robustas para distribuições de cauda pesada
Algumas distribuições, como de Pareto ou Cauchy, têm uma probabilidade relativamente alta de ocorrência de eventos "raros". Quando os dados seguem essa distribuição de cauda pesada, as medidas não robustas de localização, como a média da amostra, têm um desempenho ruim. Nesses casos, medidas robustas de localização, como a mediana ou a posição de peso duplo, são mais apropriadas.
Compare o PDF da distribuição de Cauchy com o PDF da NormalDistribution correspondente, que não tem caudas "gordas".
Uma das características de uma distribuição de cauda "gorda" é que alguns momentos, por exemplo médio, não podem ser definidos. Como conseqüência, a média da amostra não será confiável.
Veja o desempenho das medidas de localização dos dados simulados de uma distribuição de Cauchy.
Calcule a localização central com localização média (não robusta), mediana (robusta) e peso duplo (robusta).
As estatísticas de localização robustas estão "em média" mais próximas da localização central da distribuição de cauda pesada.
Para dados distribuídos normalmente, a localização de peso duplo está próxima da média.