Quando a média é inútil—Medidas de localização robustas
As distribuições de cauda pesada, como as distribuições de Cauchy ou Pareto, possuem uma medida de probabilidade significativa (peso) em suas caudas, o que significa que os eventos que ocorrem raramente têm probabilidade não desprezível. Tais distribuições geralmente têm alguns momentos indefinidos, por exemplo, média. Você pode usar medidas robustas como a média aparada ou winsorizada para estimar a localização central da distribuição.
Medidas robustas de localização e dispersão na versão 12.
Veja um exemplo de uma distribuição de cauda pesada.
A média não está definida.
Esta é uma distribuição de cauda pesada e a maior parte do peso está na cauda. Calcule os quartis.
Calcule a média depois de remover 10% da cauda longa.
Isso corresponde ao truncamento da distribuição.
Calcule a média depois de remover 10% da cauda longa.
Isso corresponde a redução.
A diferença entre descartar 10% dos maiores valores e removê-los é significativa, o que explica a "cauda pesada" dessa distribuição.