均值不再有用—稳健的位置度量
重尾分布(如 Cauchy 或 Pareto 分布)的尾部含有重要的概率信息,这意味着稀有事件具有不可忽略的发生的概率。这种分布通常有一些未定义的矩,如均值。可以使用切尾均值或 Winsor 化均值等稳健度量来估计分布的中心位置。
版本 12 中稳健的位置和离散程度度量。
来看一个重尾分布的例子。
平均值没有定义。
这是一个重尾分布,大部分重量在尾部。计算四分位数。
去除 10% 的长尾后计算平均值。
这对应于截断分布。
削减 10% 的长尾后计算平均值。
这对应于删失。
丢弃 10% 的最大值与对其进行削减之间的差异非常显著,这说明了此分布的“重尾”。