当数据被异常值污染时,非稳健的离散程度度量(如标准偏差)不再反映未污染数据的离散程度。稳健的度量,如截断方差或 离散程度可给出更可靠的结果。
可以通过向原始样本添加小部分具有较大方差的正常数据来模拟被污染的数据。然后分析分散程度。
通过执行蒙特卡罗仿真可视化这些度量的可靠性。
对于没有异常值的数据, 离散程度与标准偏差非常接近。