平均が使えないときに使うロバストな位置測定値
コーシー(Cauchy)分布やパレート(Pareto)分布のような裾の重い分布は,その裾にかなりの確率測定値(重み)を持つ.このことはつまり,めったに起らないイベントが無視できない確率を持つことを意味する.このような分布はしばしば未定義のモーメント,例えば平均を持つ.刈込み平均やウィンザー化平均等のロバストな測定値を使って,分布の中心位置を推定することができる.
バージョン12におけるロバストな位置および分散の測定値.
裾の重い分布を例として使う.
平均は定義されていない.
これは裾の重い分布であり,重みのほとんどは裾にある.四分位数を計算する.
長い裾の10%を削除してから平均を計算する.
以下は分布を切断することに相当する.
長い裾の10%を切り取ってから平均を計算する.
以下は打切りに相当する.
最大値の10%を捨てることと切り取ることの違いは大きい.このことがこの分布の「重い裾」を示す.