Robuste Schätzverfahren für Heavy-tailed-Daten
Einkommensdaten können mit Heavy-tailed-Verteilungen visualisiert werden. Heavy-tailed-Verteilungen sind Verteilungen mit "schweren Rändern", d.h. einer relativ großen Wahrscheinlichkeitsmasse in ihren Rändern. Bei solchen randlastigen Daten ist der Stichprobenmittelwert kein repräsentatives Maß für das Einkommen einer Durchschnittsperson.
Vergleichen Sie die Leistung des Stichprobenmittelwerts und einiger robuster statistsicher Verfahren anhand von US-Einkommensdaten aus einer Volkszählungsumfrage.
Das Mittel ist kein repräsentativer Wert für das "typische" Einkommen.
Der Median gibt das Einkommen der Person in der Mitte der Einkommensverteilung an.
Das "Trimmen", d.h. das Verwerfen der Top 5 % der besten Verdiener ergibt ein besseres Bild vom Leben einer durchschnittlichen Person.
Anstatt Daten zu verwerfen, können die Daten winsorisiert werden.
Schätzen Sie das Einkommen für eine Durchschnittsperson in der unteren Hälfte der Einkommensverteilung.
Zeigen Sie die Mittel mit dem Einkommenshistogramm an.