Oříznutý odhad - Trimmed estimator

v statistika, a upravený odhad je odhadce odvozeno od jiného odhadce vyloučením některých z extrémní hodnoty, proces zvaný zkrácení. To se obecně provádí za účelem získání více robustní statistika a jsou brány v úvahu extrémní hodnoty odlehlé hodnoty. Ořezané odhady také často mají vyšší účinnost pro distribuce směsí a těžkopádné distribuce než odpovídající nezkrácený odhad, za cenu nižší účinnosti u jiných distribucí, jako je normální distribuce.

Vzhledem k odhadu je n% ořezané verze se získá vyřazením souboru n% nejnižších a nejvyšších pozorování: jedná se o statistiku o střední údajů. Například 5% oříznutý průměr se získá průměrem rozmezí 5% až 95%. V některých případech oříznutý odhadce místo procenta zahodí pevný počet bodů (například maximální a minimální).

Příklady

The medián je nejvíce ořezaná statistika (nominálně 50%), protože zahodí všechna data kromě centrálních a rovná se plně oříznutému průměru - nebo skutečně plně oříznutému střednímu rozsahu, nebo (pro soubory dat liché velikosti) plně oříznutému maximu nebo minimální. Stejně tak žádný stupeň oříznutí nemá žádný vliv na medián - oříznutý medián je medián - protože ořezávání vždy vylučuje stejný počet nejnižších a nejvyšších hodnot.

Kvantily lze považovat za oříznutá maxima nebo minima: například 5. percentil je oříznuté minimum 5%.

Ořezané odhady použité k odhadu a parametr umístění zahrnout:

Ořezané odhady použité k odhadu a parametr měřítka zahrnout:

Příkladem jsou ořezané odhady zahrnující pouze lineární kombinace bodů L-odhady.

Aplikace

Odhad

Nejčastěji se používají oříznuté odhady odhad parametrů stejného parametru jako neoříznutý odhad. V některých případech lze použít odhad přímo, zatímco v jiných případech musí být upraven tak, aby poskytoval objektivní konzistentní odhad.

Například při odhadu a parametr umístění pro symetrické rozdělení bude upravený odhad nestranný (za předpokladu, že původní odhad byl nezaujatý), protože odstraní stejnou částku nahoře i dole. Pokud však distribuce má překroutit, oříznuté odhady budou obecně zkreslené a budou vyžadovat úpravu. Například ve zkosené distribuci je neparametrický zkosení (a Pearsonovy koeficienty šikmosti ) změřte zkreslení mediánu jako odhad průměru.

Při odhadu a parametr měřítka pomocí ořezaného odhadu jako a robustní měřítko, například k odhadu rozptyl populace nebo populace standardní odchylka, jeden obecně musí vynásobit a měřítko učinit z něj nestranný konzistentní odhadce; vidět parametr měřítka: odhad.

Například vydělením IQR (za použití chybová funkce ) z něj činí nezaujatý, konzistentní odhad standardní směrodatné odchylky populace, pokud data sledují a normální distribuce.

Jiná použití

Ořezané odhady lze také použít jako statistiky samy o sobě - ​​například medián je míra umístění a IQR je míra rozptylu. V těchto případech může statistika vzorků sloužit jako vlastní odhad očekávaná hodnota. Například ŠÍLENÝ vzorku ze standardu Cauchyovo rozdělení je odhad populace MAD, která je v tomto případě 1, zatímco populační odchylka neexistuje.

Viz také

Reference