Grubbssův test - Grubbss test - Wikipedia
Ve statistikách Grubbsův test nebo Grubbsův test (pojmenoval podle Frank E. Grubbs, který test publikoval v roce 1950[1]), také známý jako maximálně normalizováno reziduální test nebo extrémní studentizovaná odchylka, je test slouží k detekci odlehlé hodnoty v univariate soubor údajů předpokládá, že pochází z a normálně distribuováno populace.
Definice
Grubbsův test je založen na předpokladu normálnost. To znamená, že před použitím Grubbsova testu je třeba nejprve ověřit, zda lze data přiměřeně aproximovat normálním rozdělením.[2]
Grubbsův test detekuje jednu odlehlou hodnotu najednou. Tato odlehlá hodnota je odstraněna z datové sady a test je iterován, dokud nejsou zjištěny žádné odlehlé hodnoty. Vícenásobné iterace však mění pravděpodobnosti detekce a test by se neměl používat pro velikosti vzorku šest nebo méně, protože většinu bodů často označuje jako odlehlé hodnoty.[Citace je zapotřebí ]
Grubbsův test je definován pro hypotéza:
- H0: V datové sadě nejsou žádné odlehlé hodnoty
- HA: V datové sadě je přesně jedna odlehlá hodnota
Statistika Grubbsova testu je definována jako:
s a označující průměr vzorku a standardní odchylka, resp. Statistika Grubbsova testu je největší absolutní odchylka od průměru vzorku v jednotkách standardní odchylky vzorku.
To je oboustranný test, u nichž je hypotéza o odlehlých hodnotách zamítnuta úroveň významnosti α pokud
s tα / (2N),N−2 označující svršek kritická hodnota z t-distribuce s N − 2 stupně svobody a úroveň významnosti α / (2N).
Jednostranný případ
Grubbsův test lze také definovat jako jednostranný test, který nahradí α / (2N) s α /N. Chcete-li otestovat, zda je minimální hodnota odlehlá, je statistika testu
s Ymin označující minimální hodnotu. Chcete-li otestovat, zda je maximální hodnota odlehlá, je statistika testu
s Ymax označující maximální hodnotu.
Související techniky
Několik grafické techniky mohou a měly by být použity k detekci odlehlých hodnot. Jednoduchý spusťte graf sekvence, a krabicový graf nebo histogram by měl ukázat jakékoli zjevně odlehlé body. A normální pravděpodobnostní graf může být také užitečné.
Viz také
Reference
- ^ Grubbs, Frank E. (1950). „Ukázková kritéria pro testování odlehlých pozorování“. Annals of Mathematical Statistics. 21 (1): 27–58. doi:10.1214 / aoms / 1177729885.
- ^ Citováno z Příručka pro inženýrství a statistiku, bod 1.3.5.17, http://www.itl.nist.gov/div898/handbook/eda/section3/eda35h.htm
Další čtení
- Grubbs, Frank (únor 1969). "Postupy pro detekci odlehlých pozorování ve vzorcích". Technometrics. Technometrics, sv. 11, č. 1. 11 (1): 1–21. doi:10.2307/1266761. JSTOR 1266761.
- Stefansky, W. (1972). "Odmítnutí odlehlých hodnot ve faktoriálních vzorech". Technometrics. Technometrics, sv. 14, č. 2. 14 (2): 469–479. doi:10.2307/1267436. JSTOR 1267436.
Tento článek zahrnujepublic domain materiál z Národní institut pro standardy a technologie webová stránka https://www.nist.gov.