Van der Waerdenův test - Van der Waerden test
Pojmenován po nizozemském matematikovi Bartel Leendert van der Waerden, Van der Waerdenův test je statistický test že k funkce distribuce populace jsou stejné. Van der Waerdenův test převádí hodnosti ze standardu Kruskal-Wallisova jednosměrná analýza rozptylu na kvantily standardního normálního rozdělení (podrobnosti jsou uvedeny níže). Říká se jim normální skóre a test se počítá z těchto normálních skóre.
The k populační verze testu je rozšířením testu pro dvě populace publikovaného Van der Waerdenem (1952,1953).
Pozadí
Analýza rozptylu (ANOVA) je a analýza dat technika pro zkoumání významnosti faktorů (nezávislé proměnné ) ve vícefaktorovém modelu. Jeden faktorový model lze považovat za zobecnění dva vzorky t-test. To znamená, že t-test se dvěma vzorky je testem hypotézy, že dva průměrné hodnoty populace jsou stejné. Jeden faktor ANOVA testuje hypotézu, že k populační prostředky jsou stejné. Standardní ANOVA předpokládá, že chyby (tj. Zbytky) jsou normálně distribuováno. Pokud tento předpoklad normality není platný, alternativou je použití a neparametrický test.
Definice testu
Nechat nj (j = 1, 2, ..., k) představují velikosti vzorku pro každou z k skupiny (tj. vzorky) v datech. Nechat N označte velikost vzorku pro všechny skupiny. Nechat Xij představují ith hodnota v jth skupina. Normální skóre se počítá jako
kde R(Xij) označuje hodnost pozorování Xij a kde Φ−1 označuje normální kvantilová funkce. Průměr normálního skóre pro každý vzorek lze poté vypočítat jako
Rozptyl normálních skóre lze vypočítat jako
Van der Waerdenův test lze potom definovat takto:
- H0: Všechny k funkce distribuce populace jsou identické
- HA: Alespoň jedna z populací má tendenci poskytovat větší pozorování než alespoň jedna z ostatních populací
Statistika testu je
Pro úroveň významnosti α, kritická oblast je
kde Χα, k - 12 je α-kvantil z distribuce chí-kvadrát s k - 1 stupeň volnosti. Nulová hypotéza je odmítnuta, pokud je statistika testu v kritické oblasti. Pokud je hypotéza identických distribucí odmítnuta, lze provést a více srovnání postup k určení, které páry populací se obvykle liší. Populace j1 a j2 se zdají být odlišné, pokud je splněna následující nerovnost:
s t1 - α / 2 the (1 - α / 2) -kvantil z t-distribuce.
Srovnání s testem Kruskal-Wallis
Nejběžnějším neparametrickým testem pro jednofaktorový model je Kruskal-Wallisův test. Kruskal-Wallisův test je založen na řadách dat. Výhodou Van Der Waerdenova testu je, že poskytuje vysokou účinnost standardní analýzy ANOVA, když jsou předpoklady normality ve skutečnosti splněny, ale také poskytuje robustnost Kruskal-Wallisova testu, když předpoklady normality nejsou splněny.
Reference
- Conover, W. J. (1999). Praktická neparametrická statistika (Třetí vydání.). Wiley. 396–406.
- van der Waerden, B.L. (1952). "Objednat testy problému se dvěma vzorky a jejich síly", Indagationes Mathematicae, 14, 453–458.
- van der Waerden, B.L. (1953). "Objednejte testy na problém se dvěma vzorky. II, III", Sborník Koninklijke Nederlandse Akademie van Wetenschappen, řada A, 564, 303–310, 311–316.
Tento článek zahrnujepublic domain materiál z Národní institut pro standardy a technologie webová stránka https://www.nist.gov.