Newman – Keulsova metoda - Newman–Keuls method
The Newman – Keuls nebo Student – Newman – Keuls (SNK) metoda je postupný více srovnání postup používaný k identifikaci vzorek prostředek to jsou výrazně odlišné od sebe navzájem.[1] Bylo pojmenováno po Student (1927),[2] D. Newman,[3] a M. Keuls.[4] Tento postup se často používá jako a post-hoc test kdykoli byl zjištěn významný rozdíl mezi třemi nebo více způsoby výběru analýza rozptylu (ANOVA).[1] Newman – Keulsova metoda je podobná Tukeyův test dosahu jak oba postupy používají studentizovaná statistika rozsahu.[5][6] Na rozdíl od Tukeyova testu dosahu používá metoda Newman-Keuls odlišné kritické hodnoty pro různé páry průměrných srovnání. Je tedy pravděpodobnější, že postup odhalí významné rozdíly mezi skupinovými prostředky a spácháním chyby typu I. nesprávným odmítnutím nulové hypotézy, pokud je pravdivá. Jinými slovy, postup Neuman-Keuls je více silný ale méně konzervativní než Tukeyův test dosahu.[6][7]
Dějiny
Metodu Newman – Keuls zavedl Newman v roce 1939 a dále ji rozvinul Keuls v roce 1952. To dříve Tukey představil koncept různých typů četnosti chyb (1952a,[8] 1952b,[9] 1953[10]Metoda Newman-Keuls byla populární během padesátých a šedesátých let[Citace je zapotřebí ]. Ale když ovládání rodinná chybovost (FWER) se stal přijatelným kritériem při testování více srovnání, postup se stal méně populárním[Citace je zapotřebí ] protože nekontroluje FWER (s výjimkou zvláštního případu přesně tří skupin[11]V roce 1995 Benjamini a Hochberg představili nové, liberálnější a výkonnější kritérium pro tyto typy problémů: Falešná míra objevení (FDR) ovládání.[12] V roce 2006 Shaffer ukázal (pomocí rozsáhlé simulace), že Newman – Keulsova metoda ovládá FDR s určitými omezeními.[13]
Požadované předpoklady
Předpoklady Newman – Keulsova testu jsou v zásadě stejné jako u nezávislých skupin t-test: normalita, homogenita rozptylu a nezávislá pozorování. Test je poměrně robustní, pokud jde o porušení normality. Porušení homogenity rozptylu může být problematičtější než v případě dvou vzorků, protože MSE je založen na datech ze všech skupin. Předpoklad nezávislosti pozorování je důležitý a neměl by být porušován.
Postupy
Metoda Newman – Keuls využívá při porovnávání vzorových průměrů postupný přístup.[14] Před jakýmkoli průměrným porovnáním jsou všechny průměrné vzorky seřazeny vzestupně nebo sestupně, čímž vznikne uspořádaný rozsah (p) ukázkových prostředků.[1][14] Poté se provede srovnání mezi největším a nejmenším průměrem vzorku v největším rozsahu.[14] Za předpokladu, že největší rozsah jsou čtyři prostředky (nebo p = 4), významný rozdíl mezi největším a nejmenším průměrem, jak je odhalen metodou Newman-Keuls, by vedl k odmítnutí nulová hypotéza pro tento konkrétní rozsah prostředků. Další největší srovnání dvou vzorových prostředků by pak bylo provedeno v menším rozsahu tří prostředků (nebo p = 3). Pokud neexistují žádné významné rozdíly mezi dvěma výběrovými prostředky v daném rozsahu, bude toto postupné srovnání výběrových prostředků pokračovat, dokud nebude provedeno konečné srovnání s nejmenším rozsahem pouhých dvou prostředků. Pokud mezi těmito dvěma výběrovými prostředky neexistuje žádný významný rozdíl, zůstanou zachovány všechny nulové hypotézy v tomto rozmezí a není třeba provádět další srovnání v menších rozmezích.
Průměrné hodnoty | 2 | 4 | 6 | 8 |
---|---|---|---|---|
2 | 2 | 4 | 6 | |
4 | 2 | 4 | ||
6 | 2 |
K určení, zda existuje významný rozdíl mezi dvěma prostředky se stejnou velikostí vzorku, používá Newman-Keulsova metoda vzorec, který je identický s tím, který se používá v Tukeyův test dosahu, který vypočítá q hodnotu tak, že vezmeme rozdíl mezi dvěma vzorovými prostředky a vydělíme je standardní chybou:
kde představuje studentizovaný rozsah hodnota, a jsou největší a nejmenší výběrové prostředky v rozsahu, je odchylka chyby převzatá z tabulky ANOVA a je velikost vzorku (počet pozorování ve vzorku). Pokud se porovnává pomocí nestejných velikostí vzorků (), pak by vzorec Newman – Keuls byl upraven následovně:
kde a představují velikosti vzorku dvou vzorků. V obou případech MSE (Střední kvadratická chyba) je převzata z ANOVA provedené v první fázi analýzy.
Po výpočtu se vypočítá q hodnotu lze přirovnat k a q kritická hodnota (nebo ), který lze najít v a q distribuční tabulka založená na úroveň významnosti (), chyba stupně svobody () z tabulky ANOVA a rozsah () vzorků, které mají být testovány.[15] Pokud je počítáno q hodnota je rovna nebo větší než q kritická hodnota, pak nulová hypotéza (H0: μA = μB) pro tento konkrétní rozsah prostředků lze odmítnout.[15] Protože se počet prostředků v rozsahu mění s každým následným párovým srovnáním, kritická hodnota q Statistika se také mění s každým porovnáním, což činí metodu Neuman-Keuls mírnější a tím pádem výkonnější než test Tukeyova rozsahu. Pokud tedy bylo zjištěno, že párové srovnání je pomocí metody Newman-Keuls výrazně odlišné, nemusí se nutně významně lišit při analýze pomocí Tukeyova testu dosahu.[7][15] Naopak, pokud bylo zjištěno, že párové srovnání není významně odlišné pomocí metody Newman-Keuls, nemůže se nijak významně lišit, když je testováno Tukeyovým testem rozsahu.[7]
Omezení
Procedura Newman-Keuls nemůže vytvořit interval spolehlivosti pro každý střední rozdíl nebo pro přesné hodnoty p upravené pro multiplicitu kvůli jeho sekvenční povaze.[Citace je zapotřebí ] Výsledky je poněkud obtížné interpretovat, protože je obtížné formulovat, jaké jsou nulové hypotézy, které byly testovány.[Citace je zapotřebí ]
Viz také
Reference
- ^ A b C De Muth, James E. (2006). Základní statistiky a farmaceutické statistické aplikace (2. vyd.). Boca Raton, FL: Chapman and Hall / CRC. str. 229–259. ISBN 978-0-8493-3799-4.
- ^ Student (1927). „Chyby rutinní analýzy“. Biometrika. 19 (1/2): 151–164. doi:10.2307/2332181. JSTOR 2332181.
- ^ Newman, D. (1939). "Distribuce rozsahu ve vzorcích z normální populace, vyjádřená jako nezávislý odhad směrodatné odchylky". Biometrika. 31 (1): 20–30. doi:10.1093 / biomet / 31.1-2.20.
- ^ Keuls, M. (1952). „Použití„ studentizovaného rozsahu “ve spojení s analýzou rozptylu“ (PDF). Euphytica. 1 (2): 112–122. doi:10.1007 / bf01908269. Archivovány od originál (PDF) dne 04.11.2014.
- ^ Broota, K. D. (1989). Experimentální design v behaviorálním výzkumu (1. vyd.). Nové Dillí, Indie: New Age International (P) Ltd. s. 81–96. ISBN 978-81-224-0215-5.
- ^ A b Sheskin, David J. (1989). Příručka parametrických a neparametrických statistických postupů (3. vyd.). Boca Raton, FL: CRC Press. str. 665–756. ISBN 978-1-58488-440-8.
- ^ A b C Roberts, Maxwell; Russo, Riccardo (1999). "Sledování jednofaktorové ANOVA mezi subjekty". Příručka pro studenty k analýze odchylek. Filey, Velká Británie: J&L Composition Ltd. str. 82–109. ISBN 978-0-415-16564-8.
- ^ Tukey, J. W. (1952a). "Připomínkové listy pro Povolení pro různé typy chybovosti. Nepublikovaný rukopis". Brown, 1984.
- ^ Tukey, J. W. (1952b). "Připomínkové listy pro více srovnání. Nepublikovaný rukopis". Brown, 1984.
- ^ Tukey, J. W. (1953). "Problém vícenásobného srovnání. Nepublikovaný rukopis". Brown, 1984.
- ^ M. A. Seaman; J. R. Levin a R. C. Serlin (1991). „Nový vývoj v párových vícenásobných srovnáních: Některé výkonné a proveditelné postupy“. Psychologický bulletin. 110 (3): 577–586. doi:10.1037/0033-2909.110.3.577.
- ^ Benjamini, Y., Hochberg, Y. (1995). „Řízení rychlosti falešných objevů: nový a výkonný přístup k vícenásobnému testování“ (PDF). Journal of the Royal Statistical Society. Řada B (metodická). 57 (1): 289–300. doi:10.1111 / j.2517-6161.1995.tb02031.x. JSTOR 2346101.CS1 maint: více jmen: seznam autorů (odkaz)
- ^ Shaffer, Juliet P (2007). „Řízení rychlosti falešných objevů s omezeními: Newman – Keulsův test se vrátil“. Biometrický deník. 49 (1): 136–143. doi:10.1002 / bimj.200610297. PMID 17342955.
- ^ A b C Toothaker, Larry E. (1993). Vícenásobné srovnávací postupy (kvantitativní aplikace ve společenských vědách) (2. vyd.). Newburry Park, CA: Chapman and Hall / CRC. 27–45. ISBN 978-0-8039-4177-9.
- ^ A b C Zar, Jerrold H. (1999). Biostatistická analýza (4. vydání). Newburry Park, CA: Prentice Hall. 208–230. ISBN 978-0-13-081542-2.