Newman – Keulsova metoda - Newman–Keuls method

The Newman – Keuls nebo Student – ​​Newman – Keuls (SNK) metoda je postupný více srovnání postup používaný k identifikaci vzorek prostředek to jsou výrazně odlišné od sebe navzájem.[1] Bylo pojmenováno po Student (1927),[2] D. Newman,[3] a M. Keuls.[4] Tento postup se často používá jako a post-hoc test kdykoli byl zjištěn významný rozdíl mezi třemi nebo více způsoby výběru analýza rozptylu (ANOVA).[1] Newman – Keulsova metoda je podobná Tukeyův test dosahu jak oba postupy používají studentizovaná statistika rozsahu.[5][6] Na rozdíl od Tukeyova testu dosahu používá metoda Newman-Keuls odlišné kritické hodnoty pro různé páry průměrných srovnání. Je tedy pravděpodobnější, že postup odhalí významné rozdíly mezi skupinovými prostředky a spácháním chyby typu I. nesprávným odmítnutím nulové hypotézy, pokud je pravdivá. Jinými slovy, postup Neuman-Keuls je více silný ale méně konzervativní než Tukeyův test dosahu.[6][7]

Dějiny

Metodu Newman – Keuls zavedl Newman v roce 1939 a dále ji rozvinul Keuls v roce 1952. To dříve Tukey představil koncept různých typů četnosti chyb (1952a,[8] 1952b,[9] 1953[10]Metoda Newman-Keuls byla populární během padesátých a šedesátých let[Citace je zapotřebí ]. Ale když ovládání rodinná chybovost (FWER) se stal přijatelným kritériem při testování více srovnání, postup se stal méně populárním[Citace je zapotřebí ] protože nekontroluje FWER (s výjimkou zvláštního případu přesně tří skupin[11]V roce 1995 Benjamini a Hochberg představili nové, liberálnější a výkonnější kritérium pro tyto typy problémů: Falešná míra objevení (FDR) ovládání.[12] V roce 2006 Shaffer ukázal (pomocí rozsáhlé simulace), že Newman – Keulsova metoda ovládá FDR s určitými omezeními.[13]

Požadované předpoklady

Předpoklady Newman – Keulsova testu jsou v zásadě stejné jako u nezávislých skupin t-test: normalita, homogenita rozptylu a nezávislá pozorování. Test je poměrně robustní, pokud jde o porušení normality. Porušení homogenity rozptylu může být problematičtější než v případě dvou vzorků, protože MSE je založen na datech ze všech skupin. Předpoklad nezávislosti pozorování je důležitý a neměl by být porušován.

Postupy

Metoda Newman – Keuls využívá při porovnávání vzorových průměrů postupný přístup.[14] Před jakýmkoli průměrným porovnáním jsou všechny průměrné vzorky seřazeny vzestupně nebo sestupně, čímž vznikne uspořádaný rozsah (p) ukázkových prostředků.[1][14] Poté se provede srovnání mezi největším a nejmenším průměrem vzorku v největším rozsahu.[14] Za předpokladu, že největší rozsah jsou čtyři prostředky (nebo p = 4), významný rozdíl mezi největším a nejmenším průměrem, jak je odhalen metodou Newman-Keuls, by vedl k odmítnutí nulová hypotéza pro tento konkrétní rozsah prostředků. Další největší srovnání dvou vzorových prostředků by pak bylo provedeno v menším rozsahu tří prostředků (nebo p = 3). Pokud neexistují žádné významné rozdíly mezi dvěma výběrovými prostředky v daném rozsahu, bude toto postupné srovnání výběrových prostředků pokračovat, dokud nebude provedeno konečné srovnání s nejmenším rozsahem pouhých dvou prostředků. Pokud mezi těmito dvěma výběrovými prostředky neexistuje žádný významný rozdíl, zůstanou zachovány všechny nulové hypotézy v tomto rozmezí a není třeba provádět další srovnání v menších rozmezích.

Rozsah průměrných vzorků
Průměrné hodnoty2468
2246
424
62

K určení, zda existuje významný rozdíl mezi dvěma prostředky se stejnou velikostí vzorku, používá Newman-Keulsova metoda vzorec, který je identický s tím, který se používá v Tukeyův test dosahu, který vypočítá q hodnotu tak, že vezmeme rozdíl mezi dvěma vzorovými prostředky a vydělíme je standardní chybou:

kde představuje studentizovaný rozsah hodnota, a jsou největší a nejmenší výběrové prostředky v rozsahu, je odchylka chyby převzatá z tabulky ANOVA a je velikost vzorku (počet pozorování ve vzorku). Pokud se porovnává pomocí nestejných velikostí vzorků (), pak by vzorec Newman – Keuls byl upraven následovně:

kde a představují velikosti vzorku dvou vzorků. V obou případech MSE (Střední kvadratická chyba) je převzata z ANOVA provedené v první fázi analýzy.

Po výpočtu se vypočítá q hodnotu lze přirovnat k a q kritická hodnota (nebo ), který lze najít v a q distribuční tabulka založená na úroveň významnosti (), chyba stupně svobody () z tabulky ANOVA a rozsah () vzorků, které mají být testovány.[15] Pokud je počítáno q hodnota je rovna nebo větší než q kritická hodnota, pak nulová hypotéza (H0: μA = μB) pro tento konkrétní rozsah prostředků lze odmítnout.[15] Protože se počet prostředků v rozsahu mění s každým následným párovým srovnáním, kritická hodnota q Statistika se také mění s každým porovnáním, což činí metodu Neuman-Keuls mírnější a tím pádem výkonnější než test Tukeyova rozsahu. Pokud tedy bylo zjištěno, že párové srovnání je pomocí metody Newman-Keuls výrazně odlišné, nemusí se nutně významně lišit při analýze pomocí Tukeyova testu dosahu.[7][15] Naopak, pokud bylo zjištěno, že párové srovnání není významně odlišné pomocí metody Newman-Keuls, nemůže se nijak významně lišit, když je testováno Tukeyovým testem rozsahu.[7]

Omezení

Procedura Newman-Keuls nemůže vytvořit interval spolehlivosti pro každý střední rozdíl nebo pro přesné hodnoty p upravené pro multiplicitu kvůli jeho sekvenční povaze.[Citace je zapotřebí ] Výsledky je poněkud obtížné interpretovat, protože je obtížné formulovat, jaké jsou nulové hypotézy, které byly testovány.[Citace je zapotřebí ]

Viz také

Reference

  1. ^ A b C De Muth, James E. (2006). Základní statistiky a farmaceutické statistické aplikace (2. vyd.). Boca Raton, FL: Chapman and Hall / CRC. str. 229–259. ISBN  978-0-8493-3799-4.
  2. ^ Student (1927). „Chyby rutinní analýzy“. Biometrika. 19 (1/2): 151–164. doi:10.2307/2332181. JSTOR  2332181.
  3. ^ Newman, D. (1939). "Distribuce rozsahu ve vzorcích z normální populace, vyjádřená jako nezávislý odhad směrodatné odchylky". Biometrika. 31 (1): 20–30. doi:10.1093 / biomet / 31.1-2.20.
  4. ^ Keuls, M. (1952). „Použití„ studentizovaného rozsahu “ve spojení s analýzou rozptylu“ (PDF). Euphytica. 1 (2): 112–122. doi:10.1007 / bf01908269. Archivovány od originál (PDF) dne 04.11.2014.
  5. ^ Broota, K. D. (1989). Experimentální design v behaviorálním výzkumu (1. vyd.). Nové Dillí, Indie: New Age International (P) Ltd. s. 81–96. ISBN  978-81-224-0215-5.
  6. ^ A b Sheskin, David J. (1989). Příručka parametrických a neparametrických statistických postupů (3. vyd.). Boca Raton, FL: CRC Press. str. 665–756. ISBN  978-1-58488-440-8.
  7. ^ A b C Roberts, Maxwell; Russo, Riccardo (1999). "Sledování jednofaktorové ANOVA mezi subjekty". Příručka pro studenty k analýze odchylek. Filey, Velká Británie: J&L Composition Ltd. str. 82–109. ISBN  978-0-415-16564-8.
  8. ^ Tukey, J. W. (1952a). "Připomínkové listy pro Povolení pro různé typy chybovosti. Nepublikovaný rukopis". Brown, 1984.
  9. ^ Tukey, J. W. (1952b). "Připomínkové listy pro více srovnání. Nepublikovaný rukopis". Brown, 1984.
  10. ^ Tukey, J. W. (1953). "Problém vícenásobného srovnání. Nepublikovaný rukopis". Brown, 1984.
  11. ^ M. A. Seaman; J. R. Levin a R. C. Serlin (1991). „Nový vývoj v párových vícenásobných srovnáních: Některé výkonné a proveditelné postupy“. Psychologický bulletin. 110 (3): 577–586. doi:10.1037/0033-2909.110.3.577.
  12. ^ Benjamini, Y., Hochberg, Y. (1995). „Řízení rychlosti falešných objevů: nový a výkonný přístup k vícenásobnému testování“ (PDF). Journal of the Royal Statistical Society. Řada B (metodická). 57 (1): 289–300. doi:10.1111 / j.2517-6161.1995.tb02031.x. JSTOR  2346101.CS1 maint: více jmen: seznam autorů (odkaz)
  13. ^ Shaffer, Juliet P (2007). „Řízení rychlosti falešných objevů s omezeními: Newman – Keulsův test se vrátil“. Biometrický deník. 49 (1): 136–143. doi:10.1002 / bimj.200610297. PMID  17342955.
  14. ^ A b C Toothaker, Larry E. (1993). Vícenásobné srovnávací postupy (kvantitativní aplikace ve společenských vědách) (2. vyd.). Newburry Park, CA: Chapman and Hall / CRC. 27–45. ISBN  978-0-8039-4177-9.
  15. ^ A b C Zar, Jerrold H. (1999). Biostatistická analýza (4. vydání). Newburry Park, CA: Prentice Hall. 208–230. ISBN  978-0-13-081542-2.