Newman – Keulsova metoda - Newman–Keuls method

The Newman – Keuls nebo Student – Newman – Keuls (SNK) metoda je postupný více srovnání postup používaný k identifikaci vzorek prostředek to jsou výrazně odlišné od sebe navzájem.^[1] Bylo pojmenováno po Student (1927),^[2] D. Newman,^[3] a M. Keuls.^[4] Tento postup se často používá jako a post-hoc test kdykoli byl zjištěn významný rozdíl mezi třemi nebo více způsoby výběru analýza rozptylu (ANOVA).^[1] Newman – Keulsova metoda je podobná Tukeyův test dosahu jak oba postupy používají studentizovaná statistika rozsahu.^[5]^[6] Na rozdíl od Tukeyova testu dosahu používá metoda Newman-Keuls odlišné kritické hodnoty pro různé páry průměrných srovnání. Je tedy pravděpodobnější, že postup odhalí významné rozdíly mezi skupinovými prostředky a spácháním chyby typu I. nesprávným odmítnutím nulové hypotézy, pokud je pravdivá. Jinými slovy, postup Neuman-Keuls je více silný ale méně konzervativní než Tukeyův test dosahu.^[6]^[7]

Dějiny

Metodu Newman – Keuls zavedl Newman v roce 1939 a dále ji rozvinul Keuls v roce 1952. To dříve Tukey představil koncept různých typů četnosti chyb (1952a,^[8] 1952b,^[9] 1953^[10]Metoda Newman-Keuls byla populární během padesátých a šedesátých let^{[Citace je zapotřebí ]}. Ale když ovládání rodinná chybovost (FWER) se stal přijatelným kritériem při testování více srovnání, postup se stal méně populárním^{[Citace je zapotřebí ]} protože nekontroluje FWER (s výjimkou zvláštního případu přesně tří skupin^[11]V roce 1995 Benjamini a Hochberg představili nové, liberálnější a výkonnější kritérium pro tyto typy problémů: Falešná míra objevení (FDR) ovládání.^[12] V roce 2006 Shaffer ukázal (pomocí rozsáhlé simulace), že Newman – Keulsova metoda ovládá FDR s určitými omezeními.^[13]

Požadované předpoklady

Předpoklady Newman – Keulsova testu jsou v zásadě stejné jako u nezávislých skupin t-test: normalita, homogenita rozptylu a nezávislá pozorování. Test je poměrně robustní, pokud jde o porušení normality. Porušení homogenity rozptylu může být problematičtější než v případě dvou vzorků, protože MSE je založen na datech ze všech skupin. Předpoklad nezávislosti pozorování je důležitý a neměl by být porušován.

Postupy

Metoda Newman – Keuls využívá při porovnávání vzorových průměrů postupný přístup.^[14] Před jakýmkoli průměrným porovnáním jsou všechny průměrné vzorky seřazeny vzestupně nebo sestupně, čímž vznikne uspořádaný rozsah (p) ukázkových prostředků.^[1]^[14] Poté se provede srovnání mezi největším a nejmenším průměrem vzorku v největším rozsahu.^[14] Za předpokladu, že největší rozsah jsou čtyři prostředky (nebo p = 4), významný rozdíl mezi největším a nejmenším průměrem, jak je odhalen metodou Newman-Keuls, by vedl k odmítnutí nulová hypotéza pro tento konkrétní rozsah prostředků. Další největší srovnání dvou vzorových prostředků by pak bylo provedeno v menším rozsahu tří prostředků (nebo p = 3). Pokud neexistují žádné významné rozdíly mezi dvěma výběrovými prostředky v daném rozsahu, bude toto postupné srovnání výběrových prostředků pokračovat, dokud nebude provedeno konečné srovnání s nejmenším rozsahem pouhých dvou prostředků. Pokud mezi těmito dvěma výběrovými prostředky neexistuje žádný významný rozdíl, zůstanou zachovány všechny nulové hypotézy v tomto rozmezí a není třeba provádět další srovnání v menších rozmezích.

Rozsah průměrných vzorků
	${ displaystyle { bar {X}} _ {1}}$	${ displaystyle { bar {X}} _ {2}}$	${ displaystyle { bar {X}} _ {3}}$	${ displaystyle { bar {X}} _ {4}}$
Průměrné hodnoty	2	4	6	8
${ displaystyle { bar {X}} _ {1} =}$ 2		2	4	6
${ displaystyle { bar {X}} _ {2} =}$ 4			2	4
${ displaystyle { bar {X}} _ {3} =}$ 6				2

K určení, zda existuje významný rozdíl mezi dvěma prostředky se stejnou velikostí vzorku, používá Newman-Keulsova metoda vzorec, který je identický s tím, který se používá v Tukeyův test dosahu, který vypočítá q hodnotu tak, že vezmeme rozdíl mezi dvěma vzorovými prostředky a vydělíme je standardní chybou:

{ displaystyle q = { frac {{ bar {X}} _ {A} - { bar {X}} _ {B}} { sqrt { frac {MSE} {n}}}},}

kde ${ displaystyle q}$ představuje studentizovaný rozsah hodnota, ${ displaystyle { bar {X}} _ {A}}$ a ${ displaystyle { bar {X}} _ {B}}$ jsou největší a nejmenší výběrové prostředky v rozsahu, ${ displaystyle MSE}$ je odchylka chyby převzatá z tabulky ANOVA a ${ displaystyle n}$ je velikost vzorku (počet pozorování ve vzorku). Pokud se porovnává pomocí nestejných velikostí vzorků ( ${ displaystyle {n_ {A}} neq {n_ {B}}}$ ), pak by vzorec Newman – Keuls byl upraven následovně:

{ displaystyle q = { frac {{ bar {X}} _ {A} - { bar {X}} _ {B}} { sqrt {{ frac {MSE} {2}} ({ frac {1} {n_ {A}}} + { frac {1} {n_ {B}}})}}}}}

kde ${ displaystyle n_ {A}}$ a ${ displaystyle n_ {B}}$ představují velikosti vzorku dvou vzorků. V obou případech MSE (Střední kvadratická chyba) je převzata z ANOVA provedené v první fázi analýzy.

Po výpočtu se vypočítá q hodnotu lze přirovnat k a q kritická hodnota (nebo ${ displaystyle q _ { alpha} , _ { nu} , _ {p}}$ ), který lze najít v a q distribuční tabulka založená na úroveň významnosti ( ${ displaystyle alpha}$ ), chyba stupně svobody ( ${ displaystyle nu}$ ) z tabulky ANOVA a rozsah ( ${ displaystyle p}$ ) vzorků, které mají být testovány.^[15] Pokud je počítáno q hodnota je rovna nebo větší než q kritická hodnota, pak nulová hypotéza (H₀: μ_A = μ_B) pro tento konkrétní rozsah prostředků lze odmítnout.^[15] Protože se počet prostředků v rozsahu mění s každým následným párovým srovnáním, kritická hodnota q Statistika se také mění s každým porovnáním, což činí metodu Neuman-Keuls mírnější a tím pádem výkonnější než test Tukeyova rozsahu. Pokud tedy bylo zjištěno, že párové srovnání je pomocí metody Newman-Keuls výrazně odlišné, nemusí se nutně významně lišit při analýze pomocí Tukeyova testu dosahu.^[7]^[15] Naopak, pokud bylo zjištěno, že párové srovnání není významně odlišné pomocí metody Newman-Keuls, nemůže se nijak významně lišit, když je testováno Tukeyovým testem rozsahu.^[7]

Omezení

Procedura Newman-Keuls nemůže vytvořit interval spolehlivosti pro každý střední rozdíl nebo pro přesné hodnoty p upravené pro multiplicitu kvůli jeho sekvenční povaze.^{[Citace je zapotřebí ]} Výsledky je poněkud obtížné interpretovat, protože je obtížné formulovat, jaké jsou nulové hypotézy, které byly testovány.^{[Citace je zapotřebí ]}

Viz také

Reference

^ ^A ^b ^C De Muth, James E. (2006). Základní statistiky a farmaceutické statistické aplikace (2. vyd.). Boca Raton, FL: Chapman and Hall / CRC. str. 229–259. ISBN 978-0-8493-3799-4.
^ Student (1927). „Chyby rutinní analýzy“. Biometrika. 19 (1/2): 151–164. doi:10.2307/2332181. JSTOR 2332181.
^ Newman, D. (1939). "Distribuce rozsahu ve vzorcích z normální populace, vyjádřená jako nezávislý odhad směrodatné odchylky". Biometrika. 31 (1): 20–30. doi:10.1093 / biomet / 31.1-2.20.
^ Keuls, M. (1952). „Použití„ studentizovaného rozsahu “ve spojení s analýzou rozptylu“ (PDF). Euphytica. 1 (2): 112–122. doi:10.1007 / bf01908269. Archivovány od originál (PDF) dne 04.11.2014.
^ Broota, K. D. (1989). Experimentální design v behaviorálním výzkumu (1. vyd.). Nové Dillí, Indie: New Age International (P) Ltd. s. 81–96. ISBN 978-81-224-0215-5.
^ ^A ^b Sheskin, David J. (1989). Příručka parametrických a neparametrických statistických postupů (3. vyd.). Boca Raton, FL: CRC Press. str. 665–756. ISBN 978-1-58488-440-8.
^ ^A ^b ^C Roberts, Maxwell; Russo, Riccardo (1999). "Sledování jednofaktorové ANOVA mezi subjekty". Příručka pro studenty k analýze odchylek. Filey, Velká Británie: J&L Composition Ltd. str. 82–109. ISBN 978-0-415-16564-8.
^ Tukey, J. W. (1952a). "Připomínkové listy pro Povolení pro různé typy chybovosti. Nepublikovaný rukopis". Brown, 1984.
^ Tukey, J. W. (1952b). "Připomínkové listy pro více srovnání. Nepublikovaný rukopis". Brown, 1984.
^ Tukey, J. W. (1953). "Problém vícenásobného srovnání. Nepublikovaný rukopis". Brown, 1984.
^ M. A. Seaman; J. R. Levin a R. C. Serlin (1991). „Nový vývoj v párových vícenásobných srovnáních: Některé výkonné a proveditelné postupy“. Psychologický bulletin. 110 (3): 577–586. doi:10.1037/0033-2909.110.3.577.
^ Benjamini, Y., Hochberg, Y. (1995). „Řízení rychlosti falešných objevů: nový a výkonný přístup k vícenásobnému testování“ (PDF). Journal of the Royal Statistical Society. Řada B (metodická). 57 (1): 289–300. doi:10.1111 / j.2517-6161.1995.tb02031.x. JSTOR 2346101.CS1 maint: více jmen: seznam autorů (odkaz)
^ Shaffer, Juliet P (2007). „Řízení rychlosti falešných objevů s omezeními: Newman – Keulsův test se vrátil“. Biometrický deník. 49 (1): 136–143. doi:10.1002 / bimj.200610297. PMID 17342955.
^ ^A ^b ^C Toothaker, Larry E. (1993). Vícenásobné srovnávací postupy (kvantitativní aplikace ve společenských vědách) (2. vyd.). Newburry Park, CA: Chapman and Hall / CRC. 27–45. ISBN 978-0-8039-4177-9.
^ ^A ^b ^C Zar, Jerrold H. (1999). Biostatistická analýza (4. vydání). Newburry Park, CA: Prentice Hall. 208–230. ISBN 978-0-13-081542-2.

[Muth-1] A ^b ^C De Muth, James E. (2006). Základní statistiky a farmaceutické statistické aplikace (2. vyd.). Boca Raton, FL: Chapman and Hall / CRC. str. 229–259. ISBN 978-0-8493-3799-4.

[Student-2] Student (1927). „Chyby rutinní analýzy“. Biometrika. 19 (1/2): 151–164. doi:10.2307/2332181. JSTOR 2332181.

[Newman-3] Newman, D. (1939). "Distribuce rozsahu ve vzorcích z normální populace, vyjádřená jako nezávislý odhad směrodatné odchylky". Biometrika. 31 (1): 20–30. doi:10.1093 / biomet / 31.1-2.20.

[Keuls-4] Keuls, M. (1952). „Použití„ studentizovaného rozsahu “ve spojení s analýzou rozptylu“ (PDF). Euphytica. 1 (2): 112–122. doi:10.1007 / bf01908269. Archivovány od originál (PDF) dne 04.11.2014.

[Broota-5] Broota, K. D. (1989). Experimentální design v behaviorálním výzkumu (1. vyd.). Nové Dillí, Indie: New Age International (P) Ltd. s. 81–96. ISBN 978-81-224-0215-5.

[Sheskin-6] A ^b Sheskin, David J. (1989). Příručka parametrických a neparametrických statistických postupů (3. vyd.). Boca Raton, FL: CRC Press. str. 665–756. ISBN 978-1-58488-440-8.

[Roberts_and_Russo-7] A ^b ^C Roberts, Maxwell; Russo, Riccardo (1999). "Sledování jednofaktorové ANOVA mezi subjekty". Příručka pro studenty k analýze odchylek. Filey, Velká Británie: J&L Composition Ltd. str. 82–109. ISBN 978-0-415-16564-8.

[1952a-8] Tukey, J. W. (1952a). "Připomínkové listy pro Povolení pro různé typy chybovosti. Nepublikovaný rukopis". Brown, 1984.

[1952b-9] Tukey, J. W. (1952b). "Připomínkové listy pro více srovnání. Nepublikovaný rukopis". Brown, 1984.

[1953a-10] Tukey, J. W. (1953). "Problém vícenásobného srovnání. Nepublikovaný rukopis". Brown, 1984.

[groups-11] M. A. Seaman; J. R. Levin a R. C. Serlin (1991). „Nový vývoj v párových vícenásobných srovnáních: Některé výkonné a proveditelné postupy“. Psychologický bulletin. 110 (3): 577–586. doi:10.1037/0033-2909.110.3.577.

[control-12] Benjamini, Y., Hochberg, Y. (1995). „Řízení rychlosti falešných objevů: nový a výkonný přístup k vícenásobnému testování“ (PDF). Journal of the Royal Statistical Society. Řada B (metodická). 57 (1): 289–300. doi:10.1111 / j.2517-6161.1995.tb02031.x. JSTOR 2346101.CS1 maint: více jmen: seznam autorů (odkaz)

[constrains-13] Shaffer, Juliet P (2007). „Řízení rychlosti falešných objevů s omezeními: Newman – Keulsův test se vrátil“. Biometrický deník. 49 (1): 136–143. doi:10.1002 / bimj.200610297. PMID 17342955.

[Toothaker-14] A ^b ^C Toothaker, Larry E. (1993). Vícenásobné srovnávací postupy (kvantitativní aplikace ve společenských vědách) (2. vyd.). Newburry Park, CA: Chapman and Hall / CRC. 27–45. ISBN 978-0-8039-4177-9.

[Zar-15] A ^b ^C Zar, Jerrold H. (1999). Biostatistická analýza (4. vydání). Newburry Park, CA: Prentice Hall. 208–230. ISBN 978-0-13-081542-2.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]