Jednosměrná analýza rozptylu - One-way analysis of variance
v statistika, jednosměrný analýza rozptylu (zkráceně jednosměrná ANOVA) je technika, kterou lze použít k porovnání průměrů dvou nebo více vzorků (pomocí F distribuce ). Tuto techniku lze použít pouze pro numerická data odezvy, „Y“, obvykle jednu proměnnou, a numerická nebo (obvykle) kategorická vstupní data, „X“, vždy jedna proměnná, tedy „jednosměrná“.[1]
ANOVA testuje nulová hypotéza, který uvádí, že vzorky ve všech skupinách jsou odebírány z populací se stejnými průměrnými hodnotami. K tomu jsou provedeny dva odhady populační odchylky. Tyto odhady se opírají o různé předpoklady (viz. níže ). ANOVA produkuje F-statistiku, poměr rozptylu vypočítaného mezi průměrem k rozptylu ve vzorcích. Pokud jsou průměrné hodnoty skupiny čerpány z populací se stejnými průměrnými hodnotami, měla by být rozptyl mezi průměrnými hodnotami skupiny nižší než rozptyl vzorků po teorém centrálního limitu. Vyšší poměr tedy znamená, že vzorky byly odebrány z populací s různými průměrnými hodnotami.[1]
Typicky se však jednosměrná ANOVA používá k testování rozdílů mezi nejméně třemi skupinami, protože případ dvou skupin lze pokrýt t-test (Gosset, 1908). Pokud existují pouze dva způsoby porovnání, pak t-test a F-test jsou ekvivalentní; vztah mezi ANOVA a t darováno F = t2. Rozšíření jednosměrné ANOVA je obousměrná analýza rozptylu který zkoumá vliv dvou různých kategorických nezávislých proměnných na jednu závislou proměnnou.
Předpoklady
Výsledky jednosměrné ANOVA lze považovat za spolehlivé, pokud jsou splněny následující předpoklady:
- Proměnná odezvy zbytky jsou normálně distribuováno (nebo přibližně normálně distribuované).
- Rozdíly populací jsou stejné.
- Odpovědi pro danou skupinu jsou nezávislé a identicky distribuované normální náhodné proměnné (ne a jednoduchý náhodný vzorek (SRS)).
Pokud jsou data pořadové číslo, měla by být použita neparametrická alternativa k tomuto testu, jako je Kruskal – Wallisova jednosměrná analýza rozptylu. Pokud není známo, že by odchylky byly stejné, zobecnění 2-vzorku Welchův t-test může být použito.[2]
Odchylky od normality populace
ANOVA je relativně robustní postup, pokud jde o porušení předpokladu normality.[3]
Jednosměrná ANOVA může být zobecněna na faktoriální a vícerozměrné rozložení, stejně jako na analýzu kovariance.[je zapotřebí objasnění ]
V populární literatuře se často uvádí, že nic z toho F-testy jsou robustní pokud dojde k závažnému porušení předpokladu, že každá populace dodržuje normální distribuce, zejména pro malé úrovně alfa a nevyvážené rozvržení.[4] Dále se rovněž tvrdí, že pokud je základním předpokladem homoscedasticity je porušena, Chyba typu I. vlastnosti degenerují mnohem vážněji.[5]
Jedná se však o mylnou představu založenou na práci provedené v padesátých letech a dříve. Prvním komplexním vyšetřováním této záležitosti simulací Monte Carlo byl Donaldson (1966).[6] Ukázal, že při obvyklých odchylkách (pozitivní odchylka, nerovné odchylky) „ F-test je konzervativní ", a proto je méně pravděpodobné, než by mělo být, aby se zjistilo, že proměnná je významná. Jak se však zvětšuje buď velikost vzorku nebo počet buněk," zdá se, že výkonové křivky konvergují k tomu na základě normální rozdělení ". Tiku (1971) zjistil, že„ nenormální teoretická síla F bylo zjištěno, že se liší od síly normální teorie korekčním členem, který prudce klesá s rostoucí velikostí vzorku. “[7] Problém nenormality, zejména u velkých vzorků, je mnohem méně závažný, než by naznačovaly populární články.
Současný názor je, že „Studie Monte-Carlo byly rozsáhle používány s testy založenými na normálním rozdělení, aby se zjistilo, jak jsou citlivé na porušení předpokladu normálního rozdělení analyzovaných proměnných v populaci. Obecný závěr z těchto studií je, že důsledky takových porušení jsou méně závažné, než se dříve myslelo. Ačkoli by tyto závěry neměly nikoho úplně odradit od obav z předpokladu normality, zvýšily celkovou popularitu statistických testů závislých na distribuci ve všech oblastech výzkumu. “[8]
Neparametrické alternativy ve faktoriálním rozvržení viz Sawilowsky.[9] Další diskuse viz ANOVA v řadách.
Případ fixních efektů, plně randomizovaný experiment, nevyvážená data
Model
Normální lineární model popisuje skupiny ošetření s distribucí pravděpodobnosti, které jsou identickými křivkami ve tvaru zvonu (normální) s různými prostředky. Přizpůsobení modelů tedy vyžaduje pouze prostředky každé léčené skupiny a výpočet rozptylu (použije se průměrná odchylka v rámci léčených skupin). Výpočty průměrů a rozptylu se provádějí jako součást testu hypotézy.
Běžně používané normální lineární modely pro zcela randomizovaný experiment jsou:[10]
- (model prostředků)
nebo
- (model efektů)
kde
- je index nad experimentálními jednotkami
- je index nad léčenými skupinami
- je počet experimentálních jednotek v j. léčené skupině
- je celkový počet experimentálních jednotek
- jsou pozorování
- je průměr z pozorování pro j. léčenou skupinu
- je hlavní průměr pozorování
- je j-tý efekt léčby, odchylka od velkého průměru
- , jsou obvykle distribuovány s nulovou střední hodnotou náhodných chyb.
Index přes experimentální jednotky lze interpretovat několika způsoby. V některých experimentech je stejná experimentální jednotka podrobena řadě ošetření; může ukazovat na konkrétní jednotku. V ostatních má každá skupina léčby odlišnou sadu experimentálních jednotek; může jednoduše být indexem do -tý seznam.
Údaje a statistické souhrny údajů
Jedna forma organizace experimentálních pozorování je se skupinami ve sloupcích:
Seznam skupinových pozorování | ||||||||
---|---|---|---|---|---|---|---|---|
1 | ||||||||
2 | ||||||||
3 | ||||||||
Souhrnná statistika skupiny | Velká souhrnná statistika | |||||||
# Pozorováno | # Pozorováno | |||||||
Součet | Součet | |||||||
Součet | Součet | |||||||
Znamenat | Znamenat | |||||||
Rozptyl | Rozptyl |
Porovnání modelu se souhrny: a . Velký průměr a velká odchylka se počítají z velkých součtů, nikoli ze skupinových průměrů a odchylek.
Test hypotézy
Vzhledem k souhrnným statistikám jsou výpočty testu hypotéz uvedeny v tabulkové formě. I když jsou pro vysvětlující hodnotu zobrazeny dva sloupce SS, k zobrazení výsledků je vyžadován pouze jeden sloupec.
Zdroj obměny | Součty čtverců | Součty čtverců | Stupně svobody | Střední čtverec | F |
---|---|---|---|---|---|
Vysvětlující SS[11] | Výpočetní SS[12] | DF | SLEČNA | ||
Ošetření | |||||
Chyba | |||||
Celkový |
je odhad odchylky odpovídající modelu.
Shrnutí analýzy
Základní analýza ANOVA se skládá z řady výpočtů. Údaje jsou shromažďovány v tabulkové formě. Pak
- Každá léčená skupina je shrnuta počtem experimentálních jednotek, dvěma součty, průměrem a rozptylem. Souhrny léčebných skupin jsou kombinovány, aby poskytly součty pro počet jednotek a součty. Velký průměr a velký rozptyl se počítají z velkých součtů. Léčba a velké prostředky jsou použity v modelu.
- Ze souhrnů se počítají tři DF a SS. Poté se vypočítají MS a poměr určí F.
- Počítač typicky určuje p-hodnotu z F, která určuje, zda léčba produkuje významně odlišné výsledky. Pokud je výsledek významný, pak má model prozatímně platnost.
Pokud je experiment vyvážený, všechny termíny jsou stejné, takže SS rovnice se zjednodušují.
Ve složitějším experimentu, kde experimentální jednotky (nebo vlivy prostředí) nejsou homogenní, se při analýze používají také statistické řádky. Model zahrnuje pojmy závislé na . Stanovení dalších podmínek snižuje počet dostupných stupňů volnosti.
Příklad
Zvažte experiment ke studiu vlivu tří různých úrovní faktoru na reakci (např. Tři úrovně hnojiva na růst rostlin). Pokud bychom měli 6 pozorování pro každou úroveň, mohli bychom výsledek experimentu napsat do takové tabulky, kde A1, A2, a A3 jsou tři úrovně studovaného faktoru.
A1 A2 A3 6 8 13 8 12 9 4 9 11 5 11 8 3 6 7 4 8 12
Nulová hypotéza označená H0, celkově F-test pro tento experiment by byl takový, že všechny tři úrovně faktoru produkují v průměru stejnou odezvu. Pro výpočet F-poměr:
Krok 1: Vypočítejte průměr v každé skupině:
Krok 2: Vypočítejte celkový průměr:
- kde A je počet skupin.
Krok 3: Vypočítejte součet čtvercových rozdílů mezi skupinami:
kde n je počet hodnot dat na skupinu.
Stupně volnosti mezi skupinami jsou o jeden menší než počet skupin
střední hodnota čtverce mezi skupinami je
Krok 4: Vypočítejte součet čtverců v rámci skupiny. Začněte vycentrováním dat v každé skupině
A1 | A2 | A3 |
---|---|---|
6−5=1 | 8−9=−1 | 13−10=3 |
8−5=3 | 12−9=3 | 9−10=−1 |
4−5=−1 | 9−9=0 | 11−10=1 |
5−5=0 | 11−9=2 | 8−10=−2 |
3−5=−2 | 6−9=−3 | 7−10=−3 |
4−5=−1 | 8−9=−1 | 12−10=2 |
Součet čtverců v rámci skupiny je součtem čtverců všech 18 hodnot v této tabulce
Stupně svobody uvnitř skupiny jsou
Střední hodnota čtverce ve skupině je tedy
Krok 5: The F- poměr je
Kritická hodnota je počet, který musí statistika testu překročit, aby byl test odmítnut. V tomto případě, Fkrit(2,15) = 3,68 v α = 0,05. Od té doby F= 9,3> 3,68, výsledky jsou významný na 5% hladině významnosti. Jeden by odmítl nulovou hypotézu se závěrem, že existují silné důkazy o tom, že očekávané hodnoty ve třech skupinách se liší. The p-hodnota pro tento test je 0,002.
Po provedení F-test, je běžné provádět nějakou „post-hoc“ analýzu skupinových prostředků. V tomto případě se první dva skupinové prostředky liší o 4 jednotky, první a třetí skupina se liší o 5 jednotek a druhé a třetí skupiny se liší pouze o 1 jednotku. The standardní chyba každého z těchto rozdílů je . První skupina se tedy výrazně liší od ostatních skupin, protože průměrný rozdíl je vícekrát standardní chybou, takže si můžeme být velmi jisti, že průměr populace první skupiny se liší od populačních průměrů ostatních skupin. Neexistují však důkazy o tom, že by druhá a třetí skupina měly navzájem odlišné populační prostředky, protože jejich průměrný rozdíl jedné jednotky je srovnatelný se standardní chybou.
Poznámka F(X, y) označuje F-rozdělení kumulativní distribuční funkce s X stupně volnosti v čitateli a y stupně volnosti ve jmenovateli.
Viz také
- Analýza rozptylu
- F test (Zahrnuje jednosměrný příklad ANOVA)
- Smíšený model
- Vícerozměrná analýza rozptylu (MANOVA)
- Opakovaná opatření ANOVA
- Obousměrná ANOVA
- Welchův t-test
Poznámky
- ^ A b Howell, David (2002). Statistické metody pro psychologii. Duxbury. str.324–325. ISBN 0-534-37770-X.
- ^ Welch, B.L. (1951). „O srovnání několika středních hodnot: alternativní přístup“. Biometrika. 38 (3/4): 330–336. doi:10.2307/2332579. JSTOR 2332579.
- ^ Kirk, RE (1995). Experimentální design: Postupy pro behaviorální vědy (3. vyd.). Pacific Grove, CA, USA: Brooks / Cole.
- ^ Blair, R. C. (1981). „Reakce na„ Důsledky nesplnění předpokladů, z nichž vychází analýza fixních účinků rozptylu a kovariance.'". Recenze pedagogického výzkumu. 51 (4): 499–507. doi:10.3102/00346543051004499.
- ^ Randolf, E. A .; Barcikowski, R. S. (1989). "Míra chyb typu I, když jsou skutečné hodnoty studie použity jako parametry populace ve studii Monte Carlo". Příspěvek prezentovaný na 11. výročním zasedání Mid-Western Educational Research Association v Chicagu.
- ^ Donaldson, Theodore S. (1966). „Síla F-testu pro nenormální distribuce a nerovnoměrné odchylky chyb“. Papír připravený pro projekt vzdušných sil Spojených států RAND.
- ^ Tiku, M. L. (1971). "Výkonová funkce F-Test v neobvyklých situacích “. Journal of the American Statistical Association. 66 (336): 913–916. doi:10.1080/01621459.1971.10482371.
- ^ „Archivovaná kopie“. Archivovány od originál dne 04.12.2018. Citováno 2016-09-22.CS1 maint: archivovaná kopie jako titul (odkaz)
- ^ Sawilowsky, S. (1990). "Neparametrické testy interakce v experimentálním designu". Recenze pedagogického výzkumu. 60 (1): 91–126. doi:10.3102/00346543060001091.
- ^ Montgomery, Douglas C. (2001). Návrh a analýza experimentů (5. vydání). New York: Wiley. p. Oddíl 3–2. ISBN 9780471316497.
- ^ Moore, David S .; McCabe, George P. (2003). Úvod do praxe statistiky (4. vydání). W H Freeman & Co. str. 764. ISBN 0716796570.
- ^ Winkler, Robert L .; Hays, William L. (1975). Statistika: Pravděpodobnost, závěr a rozhodnutí (2. vyd.). New York: Holt, Rinehart a Winston. p.761.
Další čtení
- George Casella (18. dubna 2008). Statistický návrh. Springer. ISBN 978-0-387-75965-4.