Welchs t-test - Welchs t-test - Wikipedia
v statistika, Welch t-testnebo nerovné odchylky t-test, je dva vzorky test polohy který se používá k testování hypotézy, že dva populace mít stejné prostředky. Je pojmenován podle svého tvůrce, Bernard Lewis Welch a je adaptací Studentské t-test,[1] a je spolehlivější, když mají dva vzorky nerovnoměrné odchylky a / nebo nerovnoměrné velikosti vzorků.[2][3] Tyto testy se často označují jako „nepárové“ nebo „nezávislé vzorky“ t-testy, protože se obvykle používají, když se statistické jednotky, které jsou základem dvou porovnávaných vzorků, nepřekrývají. Vzhledem k tomu, že je to Welch t-test byl méně populární než Studentův t-test[2] a může být čtenářům méně známý, informativnější název je „Welchovy nerovné odchylky t-test "- nebo" nerovné odchylky t-test "pro stručnost.[3]
Předpoklady
Studentské t-test předpokládá, že výběrový průměr (statistika testu) dvou distribuovaných populačních distribucí je normálně distribuován se stejnou odchylkou. Welch t-test je určen pro nerovnoměrnou rozptyl distribuce vzorku, ale předpoklad normality distribuce vzorku je zachován[1]. Welch t-test je přibližné řešení k Behrens – Fisherův problém.
Výpočty
Welch t-test definuje statistiku t podle následujícího vzorce:
kde , a jsou průměr vzorku, vzorek standardní odchylka a velikost vzorku, respektive . Na rozdíl od v Studentské t-test, jmenovatelem je ne na základě a sdružená varianta odhad.
The stupně svobody spojené s tímto odhadem odchylky je aproximováno pomocí Welch – Satterthwaitova rovnice:
Tady , stupně volnosti spojené s prvním odhadem odchylky. , stupně volnosti spojené s odhadem 2. rozptylu.
Statistika je přibližně z t-distribuce protože máme aproximaci distribuce chí-kvadrát. Tuto aproximaci je lepší provést, když obojí a jsou větší než 5.[4][5]
Statistický test
Jednou t a byly vypočítány, lze tyto statistiky použít s t-rozdělení otestovat jeden ze dvou možných nulové hypotézy:
- že tyto dva populační prostředky jsou stejné, ve kterém a dvoustranný test je použito; nebo
- že jeden z populačních prostředků je větší nebo roven druhému, ve kterém a jednostranný test je použito.
Přibližné stupně volnosti jsou zaokrouhleny dolů na nejbližší celé číslo.[Citace je zapotřebí ]
Výhody a omezení
Welch t-test je robustnější než Studentův t-testovat a udržovat chybovost typu I. téměř nominální pro nerovné odchylky a pro nerovné velikosti vzorků za normálních podmínek. Kromě toho Napájení Welchova t-test se blíží tomu Studentovu t-test, i když jsou odchylky populace stejné a velikosti vzorků jsou vyvážené.[2] Welch t-test lze zobecnit na více než 2 vzorky,[6] což je robustnější než jednosměrná analýza rozptylu (ANOVA).
to je nedoporučeno předběžně otestovat stejné odchylky a poté zvolit mezi Studentovými t-test nebo Welchův t-test.[7] Spíše Welch t-test lze aplikovat přímo a bez jakýchkoli podstatných nevýhod na Studentův t-test, jak je uvedeno výše. Welch t-test zůstává robustní pro šikmé distribuce a velké velikosti vzorků.[8] Spolehlivost klesá u zkosených distribucí a menších vzorků, kde by člověk mohl provádět Welchovo t-test.[9]
Příklady
Následující tři příklady porovnávají Welchův t-test a student t-test. Vzorky pocházejí z náhodných normálních distribucí pomocí Programovací jazyk R..
U všech tří příkladů byly populační prostředky a .
První příklad je pro stejné odchylky () a stejné velikosti vzorku (). Nechť A1 a A2 označují dva náhodné vzorky:
Druhý příklad je určen pro nerovné odchylky (, ) a nerovné velikosti vzorků (, ). Menší vzorek má větší rozptyl:
Třetí příklad je pro nerovné odchylky (, ) a nerovné velikosti vzorků (, ). Větší vzorek má větší rozptyl:
Referenční hodnoty p byly získány simulací distribucí t statistika pro nulovou hypotézu průměrných populačních průměrů (). Výsledky jsou shrnuty v tabulce níže s dvoustrannými hodnotami p:
Ukázka A1 | Ukázka A2 | Studentské t-test | Welch t-test | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Příklad | ||||||||||||||
1 | 15 | 20.8 | 7.9 | 15 | 23.0 | 3.8 | −2.46 | 28 | 0.021 | 0.021 | −2.46 | 24.9 | 0.021 | 0.017 |
2 | 10 | 20.6 | 9.0 | 20 | 22.1 | 0.9 | −2.10 | 28 | 0.045 | 0.150 | −1.57 | 9.9 | 0.149 | 0.144 |
3 | 10 | 19.4 | 1.4 | 20 | 21.6 | 17.1 | −1.64 | 28 | 0.110 | 0.036 | −2.22 | 24.5 | 0.036 | 0.042 |
Welch t-test a student t-test poskytl stejné výsledky, když mají dva vzorky identické odchylky a velikosti vzorků (příklad 1). Ale vezměte na vědomí, že pokud vzorkujete data z populací se stejnými odchylkami, budou se rozptyly vzorků lišit, stejně jako výsledky dvou t-testů. Takže se skutečnými údaji budou tyto dva testy téměř vždy poskytovat poněkud odlišné výsledky.
Pro nerovné odchylky, Student's t-test poskytl nízkou hodnotu p, když měl menší vzorek větší rozptyl (příklad 2) a vysokou hodnotu p, když měl větší vzorek větší rozptyl (příklad 3). Pro nerovné odchylky, Welch's t-test dal p-hodnoty blízké simulovaným p-hodnotám.
Softwarové implementace
Jazyk / Program | Funkce | Dokumentace |
---|---|---|
LibreOffice | TTEST (Data1; Data2; Režim; Typ) | [10] |
MATLAB | ttest2 (data1, data2, 'Vartype', 'nerovné') | [11] |
Microsoft Excel před rokem 2010 | TTEST (pole1, pole2, ocasy, typ) | [12] |
Microsoft Excel 2010 a novější | T.TEST (pole1, pole2, ocasy, typ) | [13] |
Minitab | Přístup přes menu | [14] |
SAS (software) | Výchozí výstup z otestovat (označeno „Satterthwaite“) | |
Krajta | scipy.stats.ttest_ind (A, b, equal_var = False) | [15] |
R | t.test (data1, data2, alternative = "two.sided", var.equal = FALSE) | [16] |
Haskell | Statistics.Test.StudentT.welchTTest SamplesDiffer data1 data2 | [17] |
JMP | Jednosměrný (Y (YColumn), X (XColumn), Nerovné varianty (1)); | [18] |
Julie | UnequalVarianceTTest (data1, data2) | [19] |
Stata | test varname1 == varname2, welch | [20] |
Tabulky Google | TTEST (rozsah1, rozsah2, ocasy, typ) | [21] |
GraphPad Prism | Je to volba v testovacím dialogu. | |
Statistiky IBM SPSS | Možnost v nabídce | [22][23] |
GNU oktáva | welch_test (x, y) | [24] |
Viz také
- Studentské t-test
- Z-test
- Faktoriální experiment
- Jednosměrná analýza rozptylu
- Statistika Hotellingu se dvěma vzorky ve tvaru T na druhou, vícerozměrné rozšíření Welch's t-test
Reference
- ^ A b Welch, B.L. (1947). "Zobecnění" Studentova "problému, když se jedná o několik různých populačních odchylek." Biometrika. 34 (1–2): 28–35. doi:10.1093 / biomet / 34.1-2.28. PAN 0019277. PMID 20287819.
- ^ A b C Ruxton, G. D. (2006). „Nerovný rozptylový t-test je nedostatečně využívanou alternativou Studentova t-testu a Mann-Whitneyova testu“. Ekologie chování. 17 (4): 688–690. doi:10.1093 / beheco / ark016.
- ^ A b Derrick, B; Toher, D; White, P (2016). „Proč je test Welchs robustní s chybou typu I“ (PDF). Kvantitativní metody pro psychologii. 12 (1): 30–38. doi:10.20982 / tqmp.12.1.p030.
- ^ Satterthwaitův vzorec pro stupně svobody v t-testu se dvěma vzorky (strana 7)
- ^ Yates, Moore a Starnes, The Practice of Statistics, 3. vydání, str. 792. Copyright 2008 W.H. Freeman and Company, 41 Madison Avenue, New York, NY 10010
- ^ Welch, B.L. (1951). „O srovnání několika středních hodnot: alternativní přístup“. Biometrika. 38 (3/4): 330–336. doi:10.2307/2332579. JSTOR 2332579.
- ^ Zimmerman, D. W. (2004). "Poznámka k předběžným testům rovnosti odchylek". Britský žurnál matematické a statistické psychologie. 57: 173–181. doi:10.1348/000711004849222.
- ^ Fagerland, M. W. (2012). „t-testy, neparametrické testy a velké studie - paradox statistické praxe?“. Metodika lékařského výzkumu BMC. 12: 78. doi:10.1186/1471-2288-12-78. PMC 3445820. PMID 22697476.
- ^ Fagerland, M. W .; Sandvik, L. (2009). "Výkon pěti testů umístění dvou vzorků pro šikmé distribuce s nerovnoměrnými odchylkami". Současné klinické studie. 30 (5): 490–496. doi:10.1016 / j.cct.2009.06.007.
- ^ https://help.libreoffice.org/Calc/Statistical_Functions_Part_Five#TTEST
- ^ http://uk.mathworks.com/help/stats/ttest2.html
- ^ http://office.microsoft.com/en-us/excel-help/ttest-HP005209325.aspx
- ^ http://office.microsoft.com/en-us/excel-help/t-test-function-HA102753135.aspx
- ^ Přehled pro 2-ukázkový t - Minitab: - oficiální dokumentace pro Minitab verze 18. Zpřístupněno 19. 9. 2020.
- ^ http://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.ttest_ind.html
- ^ https://stat.ethz.ch/R-manual/R-devel/library/stats/html/t.test.html
- ^ http://hackage.haskell.org/package/statistics-0.15.0.0/docs/Statistics-Test-StudentT.html
- ^ https://www.jmp.com/support/help/
- ^ http://hypothesistestsjl.readthedocs.org/en/latest/index.html
- ^ http://www.stata.com/help.cgi?ttest
- ^ https://support.google.com/docs/answer/6055837?hl=cs
- ^ Jeremy Miles: Nerovnoměrné odchylky t-test nebo U Mann-Whitneyův test?, Zpřístupněno 11. 4. 2014
- ^ Test jednoho vzorku - Oficiální dokumentace pro statistiku SPSS verze 24. Zpřístupněno 22. 1. 2019.
- ^ https://octave.sourceforge.io/statistics/function/welch_test.html