Wilcoxonův podepsaný test - Wilcoxon signed-rank test
The Wilcoxonův podepsaný test je neparametrické statistický test hypotéz slouží k porovnání dvou souvisejících vzorků, spárovaných vzorků nebo opakovaných měření na jednom vzorku k posouzení, zda se jejich průměrné hodnoty populace liší (tj. párový test rozdílu ). Může být použit jako alternativa k spárovaný Student t-test (také známý jako "t-test pro uzavřené páry "nebo"t-test pro závislé vzorky "), když nelze předpokládat rozdělení rozdílu mezi průměrem dvou vzorků normálně distribuováno.[1] Wilcoxonův test se znaménkem je neparametrický test, který lze použít k určení, zda byly vybrány dva závislé vzorky z populací se stejnou distribucí.
Dějiny
Test je pojmenován pro Frank Wilcoxon (1892–1965), který v jednom příspěvku navrhl jak on, tak i hodnostní součet pro dva nezávislé vzorky (Wilcoxon, 1945).[2] Test byl zpopularizován Sidney Siegel (1956) ve své vlivné učebnici neparametrických statistik.[3] Symbol použil Siegel T pro hodnotu související s, ale ne stejnou jako, . V důsledku toho se test někdy označuje jako Wilcoxon T testa statistika testu se uvádí jako hodnota T.
Předpoklady
- Data jsou spárována a pocházejí ze stejné populace.
- Každý pár je vybrán náhodně a nezávisle[Citace je zapotřebí ].
- Data jsou měřena alespoň na intervalová stupnice když, jak obvykle, v páru rozdíly jsou vypočteny k provedení testu (i když stačí, že srovnání v páru jsou na pořadová stupnice ).
Postup zkoušky
Nechat být velikost vzorku, tj. počet párů. Existuje tedy celkem 2N datové body. Pro páry , nechť a označte měření.
- H0: Rozdíl mezi páry následuje a symetrické rozdělení kolem nuly
- H1: rozdíl mezi páry nenásleduje symetrické rozdělení kolem nuly.
- Pro , vypočítat a , kde je znaková funkce.
- Vyloučit páry pomocí . Nechat být zmenšená velikost vzorku.
- Objednejte zbývající páry od nejmenšího absolutního rozdílu po největší absolutní rozdíl, .
- Hodnost páry, počínaje párem s nejmenším nenulovým absolutním rozdílem jako 1. Kravaty dostávají hodnost rovnající se průměru řad, které překlenují. Nechat označit hodnost.
- Vypočítejte statistika testu
- , součet podepsaných řad.
- Podle nulové hypotézy sleduje konkrétní distribuci bez jednoduchého výrazu. Tato distribuce má očekávaná hodnota 0 a rozptyl z .
- lze porovnat s kritickou hodnotou z referenční tabulky.[4]
- Oboustranný test spočívá v odmítnutí -li .
- Tak jako zvyšuje, distribuce vzorkování konverguje k normálnímu rozdělení. Tím pádem,
- Pro je třeba použít přesnou distribuci.
Příklad
| pořadí podle absolutního rozdílu |
|
je znaková funkce, je absolutní hodnota, a je hodnost. Všimněte si, že páry 3 a 9 jsou svázány v absolutní hodnotě. Byly by hodnoceny na 1 a 2, takže každý dostane průměr z těchto řad, 1,5.
- [5]
- že dva mediány jsou stejné.
- The -hodnota tohoto výsledku je
Historický T statistický
V historických pramenech jiná statistika, kterou Siegel označil jako T statistika, byla použita. The T statistika je menší ze dvou součtů řad daného znaménka; v příkladu tedy T by se rovnal 3 + 4 + 5 + 6 = 18. Nízké hodnoty T jsou vyžadovány pro význam. T je snadnější vypočítat ručně než Ž a zkouška je rovnocenná s výše popsanou oboustrannou zkouškou; nicméně, rozdělení statistiky pod je třeba upravit.
- že dva mediány jsou stejné.
Poznámka: Kritická T hodnoty () hodnotami lze nalézt v přílohách učebnic statistik, například v tabulce B-3 Neparametrické statistiky: podrobný přístup, 2. vydání, autorů Dale I. Foreman a Gregory W. Corder (https://www.oreilly.com/library/view/nonparametric-statistics-a/9781118840429/bapp02.xhtml ).
Alternativně, pokud n je dostatečně velký, distribuce T pod lze aproximovat normálním rozdělením se střední hodnotou a rozptyl .
Omezení
Jak je ukázáno v příkladu, když je rozdíl mezi skupinami nula, pozorování se zahodí. To je obzvláště důležité, pokud jsou vzorky odebrány z diskrétní distribuce. V těchto scénářích poskytuje modifikace Wilcoxonova testu Prattem 1959 alternativu, která zahrnuje nulové rozdíly.[6][7] Tato modifikace je robustnější pro data v pořadovém měřítku.[7]
Velikost efektu
Vypočítat velikost efektu pro test se znaménkem lze použít rank-biserial korelace.
Pokud je statistika testu Ž Pokud je hlášeno, korelační hodnost r se rovná statistice testu Ž děleno celkovým součtem hodnot Snebor = Ž/S.[8] Pomocí výše uvedeného příkladu je statistika testu Ž = 9. Velikost vzorku 9 má celkový součet pořadí S = (1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9) = 45. Proto je korelační hodnost 9/45, takže r = 0.20.
Pokud je statistika testu T je ekvivalentní způsob, jak vypočítat korelaci pořadí, s rozdílem v poměru mezi dvěma součty pořadí, což je jednoduchý rozdílový vzorec Kerby (2014).[8] Chcete-li pokračovat v aktuálním příkladu, velikost vzorku je 9, takže celkový součet je 45. T je menší ze dvou hodnotových součtů, takže T je 3 + 4 + 5 + 6 = 18. Pouze z této informace lze vypočítat zbývající součet hodnot, protože se jedná o celkový součet S mínus T, nebo v tomto případě 45 - 18 = 27. Dále jsou dva podíly součtu hodnot 27/45 = 60% a 18/45 = 40%. Nakonec je korelace pořadí rozdílem mezi těmito dvěma proporcemi (0,60 minus 0,40) r = .20.
Softwarové implementace
- R zahrnuje implementaci testu jako
wilcox.test (x, y, paired = TRUE)
, kde x a y jsou vektory stejné délky.[9] - ALGLIB zahrnuje implementaci Wilcoxon podepsaného testu v C ++, C #, Delphi, Visual Basic atd.
- GNU oktáva implementuje různé jednostranné a dvoustranné verze testu v
wilcoxon_test
funkce. - SciPy zahrnuje implementaci Wilcoxonova testu se znaménkem v Pythonu
- Accord.NET zahrnuje implementaci Wilcoxon podepsaného testu v C # pro aplikace .NET
- MATLAB implementuje tento test pomocí „Wilcoxonova testu součtu hodnot“, protože [p, h] = signrank (x, y) také vrací logickou hodnotu označující rozhodnutí o testu. Výsledek h = 1 naznačuje odmítnutí nulové hypotézy a h = 0 označuje selhání odmítnutí nulové hypotézy na 5% hladině významnosti
- Julie Balíček HypothesisTests obsahuje test Wilcoxon se znaménkem jako „hodnota (SignedRankTest (x, y))“
Viz také
- Mann – Whitney – Wilcoxonův test (varianta pro dva nezávislé vzorky)
- Podepsat test (Jako Wilcoxonův test, ale bez předpokladu symetrického rozdělení rozdílů kolem mediánu a bez použití velikosti rozdílu)
Reference
- ^ „Paired t – test - Handbook of Biological Statistics“. www.biostathandbook.com. Citováno 2019-11-18.
- ^ Wilcoxon, Frank (prosinec 1945). „Individuální srovnání podle metod hodnocení“ (PDF). Bulletin o biometrii. 1 (6): 80–83. doi:10.2307/3001968. hdl:10338.dmlcz / 135688. JSTOR 3001968.
- ^ Siegel, Sidney (1956). Neparametrické statistiky pro behaviorální vědy. New York: McGraw-Hill. str. 75–83. ISBN 9780070573482.
- ^ Lowry, Richarde. „Koncepty a aplikace inferenční statistiky“. Citováno 5. listopadu 2018.
- ^ „Tabulka se znaménkem Wilcoxon | Skutečné statistiky pomocí aplikace Excel“. Citováno 2020-08-10.
- ^ Pratt, J (1959). "Poznámky k nulám a vazbám ve Wilcoxonově podepsaném hodnostním postupu". Journal of the American Statistical Association. 54 (287): 655–667. doi:10.1080/01621459.1959.10501526.
- ^ A b Derrick, B; White, P (2017). "Porovnání dvou vzorků z individuální Likertovy otázky". International Journal of Mathematics and Statistics. 18 (3): 1–13.
- ^ A b Kerby, Dave S. (2014), „Vzorec jednoduchého rozdílu: Přístup k výuce neparametrické korelace.“, Komplexní psychologie, 3: 11.IT.3.1, doi:10.2466 / 11.IT.3.1
- ^ Dalgaard, Peter (2008). Úvodní statistika s R.. Springer Science & Business Media. 99–100. ISBN 978-0-387-79053-4.
externí odkazy
- Wilcoxonův podepsaný test v R
- Příklad použití testu Wilcoxon se znaménkem
- Online verze testu
- Tabulka kritických hodnot pro Wilcoxonův test se znaménkem
- Stručný průvodce experimentálního psychologa Karla L. Weunscha - Odhady velikosti neparametrických efektů (Copyright 2015 by Karl L. Weunsch)
- Kerby, D. S. (2014). Jednoduchý rozdílový vzorec: Přístup k výuce neparametrické korelace. Komplexní psychologie, svazek 3, článek 1. doi: 10,2466 / 11.IT.3.1. odkaz na článek