Test Siegel – Tukey - Siegel–Tukey test
![]() | tento článek potřebuje další citace pro ověření.Březen 2009) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
v statistika, Test Siegel – Tukey, pojmenoval podle Sidney Siegel a John Tukey, je neparametrický test které lze použít na údaje naměřené alespoň na pořadová stupnice. Testuje rozdíly v měřítku mezi dvěma skupinami.
Test se používá k určení, zda má jedna ze dvou skupin dat tendenci mít více rozptýlené hodnoty než druhá. Jinými slovy, test určuje, zda má jedna ze dvou skupin tendenci se pohybovat, někdy doprava, někdy doleva, ale od středu (ordinální stupnice).
Test byl publikován v roce 1960 autorem Sidney Siegel a John Wilder Tukey v Journal of the American Statistical Association, v článku „Neparametrický postup součtu hodnot pro relativní rozpětí v nepárových vzorcích.“
Zásada
Princip je založen na následující myšlence:
Předpokládejme, že existují dvě skupiny A a B. n pozorování pro první skupinu a m pozorování pro druhý (takže existují N = n + m celkem pozorování). Padám N pozorování jsou uspořádána vzestupně, lze očekávat, že hodnoty těchto dvou skupin budou náhodně smíchány nebo tříděny, pokud mezi oběma skupinami nejsou rozdíly (po nulová hypotéza H0). To by znamenalo, že mezi řadami extrémních (vysokých a nízkých) skóre by existovaly podobné hodnoty ze skupiny A a skupiny B.
Pokud by řekněme skupina A více inklinovala k extrémním hodnotám ( alternativní hypotéza H1), pak bude vyšší podíl pozorování ze skupiny A s nízkými nebo vysokými hodnotami a snížený podíl hodnot ve středu.
- Hypotéza H0: σ2A = σ2B & MěA = JáB (kde σ2 a já jsou rozptyl a medián)
- Hypotéza H1: σ2A > σ2B
Metoda
Dvě skupiny, A a B, produkují následující hodnoty (již seřazené vzestupně):
- A: 33 62 84 85 88 93 97 B: 4 16 48 51 66 98
Kombinací skupin se získá skupina 13 položek. Hodnocení se provádí pomocí alternativních extrémů (pořadí 1 je nejnižší, 2 a 3 jsou dva nejvyšší, 4 a 5 jsou dva další nejnižší atd.).
Skupina: | B | B | A | B | B | A | B | A | A | A | A | A | B | (zdroj hodnoty) |
Hodnota: | 4 | 16 | 33 | 48 | 51 | 62 | 66 | 84 | 85 | 88 | 93 | 97 | 98 | (seřazeno) |
Hodnost: | 1 | 4 | 5 | 8 | 9 | 12 | 13 | 11 | 10 | 7 | 6 | 3 | 2 | (alternativní extrémy) |
Součet pozic v každé W skupině:
- ŽA = 5 + 12 + 11 + 10 + 7 + 6 + 3 = 54
- ŽB = 1 + 4 + 8 + 9 + 13 + 2 = 37
Pokud je nulová hypotéza pravdivá, očekává se, že průměrné hodnosti obou skupin budou podobné.
Pokud je jedna ze dvou skupin více rozptýlená, její pozice budou nižší, protože extrémní hodnoty dostanou nižší pozice, zatímco druhá skupina obdrží více vysokých skóre přiřazených středu. Testování rozdílu mezi skupinami z hlediska významnosti a Wilcoxonův test součtu hodnot je použito, což také ospravedlňuje notaci WA a wB při výpočtu hodnotových součtů.
Ze součtu hodnot se statistiky U počítají odečtením minimálního možného skóre, n(n + 1) / 2 pro každou skupinu:[1]
- UA = 54 − 7(8)/2 = 26
- UB = 37 − 6(7)/2 = 16
Podle minimum z těchto dvou hodnot je distribuováno podle Wilcoxonova pořadí součtu s parametry danými dvěma velikostmi skupin:
Což umožňuje výpočet hodnoty p pro tento test podle následujícího vzorce:
ke zjištění statistické významnosti výsledků lze použít tabulku Wilcoxonova rozdělení součtu pořadí (viz Mann – Whitney_U_test další vysvětlení k těmto tabulkám).
U ukázkových dat je u skupin velikostí m = 6 an = 7 hodnota p:
což naznačuje malý nebo žádný důvod odmítnout nulovou hypotézu, že rozptyl obou skupin je stejný.
Viz také
Reference
- ^ Lehmann, Erich L., Neparametrics: Statistické metody založené na hodnostech, Springer, 2006, s. 9, 11–12.