Test Siegel – Tukey - Siegel–Tukey test

v statistika, Test Siegel – Tukey, pojmenoval podle Sidney Siegel a John Tukey, je neparametrický test které lze použít na údaje naměřené alespoň na pořadová stupnice. Testuje rozdíly v měřítku mezi dvěma skupinami.

Test se používá k určení, zda má jedna ze dvou skupin dat tendenci mít více rozptýlené hodnoty než druhá. Jinými slovy, test určuje, zda má jedna ze dvou skupin tendenci se pohybovat, někdy doprava, někdy doleva, ale od středu (ordinální stupnice).

Test byl publikován v roce 1960 autorem Sidney Siegel a John Wilder Tukey v Journal of the American Statistical Association, v článku „Neparametrický postup součtu hodnot pro relativní rozpětí v nepárových vzorcích.“

Zásada

Princip je založen na následující myšlence:

Předpokládejme, že existují dvě skupiny A a B. n pozorování pro první skupinu a m pozorování pro druhý (takže existují N = n + m celkem pozorování). Padám N pozorování jsou uspořádána vzestupně, lze očekávat, že hodnoty těchto dvou skupin budou náhodně smíchány nebo tříděny, pokud mezi oběma skupinami nejsou rozdíly (po nulová hypotéza H₀). To by znamenalo, že mezi řadami extrémních (vysokých a nízkých) skóre by existovaly podobné hodnoty ze skupiny A a skupiny B.

Pokud by řekněme skupina A více inklinovala k extrémním hodnotám ( alternativní hypotéza H₁), pak bude vyšší podíl pozorování ze skupiny A s nízkými nebo vysokými hodnotami a snížený podíl hodnot ve středu.

Hypotéza H₀: σ²_A = σ²_B & Mě_A = Já_B (kde σ² a já jsou rozptyl a medián)
Hypotéza H₁: σ²_A > σ²_B

Metoda

Dvě skupiny, A a B, produkují následující hodnoty (již seřazené vzestupně):

A: 33 62 84 85 88 93 97 B: 4 16 48 51 66 98

Kombinací skupin se získá skupina 13 položek. Hodnocení se provádí pomocí alternativních extrémů (pořadí 1 je nejnižší, 2 a 3 jsou dva nejvyšší, 4 a 5 jsou dva další nejnižší atd.).

Skupina:	B	B	A	B	B	A	B	A	A	A	A	A	B	(zdroj hodnoty)
Hodnota:	4	16	33	48	51	62	66	84	85	88	93	97	98	(seřazeno)
Hodnost:	1	4	5	8	9	12	13	11	10	7	6	3	2	(alternativní extrémy)

Součet pozic v každé W skupině:

Ž_A = 5 + 12 + 11 + 10 + 7 + 6 + 3 = 54

Ž_B = 1 + 4 + 8 + 9 + 13 + 2 = 37

Pokud je nulová hypotéza pravdivá, očekává se, že průměrné hodnosti obou skupin budou podobné.

Pokud je jedna ze dvou skupin více rozptýlená, její pozice budou nižší, protože extrémní hodnoty dostanou nižší pozice, zatímco druhá skupina obdrží více vysokých skóre přiřazených středu. Testování rozdílu mezi skupinami z hlediska významnosti a Wilcoxonův test součtu hodnot je použito, což také ospravedlňuje notaci W_A a w_B při výpočtu hodnotových součtů.

Ze součtu hodnot se statistiky U počítají odečtením minimálního možného skóre, n(n + 1) / 2 pro každou skupinu:^[1]

U_A = 54 − 7(8)/2 = 26

U_B = 37 − 6(7)/2 = 16

Podle ${ displaystyle H_ {0}}$ minimum z těchto dvou hodnot je distribuováno podle Wilcoxonova pořadí součtu s parametry danými dvěma velikostmi skupin:

{ displaystyle min (U_ {A}, U_ {B}) sim { text {Wilcoxon}} (m, n) !}

Což umožňuje výpočet hodnoty p pro tento test podle následujícího vzorce:

{ displaystyle p = Pr left [X leq min (U_ {A}, U_ {B}) right] , !}

{ displaystyle X sim { text {Wilcoxon}} (m, n) , !}

ke zjištění statistické významnosti výsledků lze použít tabulku Wilcoxonova rozdělení součtu pořadí (viz Mann – Whitney_U_test další vysvětlení k těmto tabulkám).

U ukázkových dat je u skupin velikostí m = 6 an = 7 hodnota p:

{ displaystyle p = Pr left [x leq 16 right] = 0,2669. , !}

což naznačuje malý nebo žádný důvod odmítnout nulovou hypotézu, že rozptyl obou skupin je stejný.

Viz také

Reference

^ Lehmann, Erich L., Neparametrics: Statistické metody založené na hodnostech, Springer, 2006, s. 9, 11–12.

externí odkazy

implementace R testu Siegel-Tukey

[1] Lehmann, Erich L., Neparametrics: Statistické metody založené na hodnostech, Springer, 2006, s. 9, 11–12.

[1]