Yatessova korekce pro kontinuitu - Yatess correction for continuity - Wikipedia

v statistika, Yatesova korekce na kontinuitu (nebo Yatesův test chí-kvadrát) se používá v určitých situacích při testování na nezávislost v pohotovostní tabulka. Cílem je opravit chybu zavedenou za předpokladu, že diskrétní pravděpodobnosti frekvencí v tabulce lze aproximovat spojitým rozdělením (chi-kvadrát ). V některých případech se Yatesova korekce může upravit příliš daleko, a proto je její současné použití omezené.

Oprava chyby aproximace

Za použití distribuce chí-kvadrát interpretovat Pearsonova statistika chí-kvadrát vyžaduje, aby se předpokládalo, že oddělený pravděpodobnost pozorování binomické frekvence v tabulce lze aproximovat spojitostí distribuce chí-kvadrát. Tento předpoklad není zcela správný a zavádí určitou chybu.

Chcete-li snížit chybu v přibližování, Frank Yates, an Angličtina statistik, navrhl opravu kontinuity, která upraví vzorec pro Pearsonův test chí-kvadrát odečtením 0,5 od rozdílu mezi každou pozorovanou hodnotou a její očekávanou hodnotou v kontingenční tabulce 2 × 2.^[1] To snižuje získanou hodnotu chí-kvadrát a tím zvyšuje její p-hodnota.

Účinkem Yatesovy korekce je zabránit nadhodnocení statistické významnosti pro malá data. Tento vzorec se používá hlavně v případě, že alespoň jedna buňka tabulky má očekávaný počet menší než 5. Bohužel Yatesova korekce může mít tendenci k nadměrné korekci. To může mít za následek příliš konzervativní výsledek, který neodmítne nulová hypotéza kdy by mělo (a chyba typu II ). Navrhuje se tedy, že Yatesova korekce je zbytečná i při poměrně nízkých velikostech vzorků,^[2] jako:

{ displaystyle sum _ {i = 1} ^ {N} O_ {i} = 20 ,}

Toto je Yatesova opravená verze Pearsonova statistika chí-kvadrát:

{ displaystyle chi _ { text {Yates}} ^ {2} = součet _ {i = 1} ^ {N} {(| O_ {i} -E_ {i} | -0,5) ^ {2} přes E_ {i}}}

kde:

Ó_i = pozorovaná frekvence

E_i = očekávaná (teoretická) frekvence vyjádřená nulovou hypotézou

N = počet odlišných událostí

Stůl 2 × 2

Jako zkratka pro stůl 2 × 2 s následujícími položkami:

	S	F
A	A	b	N_A
B	C	d	N_B
	N_S	N_F	N

můžeme psát

{ displaystyle chi _ { text {Yates}} ^ {2} = { frac {N (| ad-bc | -N / 2) ^ {2}} {N_ {S} N_ {F} N_ { A} N_ {B}}}.}

V některých případech je to lepší.

{ displaystyle chi _ { text {Yates}} ^ {2} = { frac {N ( max (0, | ad-bc | -N / 2)) ^ {2}} {N_ {S} N_ {F} N_ {A} N_ {B}}}.}

Viz také

Reference

^ Yates, F (1934). "Kontingenční tabulka zahrnující malá čísla a χ² test". Dodatek k Journal of the Royal Statistical Society 1(2): 217–235. JSTOR 2983604
^ Sokal RR, Rohlf F.J. (1981). Biometrie: Principy a praxe statistiky v biologickém výzkumu. Oxford: W.H. Freemane, ISBN 0-7167-1254-7.

[Yates-1] Yates, F (1934). "Kontingenční tabulka zahrnující malá čísla a χ² test". Dodatek k Journal of the Royal Statistical Society 1(2): 217–235. JSTOR 2983604

[Sokal1981-2] Sokal RR, Rohlf F.J. (1981). Biometrie: Principy a praxe statistiky v biologickém výzkumu. Oxford: W.H. Freemane, ISBN 0-7167-1254-7.

[1]

[2]