Yatessova korekce pro kontinuitu - Yatess correction for continuity - Wikipedia
v statistika, Yatesova korekce na kontinuitu (nebo Yatesův test chí-kvadrát) se používá v určitých situacích při testování na nezávislost v pohotovostní tabulka. Cílem je opravit chybu zavedenou za předpokladu, že diskrétní pravděpodobnosti frekvencí v tabulce lze aproximovat spojitým rozdělením (chi-kvadrát ). V některých případech se Yatesova korekce může upravit příliš daleko, a proto je její současné použití omezené.
Oprava chyby aproximace
Za použití distribuce chí-kvadrát interpretovat Pearsonova statistika chí-kvadrát vyžaduje, aby se předpokládalo, že oddělený pravděpodobnost pozorování binomické frekvence v tabulce lze aproximovat spojitostí distribuce chí-kvadrát. Tento předpoklad není zcela správný a zavádí určitou chybu.
Chcete-li snížit chybu v přibližování, Frank Yates, an Angličtina statistik, navrhl opravu kontinuity, která upraví vzorec pro Pearsonův test chí-kvadrát odečtením 0,5 od rozdílu mezi každou pozorovanou hodnotou a její očekávanou hodnotou v kontingenční tabulce 2 × 2.[1] To snižuje získanou hodnotu chí-kvadrát a tím zvyšuje její p-hodnota.
Účinkem Yatesovy korekce je zabránit nadhodnocení statistické významnosti pro malá data. Tento vzorec se používá hlavně v případě, že alespoň jedna buňka tabulky má očekávaný počet menší než 5. Bohužel Yatesova korekce může mít tendenci k nadměrné korekci. To může mít za následek příliš konzervativní výsledek, který neodmítne nulová hypotéza kdy by mělo (a chyba typu II ). Navrhuje se tedy, že Yatesova korekce je zbytečná i při poměrně nízkých velikostech vzorků,[2] jako:
Toto je Yatesova opravená verze Pearsonova statistika chí-kvadrát:
kde:
- Ói = pozorovaná frekvence
- Ei = očekávaná (teoretická) frekvence vyjádřená nulovou hypotézou
- N = počet odlišných událostí
Stůl 2 × 2
Jako zkratka pro stůl 2 × 2 s následujícími položkami:
S | F | ||
---|---|---|---|
A | A | b | NA |
B | C | d | NB |
NS | NF | N |
můžeme psát
V některých případech je to lepší.