Cramérs V - Cramérs V - Wikipedia
v statistika, Cramér's V (někdy označované jako Cramérův phi a označeno jako φC) je míra sdružení mezi dvěma nominální proměnné, což dává hodnotu mezi 0 a +1 (včetně). Je to založeno na Pearsonova statistika chí-kvadrát a byla publikována Harald Cramér v roce 1946.[1]
Využití a interpretace
φC je vzájemná korelace dvou diskrétních proměnných[2] a mohou být použity s proměnnými, které mají dvě nebo více úrovní. φC je symetrická míra, nezáleží na tom, kterou proměnnou umístíme do sloupců a kterou do řádků. Na pořadí řádků / sloupců také nezáleží, takže φC lze použít s nominálními datovými typy nebo vyššími (zejména objednanými nebo číselnými).
Cramérovo V lze také použít dobrota fit chi-kvadrát modely, když je 1 × k tabulka (v tomto případě r = 1). V tomto případě k se bere jako počet volitelných výsledků a funguje jako měřítko tendence k jedinému výsledku.[Citace je zapotřebí ]
Cramérovo V se pohybuje od 0 (odpovídá žádná asociace mezi proměnnými) až 1 (úplná asociace) a může dosáhnout 1, pouze když je každá proměnná zcela určena druhou.
φC2 je střední čtverec kanonická korelace mezi proměnnými.[Citace je zapotřebí ]
V případě 2 × 2 pohotovostní tabulka Cramérovo V se rovná Koeficient Phi.
Všimněte si, že jelikož hodnoty chí-kvadrát mají tendenci se zvyšovat s počtem buněk, tím větší je rozdíl mezi nimi r (řádky) a C (sloupce), tím je pravděpodobnější φC bude mít tendenci k 1 bez silných důkazů o smysluplné korelaci.[Citace je zapotřebí ]
Na V lze pohlížet jako na asociaci mezi dvěma proměnnými jako procento jejich maximální možné variace. PROTI2 je střední čtverec kanonická korelace mezi proměnnými.[Citace je zapotřebí ]
Výpočet
Nechte vzorek velikosti n současně distribuovaných proměnných a pro být dán frekvencemi
- kolikrát byly hodnoty byly pozorovány.
Statistika chí-kvadrát pak je:
Cramérovo V se vypočítá z druhé odmocniny chí-kvadrát statistiky vydělené velikostí vzorku a minimální dimenzí minus 1:
kde:
- je koeficient phi.
- je odvozen z Pearsonova testu chí-kvadrát
- je celkový součet pozorování a
- je počet sloupců.
- je počet řádků.
The p-hodnota pro význam z PROTI je stejný, který se počítá pomocí Pearsonův test chí-kvadrát.[Citace je zapotřebí ]
Vzorec pro rozptyl PROTI= φC je známo.[3]
V R funkce cramerV ()
z balíčku rcompanion
[4] počítá PROTI pomocí funkce chisq.test z balíčku statistik. Na rozdíl od funkce cramersV ()
z lsr
[5] balík, cramerV ()
také nabízí možnost opravit zkreslení. Aplikuje opravu popsanou v následující části.
Oprava zkreslení
Cramérovo V může být silně zaujatým odhadcem jeho populačního protějšku a bude mít tendenci přeceňovat sílu asociace. Oprava zkreslení pomocí výše uvedeného zápisu je dána vztahem[6]
kde
a
Pak odhaduje stejné množství populace jako Cramérovo V, ale obvykle mnohem menší střední čtvercová chyba. Důvodem opravy je, že za nezávislosti,.[7]
Viz také
Další míry korelace pro nominální údaje:
- The koeficient phi
- Tschuprowova T
- The koeficient nejistoty
- The Lambda koeficient
- The Randův index
- Davies – Bouldinův index
- Dunnův index
- Jaccardův index
- Fowlkes – index slézů
Další související články:
Reference
- ^ Cramér, Harald. 1946. Matematické metody statistiky. Princeton: Princeton University Press, strana 282 (Kapitola 21. Dvojrozměrný případ). ISBN 0-691-08004-6 (obsah Archivováno 2016-08-16 na Wayback Machine )
- ^ Sheskin, David J. (1997). Příručka parametrických a neparametrických statistických postupů. Boca Raton, Fl: Press CRC.
- ^ Liebetrau, Albert M. (1983). Opatření přidružení. Newbury Park, CA: Sage Publications. Kvantitativní aplikace v seriálu sociálních věd č. 32. (strany 15–16)
- ^ „Rcompanion: Functions to Support Extension Education Program Evaluation“. 2019-01-03.
- ^ „Lsr: Companion to“ Learning Statistics with R"". 2015-03-02.
- ^ Bergsma, Wicher (2013). "Korekce zkreslení pro Cramérovo V a Tschuprowovo T". Časopis Korejské statistické společnosti. 42 (3): 323–328. doi:10.1016 / j.jkss.2012.10.002.
- ^ Bartlett, Maurice S. (1937). „Vlastnosti dostatečnosti a statistické testy“. Sborník královské společnosti v Londýně. Řada A. 160 (901): 268–282. doi:10.1098 / rspa.1937.0109. JSTOR 96803.
externí odkazy
- Míra sdružení pro neparametrickou statistiku (Alan C. Acock a Gordon R. Stavig Strana 1381 z 1381–1386)
- Nominal Association: Phi and Cramer's Vl[mrtvý odkaz ] z domovské stránky Pat Dattalo.