Goodman a Kruskals gama - Goodman and Kruskals gamma - Wikipedia
v statistika, Goodman a Kruskal gama je měřítkem hodnostní korelace, tj. podobnost uspořádání dat při seřazení podle jednotlivých veličin. Měří sílu sdružení z křížová tabulka data, když obojí proměnné se měří na pořadová úroveň. Neprovádí žádné úpravy velikosti stolu ani kravat. Hodnoty se pohybují od -1 (100% negativní asociace nebo dokonalá inverze) do +1 (100% pozitivní asociace nebo dokonalá shoda). Hodnota nula označuje nepřítomnost asociace.
Tato statistika (odlišná od Goodman a Kruskalův lambda ) je pojmenován po Leo Goodman a William Kruskal, který jej navrhl v sérii příspěvků od roku 1954 do roku 1972.[1][2][3][4]
Definice
Odhad gama, G, závisí na dvou veličinách:
- Ns, počet párů případů seřazených ve stejném pořadí na obě proměnné (počet shodné páry ),
- Nd, počet párů případů seřazených v obráceném pořadí na obou proměnných (počet obrácených párů),
kde jsou zrušeny „vazby“ (případy, kdy je jedna ze dvou proměnných v páru stejná)
Tuto statistiku lze považovat za odhad maximální pravděpodobnosti pro teoretickou veličinu , kde
a kde Ps a Pd jsou pravděpodobnosti, že náhodně vybraná dvojice pozorování umístí ve stejném nebo opačném pořadí, pokud jsou seřazeny podle obou proměnných.
Kritické hodnoty pro statistiku gama se někdy nacházejí pomocí aproximace, přičemž transformovaná hodnota, t statistické údaje Studentská distribuce, kde[Citace je zapotřebí ]
a kde n je počet pozorování (ne počet párů):
Yule's Q
Zvláštní případ gama Goodmana a Kruskala je Yule's Q, také známý jako Yule koeficient asociace,[5] který je specifický pro matice 2 × 2. Zvažte následující pohotovostní tabulka událostí, kde každá hodnota je počet frekvencí události:
Ano | Ne | Součty | |
---|---|---|---|
Pozitivní | A | b | A+b |
Negativní | C | d | C+d |
Součty | A+C | b+d | n |
Yuleovo Q je dáno:
Ačkoli se počítá stejným způsobem jako Goodman a Kruskalova gama, má mírně širší interpretaci, protože rozdíl mezi nominální a ordinální stupnicí se stává věcí svévolného označování pro dichotomické rozdíly. To, zda je Q kladné nebo záporné, tedy závisí pouze na tom, které párování analytik považuje za shodné, ale jinak je symetrické.
Q se pohybuje od -1 do +1. −1 odráží celkovou negativní asociaci, +1 odráží perfektní pozitivní asociaci a 0 odráží vůbec žádnou asociaci. Znamení závisí na tom, které párování analytik původně považoval za shodné, ale tato volba neovlivní velikost.
Z hlediska poměr šancí NEBO, vánoční Q darováno
a tak Yule Q a Yule Y jsou ve vztahu
Viz také
- Kendall tau rank korelační koeficient
- Goodman a Kruskalův lambda
- Yule je Y., také známý jako koeficient kolize
Reference
- ^ Goodman, Leo A .; Kruskal, William H. (1954). "Opatření sdružení pro křížové klasifikace". Journal of the American Statistical Association. 49 (268): 732–764. doi:10.2307/2281536. JSTOR 2281536.
- ^ Goodman, Leo A .; Kruskal, William H. (1959). „Opatření sdružení pro křížové klasifikace. II: Další diskuse a odkazy“. Journal of the American Statistical Association. 54 (285): 123–163. doi:10.1080/01621459.1959.10501503. JSTOR 2282143.
- ^ Goodman, Leo A .; Kruskal, William H. (1963). „Measures of Association for Cross Classifications III: přibližná teorie vzorkování“. Journal of the American Statistical Association. 58 (302): 310–364. doi:10.1080/01621459.1963.10500850. JSTOR 2283271.
- ^ Goodman, Leo A .; Kruskal, William H. (1972). „Measures of Association for Cross Classifications, IV: Simplification of Asymptotic Varatives“. Journal of the American Statistical Association. 67 (338): 415–421. doi:10.1080/01621459.1972.10482401. JSTOR 2284396.
- ^ Yule, G U. (1912). „K metodám měření asociace mezi dvěma atributy“ (PDF). Journal of the Royal Statistical Society. 49 (6): 579–652. JSTOR 2340126.
Další čtení
- Sheskin, D.J. (2007) Příručka parametrických a neparametrických statistických postupů. Chapman & Hall / CRC, ISBN 9781584888147