Koeficient kolize - Coefficient of colligation
Ve statistikách Yule Y, také známý jako koeficient kolize, je míra asociace mezi dvěma binárními proměnnými. Opatření vyvinulo George Udny Yule v roce 1912,[1][2] a neměla by být zaměňována s Yuleův koeficient pro měření šikmost na základě kvartily.
Vzorec
Pro stůl 2 × 2 pro binární proměnné U a PROTI s frekvencemi nebo proporcemi
PROTI = 0 PROTI = 1 U = 0 A b U = 1 C d
Yule Y darováno
Yule Y úzce souvisí s poměr šancí NEBO = inzerát/(před naším letopočtem) jak je vidět v následujícím vzorci:
Yule Y se pohybuje od -1 do +1. −1 odráží celkový zápor korelace, +1 odráží perfektní pozitivní asociaci, zatímco 0 neodráží vůbec žádnou asociaci. Ty odpovídají hodnotám pro běžnější Pearsonova korelace.
Yule Y souvisí také s podobným Yule Q, což lze vyjádřit také z hlediska poměru šancí. Q a Y souvisí:
Výklad
Yule Y dává zlomek dokonalého sdružení v per unum (vynásobeno 100 představuje tento zlomek ve známějším procentu). Vzorec ve skutečnosti transformuje původní tabulku 2 × 2 na příčně symetrickou tabulku kde b = C = 1 a A = d = √NEBO.
Pro příčnou symetrickou tabulku s frekvencemi nebo proporcemi A = d a b = C je velmi snadné vidět, že jej lze rozdělit do dvou tabulek. V takových tabulkách lze asociaci měřit naprosto jasným způsobem dělením (A – b) od (A + b). V transformovaných tabulkách musí být b nahrazeno 1 a a √NEBO. Transformovaná tabulka má stejný stupeň asociace (stejný OR) jako původní ne příčně symetrická tabulka. Asociace v nesymetrických tabulkách tedy může být měřena také pomocí Yule's Y tlumočení Yule Y stejným způsobem, jak jej lze interpretovat pro symetrické tabulky. Samozřejmě Yule Y a (A − b)/(A + b) dává stejný výsledek v příčně symetrických tabulkách. Takže Yule měří asociaci jako zlomek pro dva druhy stolů.
Yule Y měří asociaci podstatným, intuitivně srozumitelným způsobem, a proto je mírou preference měřit asociaci.[Citace je zapotřebí ]
Příklady
Následující příčná symetrická tabulka
PROTI = 0 PROTI = 1 U = 0 40 10 U = 1 10 40
lze rozdělit do dvou tabulek:
PROTI = 0 PROTI = 1 U = 0 10 10 U = 1 10 10
a
PROTI = 0 PROTI = 1 U = 0 30 0 U = 1 0 30
Je zřejmé, že stupeň asociace se rovná 0,6 za unum (60%).
Následující asymetrickou tabulku lze transformovat do tabulky se stejným stupněm asociace (poměr šancí obou tabulek je stejný).
PROTI = 0 PROTI = 1 U = 0 3 1 U = 1 3 9
Následuje transformovaná tabulka:
PROTI = 0 PROTI = 1 U = 0 3 1 U = 1 1 3
Kurzové poměry obou stolů se rovnají 9. Y = (3 − 1)/(3 + 1) = 0.5 (50%)
Reference
- ^ Yule, G. Udny (1912). „K metodám měření asociace mezi dvěma atributy“ (PDF). Journal of the Royal Statistical Society. 75 (6): 579–652. doi:10.2307/2340126. JSTOR 2340126.
- ^ Michel G. Soete. Nová teorie měření asociace mezi dvěma binárními proměnnými v lékařských vědách: asociaci lze vyjádřit ve zlomku (per unum, procento, pro mille ...) dokonalé asociace (2013), e-article, BoekBoek.be