Ignorovatelnost - Ignorability
![]() | tento článek je psán jako osobní reflexe, osobní esej nebo argumentační esej který uvádí osobní pocity editora Wikipedie nebo představuje originální argument o tématu.Červen 2019) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
v statistika, ignorovatelnost je funkce návrh experimentu přičemž způsob sběru dat (a povaha chybějících dat) nezávisí na chybějících datech. Mechanismus chybějících dat, jako je přiřazení léčby nebo strategie vzorkování průzkumu, je „ignorovatelný“, pokud chybějící datová matice, která označuje, které proměnné jsou pozorovány nebo chybí, je nezávislá na chybějících datech podmíněná sledovanými daty.
Tato myšlenka je součástí Rubinův model kauzální inference, vyvinutý společností Donald Rubin ve spolupráci s Paul Rosenbaum na začátku 70. let. Přesná definice se u jednotlivých článků v uvedeném období liší. V jednom z Rubinových článků z roku 1978 Rubin diskutuje ignorovatelné mechanismy přiřazení,[1] což lze chápat jako způsob zařazování jednotlivců do léčebných skupin, je pro analýzu dat irelevantní, vzhledem ke všemu, co je o daném jednotlivci zaznamenáno. Později, v roce 1983 [2] Rubin a Rosenbaum spíše definují silně ignorovatelné přiřazení léčby což je silnější podmínka, matematicky formulovaná jako , kde je potenciálním výsledkem dané léčby , je několik proměnných a je skutečná léčba.
Pearl [2000] vymyslel jednoduché grafické kritérium, tzv zadní dveře, což znamená ignorovatelnost a identifikuje množiny proměnných, které splňují tuto podmínku.
Ignorovatelnost (lépe nazývaná exogenita) jednoduše znamená, že můžeme ignorovat, jak jeden skončil v jedné vs. druhé skupině („ošetřený“ Tx = 1 nebo „kontrolní“ Tx = 0), pokud jde o potenciální výsledek (řekněme Y). Také se tomu říkalo unconfoundedness, selection on the observables, or no omitted variable bias.[3]
Formálně to bylo napsáno jako [Yi1, Yi0] ⊥ Txi, nebo slovy potenciální Y výsledek osoby i zda byli nebo nebyli léčeni, nezávisí na tom, zda skutečně byli (pozorovatelní) léčeni nebo ne. Jinými slovy můžeme ignorovat, jak lidé skončili v jednom proti druhému, a považovat jejich potenciální výsledky za směnitelné. I když se to zdá silné, je zřejmé, pokud přidáme dolní indexy pro „realizovaný“ a horní indexy pro „ideální“ (potenciální) světy (notace navržená David Freedman; vizuál může pomoci zde: potenciální výsledky zjednodušené ). Takže: Ano11/ * Y01 jsou potenciální výsledky Y, pokud by byla osoba léčena (horní index 1), když ve skutečnosti skutečně byli (Y11, dolní index 1), nebo ne (* Y01: * signalizuje, že tuto veličinu nelze nikdy realizovat nebo pozorovat, nebo je plně v rozporu se skutečností nebo hypotetická, CF).
Podobně * Y10/ Y00 jsou potenciální výsledky Y, pokud by osoba nebyla léčena (horní index 0), když ve skutečnosti byly (* Y10, dolní index 1), nebo ne ve skutečnosti (Y00).
Pouze jeden z každého potenciálního výsledku (PO) může být realizován, druhý nemůže, pro stejné přiřazení podmínce, takže když se pokoušíme odhadnout účinky léčby, potřebujeme něco, co by nahradilo ty zcela v rozporu s pozorovatelnými (nebo odhadnout je). Pokud platí ignorovatelnost / exogenita, jako když jsou lidé randomizováni k léčbě nebo ne, můžeme je „nahradit“ * Y01 s jeho pozorovatelným protějškem Y11a * Y10 s jeho pozorovatelným protějškem Y00, ne na individuální úrovni Yi, Ale pokud jde o průměry jako E [Yi1 - Yi0], což je přesně účinek kauzální léčby (TE), který se člověk snaží obnovit.
Díky „pravidlu konzistence“ jsou potenciálními výstupy hodnoty skutečně realizované, takže můžeme psát Yi0 = Yi00 a Yi1 = Yi11 („Pravidlo konzistence uvádí, že potenciální výsledek jednotlivce za hypotetické podmínky, která se náhodou stala, je přesně výsledkem, který tento jedinec zažil“,[4] p. 872). Proto TE = E [Yi1 - Yi0] = E [Y.i11 - Yi00]. Nyní jednoduše přidáním a odečtením stejného plně kontrafaktuálního množství * Y10 dostaneme: E [Yi11 - Yi00] = E [Y.i11 - * Y10 + * Y10 - Yi00] = E [Y.i11 - * Y10] + E [* Y10 - Yi00] = ATT + {Selection Bias}, kde ATT = průměrný účinek léčby na léčeného [5] a druhý termín je zkreslení zavedené, když si lidé mohou vybrat, zda budou patřit do „ošetřené“ nebo „kontrolní“ skupiny. Ignorovatelnost, ať už prostá nebo podmíněná některými jinými proměnnými, znamená, že takové zkreslení výběru lze ignorovat, takže lze obnovit (nebo odhadnout) kauzální účinek.
Viz také
Reference
- ^ Rubin, Donald (1978). „Bayesiánský závěr o příčinných dopadech: role randomizace“. Annals of Statistics. 6 (1): 34–58. doi:10.1214 / aos / 1176344064.
- ^ Rubin, Donald B .; Rosenbaum, Paul R. (1983). „Ústřední role skóre náchylnosti v observačních studiích pro kauzální účinky“. Biometrika. 70 (1): 41–55. doi:10.2307/2335942. JSTOR 2335942.
- ^ Yamamoto, Teppei (2012). „Pochopení minulosti: Statistická analýza kauzálního přiřazení“. Journal of Political Science. 56 (1): 237–256. doi:10.1111 / j.1540-5907.2011.00539.x. hdl:1721.1/85887.
- ^ Pearl, Judea (2010). "K pravidlu konzistence v kauzální inference: axiom, definice, předpoklad nebo věta?". Epidemiologie. 21 (6): 872–875. doi:10.1097 / EDE.0b013e3181f5d3fd. PMID 20864888.
- ^ Imai, Kosuke (2006). „Nedorozumění mezi kauzálními závěry mezi experimentátory a pozorovateli“. Journal of the Royal Statistical Society: Series A (Statistics in Society). 171 (2): 481–502. doi:10.1111 / j.1467-985X.2007.00527.x.
Další čtení
- Gelman, Andrew; Carlin, John B .; Stern, Hal S .; Rubin, Donald B. (2004). Bayesovská analýza dat. New York: Chapman & Hall / CRC.
- Pearl, Judea (2000). Příčinnost: modely, uvažování a závěry. Cambridge University Press.
- Jaeger, Manfred (2011). "Ignorovatelnost ve statistickém a pravděpodobnostním závěru". Journal of Artificial Intelligence Research. 24: 889–917. arXiv:1109.2143. Bibcode:2011arXiv1109.2143J. doi:10.1613 / jair.1657.