Separace (statistika) - Separation (statistics)
v statistika, oddělení je jev spojený s modely pro dichotomický nebo kategorické výsledky, včetně logistické a probitová regrese. K oddělení dojde, pokud prediktor (nebo a lineární kombinace některé podmnožiny prediktorů) je spojena pouze s jednou výslednou hodnotou, když je prediktor větší než nějaká konstanta.
Například pokud je to prediktor X je kontinuální a výsledek y = 1 pro všechny pozorované X > 2. Pokud jsou výsledné hodnoty dokonale určeny prediktorem (např. y = 0 kdy X ≤ 2) pak se říká, že nastává podmínka „úplné oddělení“. Pokud se místo toho nějaké překrytí (např. y = 0 kdy X <2, ale y pozoroval hodnoty 0 a 1, když X = 2) pak nastane „kvazi úplná separace“. Příkladem kvazi úplného oddělení je tabulka 2 × 2 s prázdnou buňkou.
Tato pozorovaná forma dat je důležitá, protože způsobuje problémy s odhadovanými regresními koeficienty. Volně parametr v modelu „chce“ být nekonečný, pokud je pozorováno úplné oddělení.[1] Pokud je to kvazi-úplné oddělení, pravděpodobnost je stále maximalizována na nekonečné hodnotě pro tento parametr, ale má určitá omezení s ohledem na jiné parametry.[2] Počítačové programy často vydají libovolně velký odhad parametrů s velmi velkým standardní chyba.[3] Mezi metody přizpůsobení těmto modelům patří přesná logistická regrese a První logistická regrese, metoda zkreslení založená na potrestané pravděpodobnosti.[4]
Reference
- ^ Zeng, Guoping; Zeng, Emily (2019). "O vztahu mezi multicollinearitou a separací v logistické regresi". Komunikace ve statistice. Simulace a výpočet. doi:10.1080/03610918.2019.1589511.
- ^ Albert, A .; Anderson, J. A. (1984). „O existenci odhadů maximální pravděpodobnosti v modelech logistické regrese“. Biometrika. 71 (1–10). doi:10.1093 / biomet / 71.1.1.
- ^ McCullough, B. D .; Vinod, H. D. (2003). "Ověření řešení z nelineárního řešení: Případová studie". American Economic Review. 93 (3): 873–892. JSTOR 3132121.
- ^ Mansournia, Mohammad Ali; Geroldinger, Angelika; Grónsko, Sander; Heinze, Georg (2018). „Oddělení v logistické regrese: příčiny, důsledky a kontrola“. American Journal of Epidemiology. 187 (4): 864–870. doi:10.1093 / aje / kwx299.
Další čtení
- Davidson, Russell; MacKinnon, James G. (2004). Ekonometrická teorie a metody. New York: Oxford University Press. 458–459. ISBN 978-0-19-512372-2.