Podmíněná logistická regrese - Conditional logistic regression

Podmíněná logistická regrese je příponou logistická regrese což umožňuje vzít v úvahu stratifikace a vhodný. Jeho hlavní oblastí použití je observační studie a zejména epidemiologie. To bylo navrženo v roce 1978 Norman Breslow, Nicholas Day K. K. Halvorsen, Ross L. Prentice a C. Sabai.[1] Jedná se o nejflexibilnější a obecný postup pro porovnávaná data.

Motivace

Využití observačních studií stratifikace nebo vhodný jako způsob ovládání pro matoucí. Před podmíněnou logistickou regresí pro shodná data existovalo několik testů, jak je uvedeno v související testy. Nepovolili však analýzu spojitých prediktorů s libovolnou velikostí vrstvy. Všechny tyto postupy také postrádají flexibilitu podmíněné logistické regrese a zejména možnost kontroly kovariát.

Logistická regrese může brát v úvahu stratifikaci tím, že má pro každou vrstvu jiný konstantní termín. Označme to štítek (např. stav případu) th pozorování th stratum and hodnoty příslušných prediktorů. Potom je pravděpodobnost jednoho pozorování

kde je konstantní termín pro th stratum. I když to funguje uspokojivě pro omezený počet vrstev, k patologickému chování dochází, když jsou vrstvy malé. Když jsou vrstvy dvojice, počet parametrů roste s počtem pozorování (to se rovná ). Asymptotické výsledky, na kterých odhad maximální věrohodnosti je založen na nejsou proto platné a odhad je předpojatý. Ve skutečnosti lze prokázat, že bezpodmínečná analýza dat spárovaných párů vede k odhadu poměru šancí, který je druhou mocninou správného, ​​podmíněného.[2]

Podmíněná pravděpodobnost

Přístup podmíněné pravděpodobnosti se zabývá výše uvedeným patologickým chováním tím, že podmíní počet případů v každé vrstvě, a proto eliminuje potřebu odhadovat parametry vrstev. V případě, že vrstvy jsou páry, kde první pozorování je případ a druhé je kontrola, lze to vidět následovně

Při podobných výpočtech je podmíněná pravděpodobnost velikosti vrstvy , s první připomínky jsou případy, je

kde je sada všech podmnožin velikosti sady .

Úplná podmíněná logaritmická pravděpodobnost je pak jednoduše součtem logaritmických pravděpodobností pro každou vrstvu. Odhad je pak definován jako který maximalizuje podmíněnou pravděpodobnost protokolu.

Implementace

Podmíněná logistická regrese je k dispozici v R jako funkce dřevák v přežití balík. Je to v přežití balíček, protože pravděpodobnost logaritmu podmíněného logistického modelu je stejná jako logaritmická pravděpodobnost modelu Cox s konkrétní datovou strukturou.[3]

Související testy

  • Test spárovaného rozdílu umožňuje otestovat asociaci mezi binárním výsledkem a spojitým prediktorem při zohlednění párování.
  • Cochran-Mantel-Haenszelův test umožňuje otestovat asociaci mezi binárním výsledkem a binárním prediktorem při zohlednění stratifikace s velikostí libovolné vrstvy. Po ověření podmínek aplikace je identická s podmíněnou logistickou regresí bodový test.[4]

Poznámky

  1. ^ Breslow NE, Day NE, Halvorsen KT, Prentice RL, Sabai C (1978). „Odhad více funkcí relativního rizika ve shodných studiích případové kontroly“. Jsem J. Epidemiol. 108 (4): 299–307. doi:10.1093 / oxfordjournals.aje.a112623. PMID  727199.
  2. ^ Breslow, N.E .; Den, N.E. (1980). Statistické metody ve výzkumu rakoviny. Svazek 1 - Analýza studií případové kontroly. Lyon, Francie: IARC. 249–251. Archivovány od originál dne 2016-12-26. Citováno 2016-11-04.
  3. ^ Lumley, Thomas. "R dokumentace Podmíněná logistická regrese". Citováno 3. listopadu 2016.
  4. ^ Day, N. E., Byar, D. P. (1979). „Testování hypotéz v případových kontrolních studiích - ekvivalence statistik Mantel-Haenszel a testů logitového skóre“. Biometrie. 35 (3): 623–630. doi:10.2307/2530253.CS1 maint: více jmen: seznam autorů (odkaz)