Vícerozměrný probitový model - Multivariate probit model - Wikipedia

v statistika a ekonometrie, vícerozměrný probitový model je zobecněním probit model slouží k odhadu několika korelovaných binárních výsledků společně. Pokud se například předpokládá, že rozhodnutí o vyslání alespoň jednoho dítěte do veřejné školy a rozhodnutí o hlasování ve prospěch rozpočtu školy jsou ve vzájemném vztahu (obě rozhodnutí jsou binární), pak by pro společnou předpovědi byl vhodný model vícerozměrného probitu. dvě možnosti na základě konkrétního jednotlivce. Tento přístup byl původně vyvinut společností Siddhártha Chib a Edward Greenberg.[1]

Příklad: bivariate probit

V běžném probitově modelu existuje pouze jedna binárně závislá proměnná a tak jen jeden latentní proměnná se používá. Naproti tomu v modelu bivariate probit existují dvě binárně závislé proměnné a , takže existují dvě latentní proměnné: a Předpokládá se, že každá pozorovaná proměnná přebírá hodnotu 1 právě tehdy, pokud její podkladová spojitá latentní proměnná přebírá kladnou hodnotu:

s

a

Přizpůsobení modelu dvojrozměrného probitu zahrnuje odhad hodnot a . K tomu je pravděpodobnost modelu musí být maximalizována. Tato pravděpodobnost je

Nahrazení latentních proměnných a v pravděpodobnostních funkcích a získávání protokolů dává

Po nějakém přepsání se funkce pravděpodobnosti protokolu stane:

Všimněte si, že je kumulativní distribuční funkce z rozdělit normální rozdělení. a ve funkci log-likelihood jsou sledovány proměnné rovné jedné nebo nule.

Vícerozměrný probit

V obecném případě kde můžeme vzít jako volby a jako jednotlivci nebo pozorování, pravděpodobnost pozorování volby je

Kde a,

Funkce log-pravděpodobnosti v tomto případě by byla

Až na typicky neexistuje žádné uzavřené řešení integrálů v rovnici pravděpodobnosti log. Místo toho lze k simulaci pravděpodobnosti volby použít simulační metody. Mezi metody využívající vzorkování důležitosti patří Algoritmus GHK (Geweke, Hajivassilou, McFadden a Keane),[2] AR (přijmout-odmítnout), Sternova metoda. K tomuto problému existují také přístupy MCMC, včetně CRB (Chibova metoda s Rao-Blackwellization), CRT (Chib, Ritter, Tanner), ARK (jádro přijmout-odmítnout) a ASK (jádro adaptivního vzorkování).[3]. V Probit-LMM je navržen variační přístup k škálování velkých datových souborů (Mandt, Wenzel, Nakajima et al.).[4]

Reference

  1. ^ Chib, Siddhartha; Greenberg, Edward (červen 1998). "Analýza vícerozměrných modelů probitů". Biometrika. 85 (2): 347–361. CiteSeerX  10.1.1.198.8541. doi:10.1093 / biomet / 85.2.347 - prostřednictvím Oxford Academic.
  2. ^ Hajivassiliou, Vassilis (1994). "Kapitola 40 Klasické metody odhadu pro modely LDV pomocí simulace". Příručka ekonometrie. 4: 2383–2441. doi:10.1016 / S1573-4412 (05) 80009-1. ISBN  9780444887665.
  3. ^ Jeliazkov, Ivan (2010). "Pohledy MCMC na odhad simulované pravděpodobnosti". Pokroky v ekonometrii. 26: 3–39. doi:10.1108 / S0731-9053 (2010) 0000026005. ISBN  978-0-85724-149-8.
  4. ^ Mandt, Stephan; Wenzel, Florian; Nakajima, Shinichi; John, Cunningham; Lippert, Christoph; Kloft, Marius (2017). "Sparse probit lineární smíšený model" (PDF). Strojové učení. 106 (9–10): 1–22. arXiv:1507.04777. doi:10.1007 / s10994-017-5652-6.

Další čtení

  • Greene, William H., Ekonometrická analýza, sedmé vydání, Prentice-Hall, 2012.