Bayesovská redukce modelu - Bayesian model reduction - Wikipedia

Bayesovská redukce modelu je metoda výpočtu důkaz a zadní nad parametry Bayesian modely, které se liší svými předchůdci.[1][2] Plný model je přizpůsoben datům pomocí standardních přístupů. Hypotézy jsou poté testovány definováním jednoho nebo více „redukovaných“ modelů s alternativními (a obvykle přísnějšími) předchozími, které obvykle - v limitu - vypínají určité parametry. Důkazy a parametry redukovaných modelů lze poté vypočítat z důkazů a odhadnout (zadní ) parametry celého modelu pomocí redukce Bayesovského modelu. Pokud jsou přední a zadní normálně distribuováno, pak existuje analytické řešení, které lze rychle vypočítat. To má několik vědeckých a technických aplikací: mezi ně patří velmi rychlé získávání důkazů pro velký počet modelů a usnadnění odhadu hierarchických modelů (Parametrické empirické pozice ).

Teorie

Zvažte nějaký model s parametry a předchozí hustota pravděpodobnosti u těchto parametrů . Zadní víra o poté, co viděl data darováno Bayesovo pravidlo:

 

 

 

 

(1)

Druhá linie rovnice 1 je důkazem modelu, což je pravděpodobnost pozorování dat daného modelu. V praxi nelze obvykle posteriorně vypočítat analyticky kvůli obtížnosti výpočtu integrálu přes parametry. Proto jsou zadní části odhadovány pomocí přístupů, jako jsou Vzorkování MCMC nebo variační Bayes. Zmenšený model lze poté definovat s alternativní sadou předchůdců :

 

 

 

 

(2)

Cílem Bayesovské redukce modelu je vypočítat zadní a důkazy zmenšeného modelu zezadu a důkazy celého modelu. Kombinace rovnice 1 a rovnice 2 a nové uspořádání, redukovaná zadní část lze vyjádřit jako součin celé zadní části, poměr předchozích a poměr důkazů:

 

 

 

 

(3)

Důkaz pro redukovaný model se získá integrací přes parametry každé strany rovnice:

 

 

 

 

(4)

A podle nového uspořádání:

 

 

 

 

(5)

Gaussoví prior a posteriors

Pod Gaussian předchozí a zadní hustoty, jak se používají v kontextu variační Bayes „Bayesovská redukce modelu má jednoduché analytické řešení.[1] Nejprve definujte normální hustoty pro předchozí a zadní:

 

 

 

 

(6)

kde symbol vlnovky (~) označuje veličiny vztahující se ke zmenšenému modelu a dolní nule - například - označuje parametry předchozích. Pro usnadnění definujeme také přesné matice, které jsou inverzní k každé kovarianční matici:

 

 

 

 

(7)

Volná energie celého modelu je aproximace (dolní mez) důkazu logového modelu: který je výslovně optimalizován ve variačních Bayes (nebo může být získán z aproximací vzorkování). Omezená volná energie modelu a parametry jsou pak dány výrazy:

 

 

 

 

(8)

Příklad

Příklad předchůdců. V „úplném“ modelu vlevo má parametr Gaussovu prioritu se střední hodnotou 0 a směrodatnou odchylkou 0,5. V „redukovaném“ modelu má stejný parametr předchozí průměrnou nulu a směrodatnou odchylku 1/1000. Bayesiánská redukce modelu umožňuje odvodit důkazy a parametry redukovaného modelu z důkazů a parametrů celého modelu.

Zvažte model s parametrem a Gaussian předchozí , což je normální rozdělení se střední nulou a směrodatnou odchylkou 0,5 (znázorněno na obrázku vlevo). Tento předchozí říká, že bez jakýchkoli dat se očekává, že parametr bude mít hodnotu nula, ale jsme ochotni pobavit kladné nebo záporné hodnoty (s 99% intervalem spolehlivosti [−1,16,1,16]). Model s tímto předchozím je přizpůsoben datům, aby poskytl odhad parametru a modelové důkazy .

K posouzení, zda parametr přispěl k důkazu modelu, tj. Zda jsme se o tomto parametru něco dozvěděli, je specifikován alternativní „redukovaný“ model, ve kterém má parametr předchůdce s mnohem menší odchylkou: např. . To je znázorněno na obrázku (vpravo). Toto dříve účinně „vypíná“ parametr s tím, že jsme si téměř jisti, že má hodnotu nula. Parametr a důkazy pro tento redukovaný model se rychle počítají z úplného modelu pomocí Bayesiánské redukce modelu.

Hypotéza, že parametr přispěl k modelu, je poté testována porovnáním plného a redukovaného modelu pomocí Bayesův faktor, což je poměr modelových důkazů:

Čím větší je tento poměr, tím větší jsou důkazy pro celý model, který obsahoval parametr jako volný parametr. Naopak, čím silnější jsou důkazy pro redukovaný model, tím jistější si můžeme být, že parametr nepřispěl. Všimněte si, že tato metoda není specifická pro porovnávání parametrů „zapnuto“ nebo „vypnuto“ a lze také vyhodnotit jakékoli mezilehlé nastavení předchozích položek.

Aplikace

Neuroimaging

Bayesovská redukce modelu byla původně vyvinuta pro použití v neuroimagingové analýze,[1][3] v kontextu modelování mozkové konektivity jako součást dynamické kauzální modelování rámec (kde se původně označoval jako post-hoc výběr Bayesiánského modelu).[1] Dynamické kauzální modely (DCM) jsou modely diferenciální rovnice dynamiky mozku.[4] Experimentátor specifikuje několik konkurenčních modelů, které se liší svými předchozími - např. při výběru parametrů, které jsou fixovány na jejich předchozí očekávání nuly. Po namontování jediného „úplného“ modelu se všemi sledovanými parametry informovanými údaji umožňuje Bayesianova redukce modelu rychle vypočítat důkazy a parametry konkurenčních modelů za účelem testování hypotéz. Tyto modely mohou být experimentátorem specifikovány ručně nebo automaticky prohledány, aby se „prořezaly“ všechny nadbytečné parametry, které nepřispívají k důkazům.

Bayesiánská redukce modelu byla následně zobecněna a aplikována například na jiné formy Bayesiánských modelů parametrický empirický Bayes (PEB) modely skupinových efektů.[2] Zde se používá k výpočtu důkazů a parametrů pro jakoukoli danou úroveň hierarchického modelu v rámci omezení (empirických priorit) uložených výše uvedenou úrovní.

Neurobiologie

Bayesiánská redukce modelu byla použita k vysvětlení funkcí mozku. Analogicky k jeho použití při eliminaci nadbytečných parametrů z modelů experimentálních dat bylo navrženo, aby mozek eliminoval nadbytečné parametry interních modelů světa v režimu offline (např. Během spánku).[5][6]

Softwarové implementace

Bayesiánská redukce modelu je implementována v Statistické parametrické mapování panel nástrojů v Matlab funkce spm_log_evidence_reduce.m .

Reference

  1. ^ A b C d Friston, Karl; Penny, Will (červen 2011). „Post hoc výběr Bayesiánského modelu“. NeuroImage. 56 (4): 2089–2099. doi:10.1016 / j.neuroimage.2011.03.062. ISSN  1053-8119. PMC  3112494. PMID  21459150.
  2. ^ A b Friston, Karl J .; Litvak, Vladimir; Oswal, Ashwini; Razi, Adeel; Stephan, Klaas E .; van Wijk, Bernadette C.M .; Ziegler, Gabriel; Zeidman, Peter (březen 2016). „Bayesiánská redukce modelu a empirická Bayesova studie pro skupiny (DCM)“. NeuroImage. 128: 413–431. doi:10.1016 / j.neuroimage.2015.11.015. ISSN  1053-8119. PMC  4767224. PMID  26569570.
  3. ^ Rosa, M.J .; Friston, K .; Penny, W. (červen 2012). „Post-hoc výběr dynamických kauzálních modelů“. Journal of Neuroscience Methods. 208 (1): 66–78. doi:10.1016 / j.jneumeth.2012.04.013. ISSN  0165-0270. PMC  3401996. PMID  22561579.
  4. ^ Friston, K.J .; Harrison, L .; Penny, W. (srpen 2003). "Dynamické kauzální modelování". NeuroImage. 19 (4): 1273–1302. doi:10.1016 / s1053-8119 (03) 00202-7. ISSN  1053-8119. PMID  12948688. S2CID  2176588.
  5. ^ Friston, Karl J .; Lin, Marco; Frith, Christopher D .; Pezzulo, Giovanni; Hobson, J. Allan; Ondobaka, Sasha (říjen 2017). „Aktivní závěry, zvědavost a vhled“ (PDF). Neurální výpočet. 29 (10): 2633–2683. doi:10.1162 / neco_a_00999. ISSN  0899-7667. PMID  28777724. S2CID  13354308.
  6. ^ Tononi, Giulio; Cirelli, Chiara (únor 2006). "Funkce spánku a synaptická homeostáza". Recenze spánkové medicíny. 10 (1): 49–62. doi:10.1016 / j.smrv.2005.05.002. ISSN  1087-0792. PMID  16376591.