Nepřesný Dirichletův proces - Imprecise Dirichlet process
V teorii pravděpodobnosti a statistice se Dirichletův proces (DP) je jedním z nejpopulárnějších bayesiánských neparametrických modelů. Zavedl ji Thomas Ferguson[1] jako předchozí nad pravděpodobnostní rozdělení.
A Dirichletův proces je zcela definován svými parametry: (dále jen základní rozdělení nebo základní míra) je libovolné rozdělení a (dále jen parametr koncentrace ) je kladné reálné číslo (často se označuje jako Podle Bayesovského paradigmatu by tyto parametry měly být zvoleny na základě dostupných předběžných informací o doméně.
Otázka zní: jak bychom měli zvolit předchozí parametry DP, zejména ten nekonečný dimenzionální , v případě nedostatku předchozích informací?
Abychom tento problém vyřešili, dosud byl navržen pouze omezující RP získaný pro , který byl zaveden pod názvem Bayesian bootstrap Rubin;[2] ve skutečnosti lze dokázat, že Bayesianský bootstrap je asymptoticky ekvivalentní častému bootstrapu zavedenému Bradley Efron.[3]Omezující Dirichletův proces byl kritizován z různých důvodů. Z a-a priori hlediska je hlavním kritikem to přijetí zdaleka nevede k neinformativnímu předchozímu.[4]Kromě toho a-a posteriori přiřadí nulovou pravděpodobnost jakékoli sadě, která nezahrnuje pozorování.[2]
Nepřesný Dirichlet[5] k překonání těchto problémů byl navržen proces. Základní myšlenkou je opravit ale nevybírejte žádnou přesnou základní míru .
Přesněji řečeno nepřesný Dirichletův proces (IDP) je definován takto:
kde je soubor všech pravděpodobnostních opatření. Jinými slovy, IDP je množina všech Dirichletových procesů (s pevným ) získaný necháním základního opatření k překlenutí množiny všech míry pravděpodobnosti.
Závěry s nepřesným Dirichletovým procesem
Nechat rozdělení pravděpodobnosti na (tady je standard Borelův prostor s Borelem -pole ) a předpokládejme to .Pak zvažte omezenou funkci se skutečnou hodnotou definováno dne . Je dobře známo, že očekávání s ohledem na Dirichletův proces je
Jednou z nejpozoruhodnějších vlastností DP předních je to, že zadní distribuce je opět DP. Pojďme být nezávislým a identicky distribuovaným vzorkem z a , pak zadní distribuce vzhledem k pozorování je
kde je míra atomové pravděpodobnosti (Diracova delta) se středem na . Z toho tedy vyplývá, že Proto pro všechny pevné , můžeme využít předchozí rovnice k odvození předchozích a zadních očekávání.
V IDP může překlenout množinu všech distribucí . To znamená, že budeme mít odlišné předchozí a zadní očekávání pro jakoukoli volbu . Způsob, jak charakterizovat závěry pro IDP je výpočtem dolní a horní hranice pro očekávání w.r.t. .A priori tyto hranice jsou:
dolní (horní) mez je získána mírou pravděpodobnosti, která vloží veškerou hmotnost na infimum (supremum) , tj., s (nebo příslušně s ). Z výše uvedených výrazů dolní a horní hranice lze pozorovat, že rozsah pod IDP je stejný jako originál rozsah z . Jinými slovy, uvedením IDP neposkytujeme žádné předchozí informace o hodnotě očekávání . A priori, IDP je tedy modelem předchozí (téměř) -ororance pro .
A-a posteriori, IDP se může učit z údajů. Zadní dolní a horní hranice pro očekávání jsou ve skutečnosti dány:
Lze pozorovat, že zadní závěry nezávisí . K definování IDP musí modelář pouze vybrat (parametr koncentrace). To vysvětluje význam přídavného jména u v předchozí téměř neznalosti, protože IDP vyžaduje od modeláře vyvolání parametru. Jedná se však o jednoduchý problém elicitace pro neparametrického předchozího, protože musíme zvolit pouze hodnotu kladného skaláru (v modelu IDP nezbývá nekonečně mnoho parametrů).
Nakonec to pozorujte pro , IDP vyhovuje
kde . Jinými slovy, IDP je konzistentní.

Volba předchozí síly
IDP je zcela specifikováno , což je jediný parametr zbývající v předchozím modelu. od hodnoty určuje, jak rychle se dolní a horní zadní očekávání sbíhají při zvýšení počtu pozorování, lze zvolit tak, aby odpovídal určité konvergenční rychlosti.[5]Parametr může být také vybráno tak, aby mělo některé žádoucí frekventované vlastnosti (např. důvěryhodné intervaly k kalibraci frekventovaných intervalů, testy hypotéz, které mají být kalibrovány na chybu typu I atd.), viz Příklad: střední test
Příklad: odhad kumulativního rozdělení
Nechat být i.i.d. skutečné náhodné proměnné s kumulativní distribuční funkce .
Od té doby , kde je funkce indikátoru, můžeme použít IDP k odvození závěrů o Dolní a horní zadní průměr jsou
kde je empirická distribuční funkce. Tady, abychom získali nižší, jsme využili skutečnost, že a pro horní část .

Všimněte si, že pro jakoukoli přesnou volbu (např. normální rozdělení ), zadní očekávání budou zahrnuty mezi dolní a horní mez.
Příklad: střední test
IDP lze také použít k testování hypotéz, například k testování hypotézy , tj. medián je větší než nula. Zvažováním oddílu a vlastnost Dirichletova procesu lze ukázat, že zadní distribuce je
kde je počet pozorování, který je menší než nula,
- a
Využitím této vlastnosti z toho vyplývá
kde je legalizovaná neúplná beta funkce Můžeme tedy provést test hypotézy
(s například) a poté
- pokud jsou obě nerovnosti splněny, můžeme to prohlásit s pravděpodobností větší než ;
- pokud je uspokojena pouze jedna z nerovností (což musí nutně být ta pro horní), jsme v neurčité situaci, tj. nemůžeme se rozhodnout;
- pokud oba nejsou spokojeni, můžeme prohlásit, že pravděpodobnost, že je nižší než požadovaná pravděpodobnost .
IDP vrátí neurčité rozhodnutí, když je rozhodnutí závislé na předchozím (tj. Kdy by to záleželo na výběru ).
Využíváním vztahu mezi kumulativní distribuční funkce z Distribuce beta a kumulativní distribuční funkce a náhodná proměnná Z od a binomická distribuce, kde je „pravděpodobnost úspěchu“ str a velikost vzorku je n:
můžeme ukázat, že mediánový test odvozený s tímto IDP pro jakoukoli volbu zahrnuje jednostranný test častého přihlášení jako test mediánu. Lze ve skutečnosti ověřit, že pro the -hodnota testu znaménka se rovná . Pokud tedy pak -hodnota je menší než a tedy mají dva testy stejnou sílu.
Aplikace nepřesného Dirichletova procesu
Dirichletovy procesy se často používají v Bayesovské neparametrické statistice. Nepřesný Dirichletův proces lze použít místo Dirichletových procesů v jakékoli aplikaci, ve které chybí předchozí informace (je proto důležité modelovat tento stav předchozí nevědomosti).
V tomto ohledu byl pro neparametrické testování hypotéz použit nepřesný Dirichletův proces, viz statistický balíček nepřesného Dirichletova procesu Na základě nepřesného Dirichletova procesu byly odvozeny Bayesovské neparametrické téměř ignorující verze následujících klasických neparametrických odhadů: Wilcoxonův test součtu hodnot[5] a Wilcoxonův podepsaný test.[6]
Bayesovský neparametrický model téměř ignorance představuje několik výhod s ohledem na tradiční přístup k testování hypotéz.
- Bayesovský přístup nám umožňuje formulovat test hypotézy jako rozhodovací problém. To znamená, že můžeme ověřit důkazy ve prospěch nulové hypotézy a nejen je odmítnout a přijímat rozhodnutí, která minimalizují očekávanou ztrátu.
- Kvůli neparametrické předchozí téměř neznalosti nám testy založené na IDP umožňují zahájit test hypotézy s velmi slabými předchozími předpoklady, hodně ve směru, kdy necháme data mluvit sama za sebe.
- Ačkoli test IDP sdílí několik podobností se standardním bayesovským přístupem, zároveň ztělesňuje významnou změnu paradigmatu, pokud jde o přijímání rozhodnutí. Ve skutečnosti mají testy založené na IDP tu výhodu, že produkují neurčitý výsledek, když je rozhodnutí závislé na předchozím. Jinými slovy, test IDP pozastavuje úsudek, když se možnost, která minimalizuje očekávané ztráty, mění v závislosti na základním měřítku Dirichletova procesu, na které se zaměřujeme.
- Empiricky bylo ověřeno, že když je test IDP neurčitý, frekventistické testy se chovají prakticky jako náhodní hádači. Tento překvapivý výsledek má praktické důsledky při testování hypotéz. Předpokládejme, že se pokoušíme porovnat účinky dvou lékařských ošetření (Y je lepší než X) a že vzhledem k dostupným údajům je test IDP neurčitý. V takové situaci vydá testovací metoda vždy rozhodnou odpověď (mohu například říci, že Y je lepší než X), ale ukázalo se, že její reakce je zcela náhodná, jako kdybychom hodili mincí. Na druhé straně test IDP uznává v těchto případech nemožnost rozhodnutí. Test IDP tedy slovy „nevím“ poskytuje analytikovi bohatší informace. Analytik by například mohl tyto informace použít ke shromažďování více údajů.
Kategorické proměnné
Pro kategorické proměnné, tj. kdy má konečný počet prvků, je známo, že Dirichletův proces se redukuje na a Dirichletova distribuce V tomto případě se nepřesný Dirichletův proces redukuje na Nepřesný Dirichletův model navrhl Walley[7] jako model pro šanci na předchozí (téměř) slabost.
Viz také
Reference
- ^ Ferguson, Thomas (1973). „Bayesiánská analýza některých neparametrických problémů“. Annals of Statistics. 1 (2): 209–230. doi:10.1214 / aos / 1176342360. PAN 0350949.
- ^ A b Rubin D (1981). Bayesian bootstrap. Ann. Stat. 9 130–134
- ^ Efron B (1979). Metody bootstrapu: Další pohled na kapesní nůž. Ann. Stat. 7 1–26
- ^ Sethuraman, J .; Tiwari, R. C. (1981). "Konvergence Dirichletových opatření a interpretace jejich parametrů". Obranné technické informační centrum.
- ^ Benavoli, Alessio; Mangili, Francesca; Corani, Giorgio; Ruggeri, Fabrizio; Zaffalon, Marco (2014). „Bayesian Wilcoxon podepsal test na základě Dirichletova procesu“. Sborník z 30. mezinárodní konference o strojovém učení (ICML 2014). Citovat deník vyžaduje
| deník =
(Pomoc) - ^ Walley, Peter (1991). Statistické uvažování s nepřesnými pravděpodobnostmi. London: Chapman and Hall. ISBN 0-412-28660-2.