Zobecněná Dirichletova distribuce - Generalized Dirichlet distribution

v statistika, zobecněná Dirichletova distribuce (GD) je zobecněním Dirichletova distribuce s obecnější kovarianční strukturou a téměř dvojnásobným počtem parametrů. Náhodné proměnné s distribucí GD nejsou úplně neutrální .[1]

Funkce hustoty je

kde definujeme . Tady označuje Funkce Beta. Tím se sníží na standardní distribuci Dirichlet, pokud pro ( je libovolný).

Například pokud k = 4, pak hustota funkce je

kde a .

Connor a Mosimann definují PDF jako z následujícího důvodu. Definujte náhodné proměnné s . Pak mít zobecněné Dirichletovo rozdělení jako parametrizované výše, pokud jsou nezávislé beta s parametry , .

Alternativní forma daná Wongem

Wong [2] dává trochu stručnější formu pro

kde pro a . Všimněte si, že Wong definuje distribuci přes a dimenzionální prostor (implicitně definující ) zatímco Connor a Mosiman používají a rozměrný prostor s .

Obecná momentová funkce

Li , pak

kde pro a . Tím pádem

Redukce na standardní Dirichletovu distribuci

Jak je uvedeno výše, pokud pro pak se distribuce sníží na standardní Dirichlet. Tato podmínka se liší od obvyklého případu, kdy nastavení dalších parametrů zobecněného rozdělení na nulu má za následek původní rozdělení. V případě GDD to však vede k velmi komplikované funkci hustoty.

Bayesovská analýza

Předpokládat je zobecněný Dirichlet, a to je multinomiální s zkoušky (zde ). Psaní pro a kloub zadní je zobecněná Dirichletova distribuce s

kde a pro

Experiment vzorkování

Wong uvádí následující systém jako příklad toho, jak se liší Dirichletovo a zobecněné Dirichletovo rozdělení. Předpokládá, že velká urna obsahuje koule různé barvy. Podíl každé barvy není znám. Psát si pro podíl kuliček s barvou v urně.

Experiment 1. Analytik 1 tomu věří (tj, je Dirichlet s parametry ). Analytik poté provede skleněné krabice a klade barevné kuličky doručená pošta (předpokládá se, že jsou celá čísla ). Poté analytik 1 vytáhne z urny kouli a sleduje její barvu (řekněme barvu ) a vloží jej do krabice . Může identifikovat správné pole, protože jsou průhledné a barvy kuliček uvnitř jsou viditelné. Proces pokračuje až do koule byly nakresleny. Zadní distribuce je pak Dirichlet s parametry, které jsou počtem kuliček v každém poli.

Experiment 2. Analytik 2 tomu věří následuje zobecněné Dirichletovo rozdělení: . Všechny parametry se opět považují za kladná celá čísla. Analytik dělá dřevěné krabice. Krabice mají dvě oblasti: jednu pro koule a jednu pro kuličky. Koule jsou barevné, ale kuličky nejsou barevné. Pak pro , říká barevné koule , a kuličky, do krabice . Poté položí barevnou kouli doručená pošta . Analytik poté z urny vytáhne míč. Vzhledem k tomu, že krabice jsou dřevěné, analytik nemůže určit, do které krabice má míč umístit (jak mohl v experimentu 1 výše); má také špatnou paměť a nepamatuje si, která krabička obsahuje které barevné kuličky. Musí zjistit, do které krabice je ten správný, do kterého má míč umístit. Udělá to otevřením pole 1 a porovnáním koulí v ní s taženým míčem. Pokud se barvy liší, je políčko špatné. Analytik vloží mramor (sic) do rámečku 1 a postoupí do rámečku 2. Tento postup opakuje, dokud se koule v rámečku neshodují s taženým míčem, a poté vloží míč (sic) do rámečku s ostatními míčky odpovídající barva. Analytik poté vytáhne z urny další míč a opakuje do koule jsou nakresleny. Zadní je pak zobecněn Dirichlet s parametry je počet míčků a počet kuliček v každém poli.

Všimněte si, že v experimentu 2 má změna pořadí políček netriviální účinek, na rozdíl od experimentu 1.

Viz také

Reference

  1. ^ R. J. Connor a J. E. Mosiman 1969. Pojmy nezávislosti proporcí s generalizací Dirichletova rozdělení. Journal of the American Statistical Association, svazek 64, pp194-206
  2. ^ T.-T. Wong 1998. Zobecněná Dirichletova distribuce v Bayesovské analýze. Applied Mathematics and Computation, svazek 97, str. 165-181