Distribuce Yule – Simon - Yule–Simon distribution
Funkce pravděpodobnostní hmotnosti ![]() Yule – Simon PMF na stupnici log-log. (Všimněte si, že funkce je definována pouze při celočíselných hodnotách k. Spojovací čáry neindikují spojitost.) | |||
Funkce kumulativní distribuce ![]() Yule – Simon CMF. (Všimněte si, že funkce je definována pouze při celočíselných hodnotách k. Spojovací čáry neindikují spojitost.) | |||
Parametry | tvar (nemovitý ) | ||
---|---|---|---|
Podpěra, podpora | |||
PMF | |||
CDF | |||
Znamenat | pro | ||
Režim | |||
Rozptyl | pro | ||
Šikmost | pro | ||
Př. špičatost | pro | ||
MGF | |||
CF |
v pravděpodobnost a statistika, Distribuce Yule – Simon je diskrétní rozdělení pravděpodobnosti pojmenoval podle Udny Yule a Herbert A. Simon. Simon to původně nazýval Rozdělení Vánoc.[1]
The funkce pravděpodobnostní hmotnosti (pmf) Yule – Simon (ρ) distribuce je
pro celé číslo a nemovitý , kde je funkce beta. Ekvivalentně lze pmf napsat v termínech rostoucí faktoriál tak jako
kde je funkce gama. Pokud tedy je celé číslo,
Parametr lze odhadnout pomocí algoritmu pevného bodu.[2]
Funkce pravděpodobnostní hmotnosti F má vlastnost, že pro dostatečně velké k my máme

To znamená, že ocas distribuce Yule – Simon je realizací Zipfův zákon: lze použít například k modelování relativní frekvence nejčastější slovo ve velké sbírce textů, které podle Zipfova zákona je nepřímo úměrné na (obvykle malou) sílu .
Výskyt
Distribuce Yule – Simon vznikla původně jako omezující distribuce konkrétního stochastický proces studoval Yule jako model pro distribuci biologických taxonů a podtaxonů.[3] Simon nazval tento proces „Yule process“, ale dnes je běžněji známý jako a preferenční přílohu proces.[Citace je zapotřebí ] Proces preferenčního připojení je urnový proces ve kterém jsou koule přidávány k rostoucímu počtu uren, přičemž každá koule je přidělena urně s pravděpodobností lineární v počtu, který urna již obsahuje.
Distribuce také vzniká jako a složená distribuce, ve kterém je parametr a geometrické rozdělení je považováno za funkci náhodné proměnné mající exponenciální rozdělení.[Citace je zapotřebí ] Konkrétně to předpokládej následuje exponenciální rozdělení s měřítko nebo sazba :
s hustotou
Pak distribuovaná proměnná Yule – Simon K. má následující geometrické rozdělení podmíněné Ž:
PMF geometrického rozdělení je
pro . Yule – Simon pmf je pak následující exponenciálně-geometrické složené rozdělení:
The odhad maximální pravděpodobnosti pro parametr vzhledem k pozorování je řešením rovnice pevného bodu
kde jsou rychlost a tvarové parametry gama distribuce před .
Tento algoritmus odvozuje Garcia [2] přímou optimalizací pravděpodobnosti. Roberts a Roberts [4]
zobecnit algoritmus na Bayesian nastavení s výše popsanou složenou geometrickou formulací. Navíc Roberts a Roberts [4] jsou schopni používat Maximalizace očekávání (EM) framework pro zobrazení konvergence algoritmu pevného bodu. Navíc, Roberts a Roberts [4] odvodit sublinearitu konvergenční rychlosti pro algoritmus pevného bodu. Dále používají EM formulaci k získání 2 alternativních derivací standardní chyby odhadce z rovnice pevného bodu. Rozptyl odhad je
the standardní chyba je druhá odmocnina množství tohoto odhadu děleno N.
Zobecnění
Dvouparametrické zobecnění původní distribuce Yule nahradí funkci beta funkcí neúplná funkce beta. Funkce pravděpodobnostní hmotnosti zobecněného Yule-Simona (ρ, α) distribuce je definována jako
s . Pro obyčejný Yule – Simon (ρ) distribuce se získá jako zvláštní případ. Použití neúplné funkce beta má za následek zavedení exponenciálního omezení v horním ocasu.
Viz také
Bibliografie
- Colin Rose a Murray D. Smith, Matematická statistika s Mathematica. New York: Springer, 2002, ISBN 0-387-95234-9. (Viz strana 107, kde se tomu říká „Vánoční distribuce“.)
Reference
- ^ Simon, H. A. (1955). Msgstr "Na třídu funkcí zkosení distribuce". Biometrika. 42 (3–4): 425–440. doi:10.1093 / biomet / 42,3-4,425.
- ^ A b Garcia Garcia, Juan Manuel (2011). „Algoritmus s pevným bodem pro odhad distribučního parametru Yule-Simon“. Aplikovaná matematika a výpočet. 217 (21): 8560–8566. doi:10.1016 / j.amc.2011.03.092.
- ^ Yule, G. U. (1924). „Matematická teorie evoluce, založená na závěrech Dr. J. C. Willise, F.R.S“. Filozofické transakce královské společnosti B. 213 (402–410): 21–87. doi:10.1098 / rstb.1925.0002.
- ^ A b C Roberts, Lucas; Roberts, Denisa (2017). "Rámec maximalizace očekávání pro preferenční modely příloh". arXiv:1710.08511 [stat.CO ].