Logit-normální distribuce - Logit-normal distribution
Funkce hustoty pravděpodobnosti ![]() | |||
Funkce kumulativní distribuce ![]() | |||
Zápis | |||
---|---|---|---|
Parametry | σ2 > 0 - čtvercová stupnice (skutečná), μ ∈ R - umístění | ||
Podpěra, podpora | X ∈ (0, 1) | ||
CDF | |||
Znamenat | žádné analytické řešení | ||
Medián | |||
Režim | žádné analytické řešení | ||
Rozptyl | žádné analytické řešení | ||
MGF | žádné analytické řešení |
v teorie pravděpodobnosti, a logit-normální distribuce je rozdělení pravděpodobnosti a náhodná proměnná jehož logit má normální distribuce. Li Y je náhodná proměnná s normálním rozdělením a P je standard logistická funkce, pak X = P(Y) má logit-normální distribuci; podobně, pokud X je tedy logicky normálně distribuován Y = logit (X) = log (X/(1-X)) je normálně distribuován. To je také známé jako logistické normální rozdělení,[1] který často odkazuje na multinomiální verzi logitu (např.[2][3][4][5]).
Proměnná může být modelována jako logit-normal, pokud se jedná o podíl, který je ohraničen nulou a jednou a kde se hodnoty nula a jedna nikdy nevyskytují.
Charakterizace
Funkce hustoty pravděpodobnosti
The funkce hustoty pravděpodobnosti (PDF) logit-normální distribuce, za 0 ≤ X ≤ 1, je:
kde μ a σ jsou znamenat a standardní odchylka proměnné logit (podle definice je logit proměnné normálně distribuován).
Hustota získaná změnou znaménka μ je symetrické v tom, že se rovná f (1-x; -μ,σ), posunutí režimu na druhou stranu 0,5 (střed intervalu (0,1)).

Okamžiky
Momenty logiticko-normálního rozdělení nemají analytické řešení. Okamžiky lze odhadnout podle numerická integrace, avšak numerická integrace může být neúměrná, když hodnoty jsou takové, že se funkce hustoty rozchází s nekonečnem v koncových bodech nula a jedna. Alternativou je použít pozorování, že logit-normal je transformace normální náhodné proměnné. To nám umožňuje aproximovat momenty pomocí následujícího kvazi Monte Carlo odhadu
kde je standardní logistická funkce a je inverzní kumulativní distribuční funkce normálního rozdělení se střední hodnotou a rozptylem .
Režim nebo režimy
Když se derivace hustoty rovná 0, pak umístění režimu x splňuje následující rovnici:
Pro některé hodnoty parametrů existují dvě řešení, tj. Distribuce je bimodální.
Vícerozměrné zobecnění
The logistické normální rozdělení je zobecnění logit – normálního rozdělení na vektory D-dimenzionální pravděpodobnosti provedením logistické transformace vícerozměrného normálního rozdělení.[6][7][8]
Funkce hustoty pravděpodobnosti
The funkce hustoty pravděpodobnosti je:
kde označuje vektor prvních (D-1) složek a označuje simplexní vektorů D-rozměrné pravděpodobnosti. To vyplývá z použití aditivní logistická transformace zmapovat a vícerozměrný normální náhodná proměnná do simplexu:

Jedinečné inverzní mapování je dáno:
- .
To je případ vektoru X které komponenty sečtou až jednu. V případě X se sigmoidními prvky, tj. kdy
my máme
kde log a rozdělení v argumentu jsou brány elementově. Je to proto, že jakobiánská matice transformace je diagonální s prvky .
Použití ve statistické analýze
Logistické normální rozdělení je flexibilnější alternativou k Dirichletova distribuce v tom, že dokáže zachytit korelace mezi složkami pravděpodobnostních vektorů. Má také potenciál zjednodušit statistické analýzy údaje o složení umožněním odpovědi na otázky týkající se logaritmů složek datových vektorů. Jeden se často zajímá spíše o poměry než o absolutní hodnoty komponent.
Pravděpodobnost simplex je ohraničený prostor, který vytváří standardní techniky, které se obvykle používají pro vektory v méně smysluplné. Aitchison popsal problém rušivých negativních korelací při aplikaci těchto metod přímo na jednoduché vektory.[7] Mapování kompozičních dat v inverzí aditivní logistické transformace poskytuje data se skutečnou hodnotou . Na tuto reprezentaci dat lze použít standardní techniky. Tento přístup ospravedlňuje použití logistického normálního rozdělení, které lze tedy považovat za „Gaussian simplexu“.
Vztah s Dirichletovou distribucí

The Dirichlet a logistické normální rozdělení není nikdy přesně stejné pro jakýkoli výběr parametrů. Aitchison však popsal metodu aproximace Dirichlet s logistickým normálem takovým, že jejich Kullback – Leiblerova divergence (KL) je minimalizováno:
To je minimalizováno:
Pomocí momentových vlastností Dirichletova rozdělení lze řešení zapsat z hlediska digamma a trigamma funkce:
Tato aproximace je zvláště přesná pro velké . Ve skutečnosti se to dá ukázat pro , máme to .
Viz také
- Distribuce beta a Distribuce kumaraswamy, další distribuce dvou parametrů na ohraničeném intervalu s podobnými tvary
Další čtení
- Frederic, P. & Lad, F. (2008) Dva okamžiky logitnormální distribuce. Komunikace v simulaci a výpočtu statistik. 37: 1263-1269
- Mead, R. (1965). "Zobecněná distribuce logit-normální". Biometrie. 21 (3): 721–732. doi:10.2307/2528553. JSTOR 2528553.
- ^ J. Atchison a SM Shen. „Logisticko-normální distribuce: Některé vlastnosti a použití.“ Biometrika, 1980. Odkaz Google Scholar
- ^ http://people.csail.mit.edu/tomasz/papers/huang_hln_tech_report_2006.pdf
- ^ Peter Hoff, 2003. Odkaz
- ^ „SpringerReference - Meteor“. www.springerreference.com. Citováno 18. dubna 2018.
- ^ „Log-normal and logistic-normal terminology - AI and Social Science - Brendan O'Connor“. brenocon.com. Citováno 18. dubna 2018.
- ^ Aitchison, J .; Shen, S. M. (1980). "Logisticko-normální distribuce: Některé vlastnosti a použití". Biometrika. 67 (2): 261. doi:10.2307/2335470. ISSN 0006-3444. JSTOR 2335470.
- ^ A b J. Atchison. „Statistická analýza kompozičních údajů.“ Monografie o statistice a aplikované pravděpodobnosti, Chapman a Hall, 1986. Rezervovat
- ^ Hinde, Johne (2011). "Logistické normální rozdělení". V Lovric, Miodrag (ed.). Mezinárodní encyklopedie statistických věd. Springer. 754–755. doi:10.1007/978-3-642-04898-2_342. ISBN 978-3-642-04897-5.
externí odkazy
- balíček logitnorm pro R