Zkrácené normální rozdělení - Truncated normal distribution
Funkce hustoty pravděpodobnosti ![]() Funkce hustoty pravděpodobnosti pro zkrácené normální rozdělení pro různé sady parametrů. Ve všech případech, A = −10 a b = 10. Pro černou: μ = −8, σ = 2; modrý: μ = 0, σ = 2; Červené: μ = 9, σ = 10; oranžový: μ = 0, σ = 10. | |||
Funkce kumulativní distribuce ![]() Funkce kumulativní distribuce pro zkrácené normální rozdělení pro různé sady parametrů. Ve všech případech, A = −10 a b = 10. Pro černou: μ = −8, σ = 2; modrý: μ = 0, σ = 2; Červené: μ = 9, σ = 10; oranžový: μ = 0, σ = 10. | |||
Zápis | |||
---|---|---|---|
Parametry | μ ∈ R σ2 ≥ 0 (ale viz definice) a ∈ R - minimální hodnota X b ∈ R - maximální hodnota X (b > A) | ||
Podpěra, podpora | X ∈ [A,b] | ||
[1] | |||
CDF | |||
Znamenat | |||
Medián | |||
Režim | |||
Rozptyl | |||
Entropie | |||
MGF |
V pravděpodobnosti a statistikách zkrácené normální rozdělení je rozdělení pravděpodobnosti odvozené od rozdělení a normálně distribuováno náhodná proměnná ohraničením náhodné proměnné zdola nebo shora (nebo obojí). Zkrácená normální distribuce má široké uplatnění ve statistikách a ekonometrie. Například se používá k modelování pravděpodobností binárních výsledků v probit model a modelovat cenzurovaná data v Tobitův model.
Definice
Předpokládat má normální rozdělení se střední hodnotou a rozptyl a leží v intervalu . Pak podmíněno má zkrácené normální rozdělení.
Své funkce hustoty pravděpodobnosti, , pro , darováno
a tím v opačném případě.
Tady,
je funkce hustoty pravděpodobnosti standardní normální rozdělení a je jeho kumulativní distribuční funkce
Podle definice, pokud , pak a podobně, pokud , pak .
Výše uvedené vzorce ukazují, že když parametr měřítka zkráceného normálního rozdělení může předpokládat záporné hodnoty. Parametr je v tomto případě imaginární, ale funkce je nicméně skutečný, pozitivní a normalizovatelný. Parametr měřítka z kanonický normální rozdělení musí být kladné, protože jinak by rozdělení nebylo normalizovatelné. Na druhou stranu dvojnásobně zkrácené normální rozdělení může mít v zásadě parametr záporného měřítka (který se liší od rozptylu, viz souhrnné vzorce), protože na ohraničené doméně nevznikají žádné takové problémy s integrovatelností. V tomto případě nelze distribuci interpretovat jako kanonickou normálu podmíněnou , samozřejmě, ale stále lze interpretovat jako distribuce maximální entropie s omezením prvního a druhého okamžiku a má další zvláštní vlastnost: představuje dva místní maxima namísto jednoho, umístěného na a .
Vlastnosti
Zkrácený normál je maximální rozdělení pravděpodobnosti entropie pro pevný průměr a rozptyl s náhodnou odchylkou X omezen tak, aby byl v intervalu [a, b].
Okamžiky
Pokud byla náhodná proměnná zkrácena pouze zespodu, byla nějaká hmotnost pravděpodobnosti posunuta na vyšší hodnoty, což znamená a stochasticky dominuje první řád distribuce, a tedy zvýšení průměru na hodnotu vyšší, než je průměr původního normálního rozdělení. Podobně, pokud byla náhodná proměnná zkrácena pouze shora, zkrácená distribuce má průměr menší než
Bez ohledu na to, zda je náhodná proměnná ohraničena nad, pod nebo oběma, je zkrácení a střední kontrakce v kombinaci se střední změnou tuhého posunu, a proto je rozptyl zkráceného rozdělení menší než rozptyl původního normálního rozdělení.
Oboustranné zkrácení[2]
Nechat a . Pak:
a
Při numerickém hodnocení těchto vzorců je třeba postupovat opatrně, což může vést k katastrofické zrušení když je interval neobsahuje . Existují lepší způsoby, jak je přepsat, které se tomuto problému vyhnou.[3]
Jednostranné zkrácení (dolního ocasu)[4]
V tomto případě pak
a
kde
Jednostranné zkrácení (horního ocasu)
,
Barr a Sherrill (1999) podávají jednodušší výraz pro rozptyl jednostranných zkrácení. Jejich vzorec je z hlediska chí-kvadrátu CDF, který je implementován ve standardních softwarových knihovnách. Bebu a Mathew (2009) poskytují vzorce pro (zobecněné) intervaly spolehlivosti kolem zkrácených momentů.
- Rekurzivní vzorec
Pokud jde o nezkrácený případ, existuje rekurzivní vzorec pro zkrácené okamžiky.[5]
Vícerozměrný
Vypočítat okamžiky zkráceného normálu s více proměnnými je těžší.
Výpočtové metody
Generování hodnot ze zkráceného normálního rozdělení
Náhodná varieta x definovaná jako s kumulativní distribuční funkce a jeho inverzní, jednotné náhodné číslo zapnuto , následuje distribuce zkrácená na rozsah . To je prostě metoda inverzní transformace pro simulaci náhodných proměnných. Ačkoli je tato metoda jednou z nejjednodušších, může buď selhat při vzorkování na konci normálního rozdělení,[6] nebo být příliš pomalý.[7] V praxi tedy musíme hledat alternativní metody simulace.
Jeden takový zkrácený normální generátor (implementován v Matlab andin R (programovací jazyk) tak jako trandn.R ) je založen na myšlence odmítnutí přijetí kvůli Marsaglii.[8] Navzdory mírně neoptimální míře přijetí Marsaglie (1964) ve srovnání s Robertem (1995) je Marsagliina metoda obvykle rychlejší,[7] protože to nevyžaduje nákladné numerické vyhodnocení exponenciální funkce.
Další informace o simulaci čerpání ze zkráceného normálního rozdělení viz Robert (1995), Lynch (2007), část 8.1.3 (strany 200–206), Devroye (1986). The MSM balíček v R má funkci, rtnorm, který vypočítává tahy ze zkráceného normálu. The truncnorm balíček v R má také funkce pro čerpání ze zkráceného normálu.
Chopin (2011) navrhl (arXiv ) algoritmus inspirovaný Zigguratovým algoritmem Marsaglia a Tsang (1984, 2000), který je obvykle považován za nejrychlejší Gaussův vzorkovač, a je také velmi blízký Ahrensovu algoritmu (1995). Implementace lze nalézt v C, C ++, Matlab a Krajta.
Odběr vzorků z vícerozměrný zkrácená normální distribuce je podstatně obtížnější.[9] Přesná nebo dokonalá simulace je možná pouze v případě zkrácení normálního rozdělení do oblasti mnohostěnů.[9] [10] V obecnějších případech Damien a Walker (2001) zavádějí obecnou metodiku vzorkování zkrácených hustot v rámci Gibbsův odběr vzorků rámec. Jejich algoritmus zavádí jednu latentní proměnnou a v rámci Gibbsova vzorkovacího rámce je výpočetně účinnější než algoritmus Roberta (1995).
Viz také
- Skládané normální rozdělení
- Napůl normální rozdělení
- Normální distribuce
- Usměrněné Gaussovo rozdělení
- Zkrácená distribuce
- Distribuce PERT
![]() | Tento článek obsahuje seznam obecných Reference, ale zůstává z velké části neověřený, protože postrádá dostatečné odpovídající vložené citace.Červen 2010) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
Poznámky
- ^ „Přednáška 4: Výběr“ (PDF). web.ist.utl.pt. Instituto Superior Técnico. 11. listopadu 2002. str. 1. Citováno 14. července 2015.
- ^ Johnson, N.L., Kotz, S., Balakrishnan, N. (1994) Continuous Univariate Distribuce, díl 1Wiley. ISBN 0-471-58495-9 (Oddíl 10.1)
- ^ Fernandez-de-Cossio-Diaz, Jorge (06.12.2017), TruncatedNormal.jl: Vypočítejte průměr a rozptyl jednorozměrného zkráceného normálního rozdělení (funguje daleko od vrcholu), vyvoláno 2017-12-06
- ^ Greene, William H. (2003). Ekonometrická analýza (5. vydání). Prentice Hall. ISBN 978-0-13-066189-0.
- ^ Dokument Erica Orjebina, “http://www.smp.uq.edu.au/people/YoniNazarathy/teaching_projects/studentWork/EricOrjebin_TruncatedNormalMoments.pdf "
- ^ Kroese, D. P.; Taimre, T .; Botev, Z. I. (2011). Příručka metod Monte Carlo. John Wiley & Sons.
- ^ A b Botev, Z. I .; L'Ecuyer, P. (2017). "Simulace z normálního rozdělení zkrácena na interval v ocasu". 10. mezinárodní konference EAI o metodikách a nástrojích hodnocení výkonu. 25. – 28. Října 2016 Taormina, Itálie: ACM. 23–29. doi:10.4108 / eai.25-10-2016.2266879. ISBN 978-1-63190-141-6.CS1 maint: umístění (odkaz)
- ^ Marsaglia, George (1964). Msgstr "Generování proměnné od konce normálního rozdělení". Technometrics. 6 (1): 101–102. doi:10.2307/1266749. JSTOR 1266749.
- ^ A b Botev, Z. I. (2016). "Normální zákon pod lineárními omezeními: simulace a odhad pomocí naklonění minimax". Journal of the Royal Statistical Society, Series B. 79: 125–148. arXiv:1603.04166. doi:10.1111 / rssb.12162. S2CID 88515228.
- ^ Botev, Zdravko & L'Ecuyer, Pierre (2018). „Kapitola 8: Simulace z ocasu univariačního a vícerozměrného normálního rozdělení“. V Puliafito, Antonio (ed.). Systémové modelování: Metodiky a nástroje. Inovace EAI / Springer v oblasti komunikace a výpočetní techniky. Springer, Cham. str. 115–132. doi:10.1007/978-3-319-92378-9_8. ISBN 978-3-319-92377-2. S2CID 125554530.
Reference
- Greene, William H. (2003). Ekonometrická analýza (5. vydání). Prentice Hall. ISBN 978-0-13-066189-0.
- Norman L. Johnson a Samuel Kotz (1970). Kontinuální jednorozměrné distribuce-1, kapitola 13. John Wiley & Sons.
- Lynch, Scott (2007). Úvod do aplikované Bayesovské statistiky a odhadu pro vědce v sociální oblasti. New York: Springer. ISBN 978-1-4419-2434-6.
- Robert, Christian P. (1995). Msgstr "Simulace zkrácených normálních proměnných". Statistika a výpočetní technika. 5 (2): 121–125. arXiv:0907.4010. doi:10.1007 / BF00143942. S2CID 15943491.
- Barr, Donald R .; Sherrill, E.Todd (1999). "Průměr a rozptyl zkrácených normálních distribucí". Americký statistik. 53 (4): 357–361. doi:10.1080/00031305.1999.10474490.
- Bebu, Ionut; Mathew, Thomas (2009). "Intervaly spolehlivosti pro omezené okamžiky a zkrácené okamžiky v normálních a lognormálních modelech". Statistika a pravděpodobnostní dopisy. 79 (3): 375–380. doi:10.1016 / j.spl.2008.09.006.
- Damien, Paul; Walker, Stephen G. (2001). "Vzorkování zkráceno normální, beta a gama hustoty". Journal of Computational and Graphical Statistics. 10 (2): 206–215. doi:10.1198/10618600152627906. S2CID 123156320.
- Nicolas Chopin, „Rychlá simulace zkrácených Gaussových distribucí“. Statistiky a výpočty 21(2): 275-288, 2011, doi:10.1007 / s11222-009-9168-1
- Burkardt, John. „Zkrácená normální distribuce“ (PDF). Webové stránky Katedra vědeckých výpočtů. Florida State University. Citováno 15. února 2018.