Exponenciálně upravené Gaussovo rozdělení - Exponentially modified Gaussian distribution - Wikipedia
Funkce hustoty pravděpodobnosti ![]() | |||
Funkce kumulativní distribuce ![]() | |||
Parametry | μ ∈ R - průměr Gaussovy složky σ2 > 0 - rozptyl Gaussovy složky λ > 0 - rychlost exponenciální složky | ||
---|---|---|---|
Podpěra, podpora | X ∈ R | ||
CDF | , kde | ||
Znamenat | |||
Režim | |||
Rozptyl | |||
Šikmost | |||
Př. špičatost | |||
MGF | |||
CF |
v teorie pravděpodobnosti, an exponenciálně upravené Gaussovo rozdělení (EMG, také známý jako exGaussian distribuce) popisuje součet nezávislých normální a exponenciální náhodné proměnné. ExGaussian náhodná proměnná Z lze vyjádřit jako Z = X + Y, kde X a Y jsou nezávislí, X je Gaussian se střední hodnotou μ a rozptyl σ2, a Y je exponenciální rychlosti λ. Má charakteristický pozitivní sklon od exponenciální složky.
Lze jej také považovat za váženou funkci posunutého exponenciálu, přičemž váha je funkcí normálního rozdělení.
Definice
The funkce hustoty pravděpodobnosti (pdf) exponenciálně upravených normální distribuce je[1]
kde erfc je doplňková chybová funkce definováno jako
Tato funkce hustoty je odvozena pomocí konvoluce normální a exponenciální funkce hustoty pravděpodobnosti.
Alternativní formy výpočtu
Alternativní, ale ekvivalentní forma distribuce EMG se používá pro popis tvaru píku v chromatografie.[2] Toto je následující
- (1)
kde
- je amplituda Gaussian,
- je exponent relaxační čas.
Tuto funkci nelze vypočítat pro některé hodnoty parametrů (například τ = 0) kvůli aritmetickému přetečení. Alternativní, ale ekvivalentní formu psaní funkce navrhl Delley:[3]
- (2)
kde je škálovaná doplňková chybová funkce
V případě tohoto vzorce je také možné aritmetické přetečení, oblast přetečení se liší od prvního vzorce, s výjimkou velmi malého τ.
Pro malé τ je rozumné použít asymptotickou formu druhého vzorce:
- (3)
O použití vzorce se rozhoduje na základě parametru :
- pro z Je třeba provést výpočet <0[2] podle prvního vzorce
- pro 0 ≤ z ≤ 6.71·107 (v případě formát s plovoucí desetinnou čárkou s dvojitou přesností ) podle druhého vzorce,
- a pro z > 6.71·107 podle třetího vzorce.
Režim (poloha vrcholu, nejpravděpodobnější hodnota) se vypočítá[2] s použitím derivátu vzorce 2; inverzní k škálovaná doplňková chybová funkce erfcxinv () se používá pro výpočet. Přibližné hodnoty navrhuje také Kalembet.[2] Ačkoli je režim na hodnotě vyšší než u původní Gaussian, vrchol je vždy umístěn na původní (nemodifikované) Gaussian.
Odhad parametrů
Existují tři parametry: znamenat normálního rozdělení (μ), standardní odchylka normálního rozdělení (σ) a exponenciální úpadek parametr (τ = 1 / λ). Tvar K. = τ / σ se také někdy používá k charakterizaci distribuce. V závislosti na hodnotách parametrů se rozdělení může lišit ve tvaru od téměř normálního po téměř exponenciální.
Parametry distribuce lze odhadnout z ukázkových dat pomocí metoda momentů jak následuje:[4][5]
kde m je průměr vzorku, s je standardní směrodatná odchylka a y1 je šikmost.
Jejich řešení pro parametry dává:
Doporučení
Ratcliff navrhl, aby ve vzorku bylo alespoň 100 datových bodů, než by odhady parametrů měly být považovány za spolehlivé.[6] Vincent průměrně lze použít u menších vzorků, protože tento postup pouze mírně narušuje tvar distribuce.[7] Tyto bodové odhady lze použít jako počáteční hodnoty, které lze vylepšit výkonnějšími metodami, včetně maximální pravděpodobnost.
Intervaly spolehlivosti
V současné době nejsou k dispozici žádné publikované tabulky pro testování významnosti s touto distribucí. Distribuci lze simulovat vytvořením součtu dvou náhodných proměnných, jedné čerpané z normálního rozdělení a druhé z exponenciálu.
Překroutit
Hodnota neparametrický zkosení
této distribuce leží mezi 0 a 0,31.[8][9] Dolní mez se přiblíží, když dominuje normální složka, a horní, když dominuje exponenciální složka.
Výskyt
Distribuce se používá jako teoretický model pro tvar chromatografické vrcholy.[1][2][10] Byl navržen jako statistický model intermitotický čas v dělících se buňkách.[11][12] Používá se také při modelování klastrových iontových paprsků.[13] To se běžně používá v psychologii a dalších vědách o mozku při studiu doby odezvy.[14][15] V mírné variantě, kde je průměr normální komponenty nastaven na nulu, se také používá v Stochastická hraniční analýza, jako jedna z distribučních specifikací pro složený chybový člen, který modeluje neefektivitu. [16]
Související distribuce
Tato rodina distribucí je zvláštním nebo limitujícím případem normální-exponenciální-gama rozdělení. Lze to také považovat za tříparametrické zobecnění normálního rozdělení, které přidá zkosení; další taková distribuce je zkosit normální rozdělení, který má tenčí ocasy. Distribuce je a složené rozdělení pravděpodobnosti ve kterém střední hodnota a normální distribuce se mění náhodně jako posunutý exponenciální rozdělení.
A Gaussova mínus exponenciální pro modelování cen opcí byla navržena distribuce.[17] Pokud taková náhodná proměnná Y má parametry μ, σ, λ, pak jeho negativní -Y má exponenciálně upravené Gaussovo rozdělení s parametry -μ, σ, λ, a tudíž Y má průměr a rozptyl .
Reference
- ^ A b Grushka, Eli (1972). "Charakterizace exponenciálně modifikovaných Gaussových vrcholů v chromatografii". Analytická chemie. 44 (11): 1733–1738. doi:10.1021 / ac60319a011. PMID 22324584.
- ^ A b C d E Kalambet, Y .; Kozmin, Y .; Mikhailova, K .; Nagaev, I .; Tikhonov, P. (2011). Msgstr "Rekonstrukce chromatografických píku pomocí exponenciálně upravené Gaussovy funkce". Journal of Chemometrics. 25 (7): 352. doi:10.1002 / cem.1343. S2CID 121781856.
- ^ Delley, R (1985). "Série pro exponenciálně upravený tvar Gaussova vrcholu". Anální. Chem. 57: 388. doi:10.1021 / ac00279a094.
- ^ Dyson, N. A. (1998). Chromatografické integrační metody. Royal Society of Chemistry, Information Services. str. 27. ISBN 9780854045105. Citováno 2015-05-15.
- ^ Olivier J. a Norberg M. M. (2010) Pozitivně zkreslená data: Revisiting the Box − Cox power transformation. Int. J. Psych. Res. 3 (1) 68-75.
- ^ Ratcliff, R (1979). Msgstr "Skupinové distribuce doby reakce a analýza statistik distribuce". Psychol. Býk. 86 (3): 446–461. CiteSeerX 10.1.1.409.9863. doi:10.1037/0033-2909.86.3.446. PMID 451109.
- ^ Vincent, S. B. (1912). "Funkce vibrissae v chování bílé krysy". Monografie o chování zvířat. 1 (5): 7–81.
- ^ Heathcote, A (1996). „RTSYS: Aplikace DOS pro analýzu dat reakční doby“. Metody, přístroje a počítače pro výzkum chování. 28 (3): 427–445. doi:10.3758 / bf03200523.
- ^ Ulrich, R .; Miller, J. (1994). "Účinky vyloučení odlehlých hodnot na analýzu reakčního času". J. Exp. Psych .: Obecně. 123: 34–80. doi:10.1037/0096-3445.123.1.34.
- ^ Gladney, HM; Dowden, BF; Swalen, JD (1969). "Počítačem asistovaná plynová a kapalinová chromatografie". Anální. Chem. 41 (7): 883–888. doi:10.1021 / ac60276a013.
- ^ Golubev, A. (2010). "Exponenciálně modifikovaný Gaussian (EMG) význam pro distribuce související s buněčnou proliferací a diferenciací". Journal of Theoretical Biology. 262 (2): 257–266. doi:10.1016 / j.jtbi.2009.10.005. PMID 19825376.
- ^ Tyson, D. R.; Garbett, S. P .; Frick, P.L .; Quaranta, V. (2012). „Frakční proliferace: Metoda dekonvoluce dynamiky buněčné populace z jednobuněčných dat“. Přírodní metody. 9 (9): 923–928. doi:10.1038 / nmeth.2138. PMC 3459330. PMID 22886092.
- ^ Nicolaescu, D .; Takaoka, G. H .; Ishikawa, J. (2006). "Multiparametrická charakterizace klastrových iontových paprsků". Journal of Vacuum Science & Technology B: Microelectronics and Nanometer Structure. 24 (5): 2236. Bibcode:2006JVSTB..24.2236N. doi:10.1116/1.2335433.
- ^ Palmer, EM; Horowitz Todd, S; Torralba, A; Wolfe, JM (2011). „Jaké jsou tvary distribucí doby odezvy ve vizuálním vyhledávání?“. J Exp Psychol. 37 (1): 58–71. doi:10.1037 / a0020747. PMC 3062635. PMID 21090905.
- ^ Rohrer, D; Wixted, JT (1994). „Analýza latence a doby odezvy při volném vyvolání“. Paměť a poznání. 22 (5): 511–524. doi:10,3758 / BF03198390. PMID 7968547.
- ^ Lovell, Knox CA; SC Kumbhakar (2000). Stochastická hraniční analýza. Cambridge University Press. str. 80–82.
- ^ Peter Carr a Dilip B. Madan, Saddlepoint Methods for Option Pricing, The Journal of Computational Finance (49–61), svazek 13 / číslo 1, podzim 2009