Exponenciálně upravené Gaussovo rozdělení - Exponentially modified Gaussian distribution - Wikipedia

EMG
Funkce hustoty pravděpodobnosti
Funkce hustoty pravděpodobnosti pro distribuci EMG
Funkce kumulativní distribuce
Funkce kumulativní distribuce pro distribuci EMG
ParametryμR - průměr Gaussovy složky
σ2 > 0 - rozptyl Gaussovy složky
λ > 0 - rychlost exponenciální složky
Podpěra, podporaXR
PDF
CDF

, kde
je CDF Gaussovy distribuce,
,

Znamenat
Režim

Rozptyl
Šikmost
Př. špičatost
MGF
CF

v teorie pravděpodobnosti, an exponenciálně upravené Gaussovo rozdělení (EMG, také známý jako exGaussian distribuce) popisuje součet nezávislých normální a exponenciální náhodné proměnné. ExGaussian náhodná proměnná Z lze vyjádřit jako Z = X + Y, kde X a Y jsou nezávislí, X je Gaussian se střední hodnotou μ a rozptyl σ2, a Y je exponenciální rychlosti λ. Má charakteristický pozitivní sklon od exponenciální složky.

Lze jej také považovat za váženou funkci posunutého exponenciálu, přičemž váha je funkcí normálního rozdělení.

Definice

The funkce hustoty pravděpodobnosti (pdf) exponenciálně upravených normální distribuce je[1]

kde erfc je doplňková chybová funkce definováno jako

Tato funkce hustoty je odvozena pomocí konvoluce normální a exponenciální funkce hustoty pravděpodobnosti.

Alternativní formy výpočtu

Alternativní, ale ekvivalentní forma distribuce EMG se používá pro popis tvaru píku v chromatografie.[2] Toto je následující

(1)

kde

je amplituda Gaussian,
je exponent relaxační čas.

Tuto funkci nelze vypočítat pro některé hodnoty parametrů (například τ = 0) kvůli aritmetickému přetečení. Alternativní, ale ekvivalentní formu psaní funkce navrhl Delley:[3]

(2)

kde je škálovaná doplňková chybová funkce

V případě tohoto vzorce je také možné aritmetické přetečení, oblast přetečení se liší od prvního vzorce, s výjimkou velmi malého τ.

Pro malé τ je rozumné použít asymptotickou formu druhého vzorce:

(3)

O použití vzorce se rozhoduje na základě parametru :

pro z Je třeba provést výpočet <0[2] podle prvního vzorce
pro 0 ≤ z ≤ 6.71·107 (v případě formát s plovoucí desetinnou čárkou s dvojitou přesností ) podle druhého vzorce,
a pro z > 6.71·107 podle třetího vzorce.

Režim (poloha vrcholu, nejpravděpodobnější hodnota) se vypočítá[2] s použitím derivátu vzorce 2; inverzní k škálovaná doplňková chybová funkce erfcxinv () se používá pro výpočet. Přibližné hodnoty navrhuje také Kalembet.[2] Ačkoli je režim na hodnotě vyšší než u původní Gaussian, vrchol je vždy umístěn na původní (nemodifikované) Gaussian.

Odhad parametrů

Existují tři parametry: znamenat normálního rozdělení (μ), standardní odchylka normálního rozdělení (σ) a exponenciální úpadek parametr (τ = 1 / λ). Tvar K. = τ / σ se také někdy používá k charakterizaci distribuce. V závislosti na hodnotách parametrů se rozdělení může lišit ve tvaru od téměř normálního po téměř exponenciální.

Parametry distribuce lze odhadnout z ukázkových dat pomocí metoda momentů jak následuje:[4][5]

kde m je průměr vzorku, s je standardní směrodatná odchylka a y1 je šikmost.

Jejich řešení pro parametry dává:

Doporučení

Ratcliff navrhl, aby ve vzorku bylo alespoň 100 datových bodů, než by odhady parametrů měly být považovány za spolehlivé.[6] Vincent průměrně lze použít u menších vzorků, protože tento postup pouze mírně narušuje tvar distribuce.[7] Tyto bodové odhady lze použít jako počáteční hodnoty, které lze vylepšit výkonnějšími metodami, včetně maximální pravděpodobnost.

Intervaly spolehlivosti

V současné době nejsou k dispozici žádné publikované tabulky pro testování významnosti s touto distribucí. Distribuci lze simulovat vytvořením součtu dvou náhodných proměnných, jedné čerpané z normálního rozdělení a druhé z exponenciálu.

Překroutit

Hodnota neparametrický zkosení

této distribuce leží mezi 0 a 0,31.[8][9] Dolní mez se přiblíží, když dominuje normální složka, a horní, když dominuje exponenciální složka.

Výskyt

Distribuce se používá jako teoretický model pro tvar chromatografické vrcholy.[1][2][10] Byl navržen jako statistický model intermitotický čas v dělících se buňkách.[11][12] Používá se také při modelování klastrových iontových paprsků.[13] To se běžně používá v psychologii a dalších vědách o mozku při studiu doby odezvy.[14][15] V mírné variantě, kde je průměr normální komponenty nastaven na nulu, se také používá v Stochastická hraniční analýza, jako jedna z distribučních specifikací pro složený chybový člen, který modeluje neefektivitu. [16]

Související distribuce

Tato rodina distribucí je zvláštním nebo limitujícím případem normální-exponenciální-gama rozdělení. Lze to také považovat za tříparametrické zobecnění normálního rozdělení, které přidá zkosení; další taková distribuce je zkosit normální rozdělení, který má tenčí ocasy. Distribuce je a složené rozdělení pravděpodobnosti ve kterém střední hodnota a normální distribuce se mění náhodně jako posunutý exponenciální rozdělení.

A Gaussova mínus exponenciální pro modelování cen opcí byla navržena distribuce.[17] Pokud taková náhodná proměnná Y má parametry μ, σ, λ, pak jeho negativní -Y má exponenciálně upravené Gaussovo rozdělení s parametry , σ, λ, a tudíž Y má průměr a rozptyl .

Reference

  1. ^ A b Grushka, Eli (1972). "Charakterizace exponenciálně modifikovaných Gaussových vrcholů v chromatografii". Analytická chemie. 44 (11): 1733–1738. doi:10.1021 / ac60319a011. PMID  22324584.
  2. ^ A b C d E Kalambet, Y .; Kozmin, Y .; Mikhailova, K .; Nagaev, I .; Tikhonov, P. (2011). Msgstr "Rekonstrukce chromatografických píku pomocí exponenciálně upravené Gaussovy funkce". Journal of Chemometrics. 25 (7): 352. doi:10.1002 / cem.1343. S2CID  121781856.
  3. ^ Delley, R (1985). "Série pro exponenciálně upravený tvar Gaussova vrcholu". Anální. Chem. 57: 388. doi:10.1021 / ac00279a094.
  4. ^ Dyson, N. A. (1998). Chromatografické integrační metody. Royal Society of Chemistry, Information Services. str. 27. ISBN  9780854045105. Citováno 2015-05-15.
  5. ^ Olivier J. a Norberg M. M. (2010) Pozitivně zkreslená data: Revisiting the Box − Cox power transformation. Int. J. Psych. Res. 3 (1) 68-75.
  6. ^ Ratcliff, R (1979). Msgstr "Skupinové distribuce doby reakce a analýza statistik distribuce". Psychol. Býk. 86 (3): 446–461. CiteSeerX  10.1.1.409.9863. doi:10.1037/0033-2909.86.3.446. PMID  451109.
  7. ^ Vincent, S. B. (1912). "Funkce vibrissae v chování bílé krysy". Monografie o chování zvířat. 1 (5): 7–81.
  8. ^ Heathcote, A (1996). „RTSYS: Aplikace DOS pro analýzu dat reakční doby“. Metody, přístroje a počítače pro výzkum chování. 28 (3): 427–445. doi:10.3758 / bf03200523.
  9. ^ Ulrich, R .; Miller, J. (1994). "Účinky vyloučení odlehlých hodnot na analýzu reakčního času". J. Exp. Psych .: Obecně. 123: 34–80. doi:10.1037/0096-3445.123.1.34.
  10. ^ Gladney, HM; Dowden, BF; Swalen, JD (1969). "Počítačem asistovaná plynová a kapalinová chromatografie". Anální. Chem. 41 (7): 883–888. doi:10.1021 / ac60276a013.
  11. ^ Golubev, A. (2010). "Exponenciálně modifikovaný Gaussian (EMG) význam pro distribuce související s buněčnou proliferací a diferenciací". Journal of Theoretical Biology. 262 (2): 257–266. doi:10.1016 / j.jtbi.2009.10.005. PMID  19825376.
  12. ^ Tyson, D. R.; Garbett, S. P .; Frick, P.L .; Quaranta, V. (2012). „Frakční proliferace: Metoda dekonvoluce dynamiky buněčné populace z jednobuněčných dat“. Přírodní metody. 9 (9): 923–928. doi:10.1038 / nmeth.2138. PMC  3459330. PMID  22886092.
  13. ^ Nicolaescu, D .; Takaoka, G. H .; Ishikawa, J. (2006). "Multiparametrická charakterizace klastrových iontových paprsků". Journal of Vacuum Science & Technology B: Microelectronics and Nanometer Structure. 24 (5): 2236. Bibcode:2006JVSTB..24.2236N. doi:10.1116/1.2335433.
  14. ^ Palmer, EM; Horowitz Todd, S; Torralba, A; Wolfe, JM (2011). „Jaké jsou tvary distribucí doby odezvy ve vizuálním vyhledávání?“. J Exp Psychol. 37 (1): 58–71. doi:10.1037 / a0020747. PMC  3062635. PMID  21090905.
  15. ^ Rohrer, D; Wixted, JT (1994). „Analýza latence a doby odezvy při volném vyvolání“. Paměť a poznání. 22 (5): 511–524. doi:10,3758 / BF03198390. PMID  7968547.
  16. ^ Lovell, Knox CA; SC Kumbhakar (2000). Stochastická hraniční analýza. Cambridge University Press. str. 80–82.
  17. ^ Peter Carr a Dilip B. Madan, Saddlepoint Methods for Option Pricing, The Journal of Computational Finance (49–61), svazek 13 / číslo 1, podzim 2009