Exponenciálně upravené Gaussovo rozdělení - Exponentially modified Gaussian distribution - Wikipedia

EMG
	Funkce hustoty pravděpodobnosti
	Funkce kumulativní distribuce
Parametry	μ ∈ R - průměr Gaussovy složky; σ2 > 0 - rozptyl Gaussovy složky; λ > 0 - rychlost exponenciální složky
Podpěra, podpora	X ∈ R
PDF
CDF	, kde; je CDF Gaussovy distribuce,; ,;
Znamenat
Režim
Rozptyl
Šikmost
Př. špičatost
MGF
CF

v teorie pravděpodobnosti, an exponenciálně upravené Gaussovo rozdělení (EMG, také známý jako exGaussian distribuce) popisuje součet nezávislých normální a exponenciální náhodné proměnné. ExGaussian náhodná proměnná Z lze vyjádřit jako Z = X + Y, kde X a Y jsou nezávislí, X je Gaussian se střední hodnotou μ a rozptyl σ², a Y je exponenciální rychlosti λ. Má charakteristický pozitivní sklon od exponenciální složky.

Lze jej také považovat za váženou funkci posunutého exponenciálu, přičemž váha je funkcí normálního rozdělení.

Definice

The funkce hustoty pravděpodobnosti (pdf) exponenciálně upravených normální distribuce je^[1]

{ displaystyle f (x; mu, sigma, lambda) = { frac { lambda} {2}} e ^ {{ frac { lambda} {2}} (2 mu + lambda sigma ^ {2} -2x)} operatorname {erfc} left ({ frac { mu + lambda sigma ^ {2} -x} {{ sqrt {2}} sigma}} right) ,}

kde erfc je doplňková chybová funkce definováno jako

{ displaystyle { begin {seřazeno} operatorname {erfc} (x) & = 1- operatorname {erf} (x) & = { frac {2} { sqrt { pi}}} int _ {x} ^ { infty} e ^ {- t ^ {2}} , dt. end {zarovnáno}}}

Tato funkce hustoty je odvozena pomocí konvoluce normální a exponenciální funkce hustoty pravděpodobnosti.

Alternativní formy výpočtu

Alternativní, ale ekvivalentní forma distribuce EMG se používá pro popis tvaru píku v chromatografie.^[2] Toto je následující

{ displaystyle f (x; h, mu, sigma, tau) = { frac {h sigma} { tau}} { sqrt { frac { pi} {2}}} exp left ({ frac {1} {2}} left ({ frac { sigma} { tau}} right) ^ {2} - { frac {x- mu} { tau}} vpravo) operatorname {erfc} vlevo ({ frac {1} { sqrt {2}}} vlevo ({ frac { sigma} { tau}} - { frac {x- mu} { sigma}} right) right),}

(1)

kde

{ displaystyle h}

je amplituda Gaussian,

{ displaystyle tau = { frac {1} { lambda}}}

je exponent relaxační čas.

Tuto funkci nelze vypočítat pro některé hodnoty parametrů (například τ = 0) kvůli aritmetickému přetečení. Alternativní, ale ekvivalentní formu psaní funkce navrhl Delley:^[3]

{ displaystyle f (x; h, mu, sigma, tau) = h exp left (- { frac {1} {2}} left ({ frac {x- mu} { sigma}} right) ^ {2} right) { frac { sigma} { tau}} { sqrt { frac { pi} {2}}} operatorname {erfcx} left ({ frac {1} { sqrt {2}}} left ({ frac { sigma} { tau}} - { frac {x- mu} { sigma}} right) right), }

(2)

kde ${ displaystyle operatorname {erfcx} t = exp t ^ {2} cdot operatorname {erfc} t}$ je škálovaná doplňková chybová funkce

V případě tohoto vzorce je také možné aritmetické přetečení, oblast přetečení se liší od prvního vzorce, s výjimkou velmi malého τ.

Pro malé τ je rozumné použít asymptotickou formu druhého vzorce:

{ displaystyle f (x; h, mu, sigma, tau) = { frac {h exp left (- { frac {1} {2}} left ({ frac {x- mu} { sigma}} right) ^ {2} right)} {1 + { frac { left (x- mu right) tau} { sigma ^ {2}}}}}, }

(3)

O použití vzorce se rozhoduje na základě parametru ${ displaystyle z = { frac {1} { sqrt {2}}} vlevo ({ frac { sigma} { tau}} - { frac {x- mu} { sigma}} že jo)}$ :

pro z Je třeba provést výpočet <0^[2] podle prvního vzorce

pro 0 ≤ z ≤ 6.71·10⁷ (v případě formát s plovoucí desetinnou čárkou s dvojitou přesností ) podle druhého vzorce,

a pro z > 6.71·10⁷ podle třetího vzorce.

Režim (poloha vrcholu, nejpravděpodobnější hodnota) se vypočítá^[2] s použitím derivátu vzorce 2; inverzní k škálovaná doplňková chybová funkce erfcxinv () se používá pro výpočet. Přibližné hodnoty navrhuje také Kalembet.^[2] Ačkoli je režim na hodnotě vyšší než u původní Gaussian, vrchol je vždy umístěn na původní (nemodifikované) Gaussian.

Odhad parametrů

Existují tři parametry: znamenat normálního rozdělení (μ), standardní odchylka normálního rozdělení (σ) a exponenciální úpadek parametr (τ = 1 / λ). Tvar K. = τ / σ se také někdy používá k charakterizaci distribuce. V závislosti na hodnotách parametrů se rozdělení může lišit ve tvaru od téměř normálního po téměř exponenciální.

Parametry distribuce lze odhadnout z ukázkových dat pomocí metoda momentů jak následuje:^[4]^[5]

{ displaystyle m = mu + tau,}

{ displaystyle s ^ {2} = sigma ^ {2} + tau ^ {2},}

{ displaystyle gamma _ {1} = { frac {2 tau ^ {3}} {( sigma ^ {2} + tau ^ {2}) ^ {3/2}}},}

kde m je průměr vzorku, s je standardní směrodatná odchylka a y₁ je šikmost.

Jejich řešení pro parametry dává:

{ displaystyle { hat { mu}} = m-s vlevo ({ frac { gamma _ {1}} {2}} vpravo) ^ {1/3},}

{ displaystyle { hat { sigma ^ {2}}} = s ^ {2} left [1- left ({ frac { gamma _ {1}} {2}} right) ^ {2 / 3} vpravo],}

{ displaystyle { hat { tau}} = s left ({ frac { gamma _ {1}} {2}} right) ^ {1/3}.}

Doporučení

Ratcliff navrhl, aby ve vzorku bylo alespoň 100 datových bodů, než by odhady parametrů měly být považovány za spolehlivé.^[6] Vincent průměrně lze použít u menších vzorků, protože tento postup pouze mírně narušuje tvar distribuce.^[7] Tyto bodové odhady lze použít jako počáteční hodnoty, které lze vylepšit výkonnějšími metodami, včetně maximální pravděpodobnost.

Intervaly spolehlivosti

V současné době nejsou k dispozici žádné publikované tabulky pro testování významnosti s touto distribucí. Distribuci lze simulovat vytvořením součtu dvou náhodných proměnných, jedné čerpané z normálního rozdělení a druhé z exponenciálu.

Překroutit

Hodnota neparametrický zkosení

{ displaystyle { frac {{ text {mean}} - { text {median}}} { text {standardní odchylka}}}}

této distribuce leží mezi 0 a 0,31.^[8]^[9] Dolní mez se přiblíží, když dominuje normální složka, a horní, když dominuje exponenciální složka.

Výskyt

Distribuce se používá jako teoretický model pro tvar chromatografické vrcholy.^[1]^[2]^[10] Byl navržen jako statistický model intermitotický čas v dělících se buňkách.^[11]^[12] Používá se také při modelování klastrových iontových paprsků.^[13] To se běžně používá v psychologii a dalších vědách o mozku při studiu doby odezvy.^[14]^[15] V mírné variantě, kde je průměr normální komponenty nastaven na nulu, se také používá v Stochastická hraniční analýza, jako jedna z distribučních specifikací pro složený chybový člen, který modeluje neefektivitu. ^[16]

Související distribuce

Tato rodina distribucí je zvláštním nebo limitujícím případem normální-exponenciální-gama rozdělení. Lze to také považovat za tříparametrické zobecnění normálního rozdělení, které přidá zkosení; další taková distribuce je zkosit normální rozdělení, který má tenčí ocasy. Distribuce je a složené rozdělení pravděpodobnosti ve kterém střední hodnota a normální distribuce se mění náhodně jako posunutý exponenciální rozdělení.

A Gaussova mínus exponenciální pro modelování cen opcí byla navržena distribuce.^[17] Pokud taková náhodná proměnná Y má parametry μ, σ, λ, pak jeho negativní -Y má exponenciálně upravené Gaussovo rozdělení s parametry -μ, σ, λ, a tudíž Y má průměr ${ displaystyle mu - { tfrac {1} { lambda}}}$ a rozptyl ${ displaystyle sigma ^ {2} + { tfrac {1} { lambda ^ {2}}}}$ .

Reference

^ ^A ^b Grushka, Eli (1972). "Charakterizace exponenciálně modifikovaných Gaussových vrcholů v chromatografii". Analytická chemie. 44 (11): 1733–1738. doi:10.1021 / ac60319a011. PMID 22324584.
^ ^A ^b ^C ^d ^E Kalambet, Y .; Kozmin, Y .; Mikhailova, K .; Nagaev, I .; Tikhonov, P. (2011). Msgstr "Rekonstrukce chromatografických píku pomocí exponenciálně upravené Gaussovy funkce". Journal of Chemometrics. 25 (7): 352. doi:10.1002 / cem.1343. S2CID 121781856.
^ Delley, R (1985). "Série pro exponenciálně upravený tvar Gaussova vrcholu". Anální. Chem. 57: 388. doi:10.1021 / ac00279a094.
^ Dyson, N. A. (1998). Chromatografické integrační metody. Royal Society of Chemistry, Information Services. str. 27. ISBN 9780854045105. Citováno 2015-05-15.
^ Olivier J. a Norberg M. M. (2010) Pozitivně zkreslená data: Revisiting the Box − Cox power transformation. Int. J. Psych. Res. 3 (1) 68-75.
^ Ratcliff, R (1979). Msgstr "Skupinové distribuce doby reakce a analýza statistik distribuce". Psychol. Býk. 86 (3): 446–461. CiteSeerX 10.1.1.409.9863. doi:10.1037/0033-2909.86.3.446. PMID 451109.
^ Vincent, S. B. (1912). "Funkce vibrissae v chování bílé krysy". Monografie o chování zvířat. 1 (5): 7–81.
^ Heathcote, A (1996). „RTSYS: Aplikace DOS pro analýzu dat reakční doby“. Metody, přístroje a počítače pro výzkum chování. 28 (3): 427–445. doi:10.3758 / bf03200523.
^ Ulrich, R .; Miller, J. (1994). "Účinky vyloučení odlehlých hodnot na analýzu reakčního času". J. Exp. Psych .: Obecně. 123: 34–80. doi:10.1037/0096-3445.123.1.34.
^ Gladney, HM; Dowden, BF; Swalen, JD (1969). "Počítačem asistovaná plynová a kapalinová chromatografie". Anální. Chem. 41 (7): 883–888. doi:10.1021 / ac60276a013.
^ Golubev, A. (2010). "Exponenciálně modifikovaný Gaussian (EMG) význam pro distribuce související s buněčnou proliferací a diferenciací". Journal of Theoretical Biology. 262 (2): 257–266. doi:10.1016 / j.jtbi.2009.10.005. PMID 19825376.
^ Tyson, D. R.; Garbett, S. P .; Frick, P.L .; Quaranta, V. (2012). „Frakční proliferace: Metoda dekonvoluce dynamiky buněčné populace z jednobuněčných dat“. Přírodní metody. 9 (9): 923–928. doi:10.1038 / nmeth.2138. PMC 3459330. PMID 22886092.
^ Nicolaescu, D .; Takaoka, G. H .; Ishikawa, J. (2006). "Multiparametrická charakterizace klastrových iontových paprsků". Journal of Vacuum Science & Technology B: Microelectronics and Nanometer Structure. 24 (5): 2236. Bibcode:2006JVSTB..24.2236N. doi:10.1116/1.2335433.
^ Palmer, EM; Horowitz Todd, S; Torralba, A; Wolfe, JM (2011). „Jaké jsou tvary distribucí doby odezvy ve vizuálním vyhledávání?“. J Exp Psychol. 37 (1): 58–71. doi:10.1037 / a0020747. PMC 3062635. PMID 21090905.
^ Rohrer, D; Wixted, JT (1994). „Analýza latence a doby odezvy při volném vyvolání“. Paměť a poznání. 22 (5): 511–524. doi:10,3758 / BF03198390. PMID 7968547.
^ Lovell, Knox CA; SC Kumbhakar (2000). Stochastická hraniční analýza. Cambridge University Press. str. 80–82.
^ Peter Carr a Dilip B. Madan, Saddlepoint Methods for Option Pricing, The Journal of Computational Finance (49–61), svazek 13 / číslo 1, podzim 2009

[Grushka1972-1] A ^b Grushka, Eli (1972). "Charakterizace exponenciálně modifikovaných Gaussových vrcholů v chromatografii". Analytická chemie. 44 (11): 1733–1738. doi:10.1021 / ac60319a011. PMID 22324584.

[Kalambet2011-2] A ^b ^C ^d ^E Kalambet, Y .; Kozmin, Y .; Mikhailova, K .; Nagaev, I .; Tikhonov, P. (2011). Msgstr "Rekonstrukce chromatografických píku pomocí exponenciálně upravené Gaussovy funkce". Journal of Chemometrics. 25 (7): 352. doi:10.1002 / cem.1343. S2CID 121781856.

[Delley1985-3] Delley, R (1985). "Série pro exponenciálně upravený tvar Gaussova vrcholu". Anální. Chem. 57: 388. doi:10.1021 / ac00279a094.

[google-4] Dyson, N. A. (1998). Chromatografické integrační metody. Royal Society of Chemistry, Information Services. str. 27. ISBN 9780854045105. Citováno 2015-05-15.

[Olivier2010-5] Olivier J. a Norberg M. M. (2010) Pozitivně zkreslená data: Revisiting the Box − Cox power transformation. Int. J. Psych. Res. 3 (1) 68-75.

[Ratcliff1979-6] Ratcliff, R (1979). Msgstr "Skupinové distribuce doby reakce a analýza statistik distribuce". Psychol. Býk. 86 (3): 446–461. CiteSeerX 10.1.1.409.9863. doi:10.1037/0033-2909.86.3.446. PMID 451109.

[Vincent1912-7] Vincent, S. B. (1912). "Funkce vibrissae v chování bílé krysy". Monografie o chování zvířat. 1 (5): 7–81.

[Heathcote1996-8] Heathcote, A (1996). „RTSYS: Aplikace DOS pro analýzu dat reakční doby“. Metody, přístroje a počítače pro výzkum chování. 28 (3): 427–445. doi:10.3758 / bf03200523.

[Ulrich1994-9] Ulrich, R .; Miller, J. (1994). "Účinky vyloučení odlehlých hodnot na analýzu reakčního času". J. Exp. Psych .: Obecně. 123: 34–80. doi:10.1037/0096-3445.123.1.34.

[Gladney1969-10] Gladney, HM; Dowden, BF; Swalen, JD (1969). "Počítačem asistovaná plynová a kapalinová chromatografie". Anální. Chem. 41 (7): 883–888. doi:10.1021 / ac60276a013.

[Golubev2010-11] Golubev, A. (2010). "Exponenciálně modifikovaný Gaussian (EMG) význam pro distribuce související s buněčnou proliferací a diferenciací". Journal of Theoretical Biology. 262 (2): 257–266. doi:10.1016 / j.jtbi.2009.10.005. PMID 19825376.

[Tyson2012-12] Tyson, D. R.; Garbett, S. P .; Frick, P.L .; Quaranta, V. (2012). „Frakční proliferace: Metoda dekonvoluce dynamiky buněčné populace z jednobuněčných dat“. Přírodní metody. 9 (9): 923–928. doi:10.1038 / nmeth.2138. PMC 3459330. PMID 22886092.

[13] Nicolaescu, D .; Takaoka, G. H .; Ishikawa, J. (2006). "Multiparametrická charakterizace klastrových iontových paprsků". Journal of Vacuum Science & Technology B: Microelectronics and Nanometer Structure. 24 (5): 2236. Bibcode:2006JVSTB..24.2236N. doi:10.1116/1.2335433.

[Palmer2011-14] Palmer, EM; Horowitz Todd, S; Torralba, A; Wolfe, JM (2011). „Jaké jsou tvary distribucí doby odezvy ve vizuálním vyhledávání?“. J Exp Psychol. 37 (1): 58–71. doi:10.1037 / a0020747. PMC 3062635. PMID 21090905.

[Rohrer1994-15] Rohrer, D; Wixted, JT (1994). „Analýza latence a doby odezvy při volném vyvolání“. Paměť a poznání. 22 (5): 511–524. doi:10,3758 / BF03198390. PMID 7968547.

[16] Lovell, Knox CA; SC Kumbhakar (2000). Stochastická hraniční analýza. Cambridge University Press. str. 80–82.

[17] Peter Carr a Dilip B. Madan, Saddlepoint Methods for Option Pricing, The Journal of Computational Finance (49–61), svazek 13 / číslo 1, podzim 2009

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

Pravděpodobnostní rozdělení (Seznam )
Diskrétní univariate s konečnou podporou	Benford Bernoulli beta-binomický binomický kategorický hypergeometrický Poissonův binomický Rademacher soliton diskrétní uniforma Zipf Zipf – Mandelbrot
Diskrétní univariate s nekonečnou podporou	beta negativní binomický Borel Conway – Maxwell – Poisson diskrétní fázový typ Delaporte rozšířený záporný binomický Flory – Schulz Gauss – Kuzmin geometrický logaritmický negativní binomický Panjer parabolický fraktál jed Skellam Yule – Simon zeta
Kontinuální univariate podporováno v omezeném intervalu	arcsine ARGUS Plešatění - Nichols Bates beta beta obdélníkový kontinuální Bernoulli Irwin – Hall Kumaraswamy logit-normální noncentral beta zvýšený kosinus reciproční trojúhelníkový U-kvadratický jednotný Wigner půlkruh
Kontinuální univariate podporováno v poloneomezeném intervalu	Benini Benktander 1. druhu Benktander 2. druhu beta prime Burr chi-kvadrát chi Dagum Davise exponenciálně-logaritmická Erlang exponenciální F složené normální Fréchet gama gama / Gompertz zobecněná gama generalizovaná inverzní Gaussian Gompertz poloviční logistika napůl normální Hotelling's T- naštvaný hyper-Erlang hyperexponenciální hypoexponenciální inverzní chí-kvadrát měřítko inverzní chi-kvadrát inverzní Gaussian inverzní gama Kolmogorov Lévy log-Cauchy log-Laplace log-logistické normální log Lomax matice-exponenciální Maxwell – Boltzmann Maxwell – Jüttner Mittag-Leffler Nakagami necentrální chi-kvadrát necentrální F Pareto fázový typ poly-Weibull Rayleigh relativistický Breit – Wigner Rýže posunul Gompertz zkrácen normální Gumbel typu 2 Weibulle diskrétní Weibull Wilksova lambda
Kontinuální univariate podporováno na celé reálné linii	Cauchy exponenciální síla Fisher z Gaussian q zobecněný normální generalizované hyperbolické geometrický stabilní Gumbel Holtsmark hyperbolický sekans Johnson S_U Landau Laplace asymetrický Laplace logistické necentrální t normální (Gaussian) normálně-inverzní Gaussian zkosení normální rozřezat stabilní Studentské t Gumbel typu 1 Tracy – Widom variance-gama Voigt
Kontinuální univariate s podporou, jejíž typ se liší	generalizovaný chí-kvadrát zobecněná extrémní hodnota zobecněný Pareto Marchenko – Pastur q-exponenciální q-Gaussian q-Weibulle posunutá log-logistika Tukey lambda
Smíšený spojitý-diskrétní univariate	opravený Gaussian
Vícerozměrný (společný)	Oddělený Ewens multinomiální Dirichlet-multinomiální negativní multinomiální Kontinuální Dirichlet zobecněný Dirichlet vícerozměrný Laplace vícerozměrný normální vícerozměrný stabilní vícerozměrný t normální-inverzní-gama normální-gama Maticovou hodnotu inverzní matice gama inverzní Wishart matice normální matice t matice gama normální-inverzní-Wishart normální-Wishart Wishart
Směrový	Univariate (kruhový) směrový Kruhová uniforma univariate von Mises zabalené normální zabalený Cauchy zabalený exponenciál zabalený asymetrický Laplace zabalená Lévy Bivariate (sférické) Kent Bivariate (toroidní) bivariát von Mises Vícerozměrný von Mises – Fisher Bingham
Degenerovat a jednotné číslo	Degenerovat Diracova delta funkce Jednotné číslo Cantor
Rodiny	Oběžník složený Poisson eliptický exponenciální přirozený exponenciál měřítko umístění maximální entropie směs Pearson Tweedie zabalené