Skládané normální rozdělení - Folded normal distribution

Funkce hustoty pravděpodobnosti
Funkce hustoty pravděpodobnosti pro složené normální rozdělení
μ=1, σ=1
Funkce kumulativní distribuce
Funkce kumulativního rozdělení pro normální rozdělení
μ=1, σ=1
ParametryμR   (umístění )
σ2 > 0   (měřítko )
Podpěra, podporaX ∈ [0,∞)
PDF
CDF
Znamenat
Rozptyl

The složené normální rozdělení je rozdělení pravděpodobnosti související s normální distribuce. Vzhledem k normálně distribuované náhodné proměnné X s znamenat μ a rozptyl σ2, náhodná proměnná Y = |X| má složené normální rozdělení. Takový případ lze narazit, pokud je zaznamenána pouze velikost nějaké proměnné, ale ne její znaménko. Distribuce se nazývá „složená“, protože hmotnost pravděpodobnosti nalevo od X = 0 je přeložen převzetím absolutní hodnota. Ve fyzice vedení tepla, složené normální rozdělení je základním řešením rovnice tepla na polovičním prostoru; odpovídá perfektnímu izolátoru na a nadrovina přes původ.

Definice

Hustota

The funkce hustoty pravděpodobnosti (PDF) je dáno

pro X ≥ 0 a 0 všude jinde. Alternativní formulace je dána

,

kde cosh je kosinus Hyperbolická funkce. Z toho vyplývá, že kumulativní distribuční funkce (CDF) je dán vztahem:

pro X ≥ 0, kde erf () je chybová funkce. Tento výraz se redukuje na CDF poloviční normální rozdělení když μ = 0.

Střední hodnota složeného rozdělení je pak

nebo

kde je normální kumulativní distribuční funkce:

Rozptyl je pak snadno vyjádřen jako průměr:

Jak průměr (μ) a rozptyl (σ2) z X v původním normálním rozdělení lze interpretovat jako parametry umístění a měřítka Y ve složené distribuci.

Vlastnosti

Režim

Režim distribuce je hodnota pro které je hustota maximalizována. Abychom našli tuto hodnotu, vezmeme první derivaci hustoty vzhledem k a nastavte ji na nulu. Bohužel neexistuje žádná uzavřená forma. Můžeme však derivaci napsat lépe a skončit s nelineární rovnicí

.

Tsagris a kol. (2014) viděli z numerického šetření, že když , maximum je splněno, když , a kdy se stává větší než , maximální přístupy . To je samozřejmě něco, co lze očekávat, protože v tomto případě složená normální konverguje k normálnímu rozdělení. Aby se předešlo problémům se zápornými odchylkami, doporučuje se umocnění parametru. Alternativně můžete přidat omezení, například pokud optimalizátor jde o zápornou odchylku, hodnota log-likelihood je NA nebo něco velmi malého.

Charakteristická funkce a další související funkce

  • Charakteristická funkce je dána vztahem

.

  • Funkce generující moment je dána vztahem

.

  • Funkce generování kumulantu je dána vztahem

.

  • Laplaceova transformace je dána vztahem

.

  • Fourierova transformace je dána vztahem

.

Související distribuce

Statistická inference

Odhad parametrů

Existuje několik způsobů odhadu parametrů složeného normálu. Všechny jsou v zásadě procedurou odhadu maximální pravděpodobnosti, ale v některých případech se provádí numerická maximalizace, zatímco v jiných případech se hledá kořen rovnice. Pravděpodobnost logaritmu skládaného normálu, když je vzorek velikosti je k dispozici lze zapsat následujícím způsobem

v R (programovací jazyk), pomocí balíčku Rfast jeden může získat MLE opravdu rychle (příkaz foldnorm.mle). Případně příkaz optim nebo nlm se vejde do této distribuce. Maximalizace je snadná, protože dva parametry ( a ) jsou zapojeny. Všimněte si, že pozitivní i negativní hodnoty pro jsou přijatelné, protože patří do reálné řady čísel, proto není znaménko důležité, protože rozdělení je vzhledem k němu symetrické. Další kód je napsán v R.

složený <- funkce(y) {  ## y je vektor s kladnými daty  n <- délka(y)  ## velikost vzorku  sy2 <- součet(y ^ 2)    sam <- funkce(odst, n, sy2) {       <- odstavec [1]   ;   se <- exp( odstavec [2] )      F <-  - n/2 * log(2/pi/se) + n * já ^ 2 / 2 / se +            sy2 / 2 / se - součet( log( hovno(  * y/se ) ) )      F    }  mod <- optim( C( znamenat(y), sd(y) ), n = n, sy2 = sy2, sam, řízení = seznam(max = 2000) )  mod <- optim( mod$odst, sam, n = n, sy2 = sy2, řízení = seznam(max = 20000) )  výsledek <- C( -mod$hodnota, mod$par [1], exp(mod$par [2]) )  jména(výsledek) <- C("log-likelihood", "mu", "sigma na druhou")  výsledek}

Dílčí deriváty logaritmické pravděpodobnosti se zapisují jako

.

Vyrovnáním první parciální derivace logaritmické pravděpodobnosti na nulu získáme pěkný vztah

.

Všimněte si, že výše uvedená rovnice má tři řešení, jedno na nule a dvě další s opačným znaménkem. Nahrazením výše uvedené rovnice částečnou derivací logaritmické pravděpodobnosti w.r.t. a rovnicí na nulu dostaneme následující výraz pro rozptyl

,

což je stejný vzorec jako v normální distribuce. Hlavní rozdíl je v tom a nejsou statisticky nezávislé. Výše uvedené vztahy lze použít k získání maximálních odhadů pravděpodobnosti efektivním rekurzivním způsobem. Začínáme s počáteční hodnotou pro a najděte pozitivní kořen () poslední rovnice. Poté získáme aktualizovanou hodnotu . Postup se opakuje, dokud není změna hodnoty log-likelihood zanedbatelná. Další jednodušší a efektivnější způsob je provést vyhledávací algoritmus. Napíšeme poslední rovnici elegantnějším způsobem

.

Je zřejmé, že optimalizace logaritmické pravděpodobnosti s ohledem na dva parametry se změnila v kořenové hledání funkce. To je samozřejmě totožné s předchozím kořenovým vyhledáváním. Tsagris a kol. (2014) zjistili, že pro tuto rovnici existují tři kořeny , tj. existují tři možné hodnoty které splňují tuto rovnici. The a , což jsou odhady maximální věrohodnosti a 0, což odpovídá minimální věrohodnosti protokolu.

Viz také

Reference

  • Tsagris, M .; Beneki, C .; Hassani, H. (2014). Msgstr "Na složeném normálním rozdělení". Matematika. 2 (1): 12–28. arXiv:1402.3559.
  • Leone FC, Nottingham RB, Nelson LS (1961). "Skládané normální rozdělení". Technometrics. 3 (4): 543–550. doi:10.2307/1266560. hdl:2027 / mdp. 39015095248541. JSTOR  1266560.
  • Johnson NL (1962). "Skládané normální rozdělení: přesnost odhadu maximální pravděpodobností". Technometrics. 4 (2): 249–256. doi:10.2307/1266622. JSTOR  1266622.
  • Nelson LS (1980). "Skládané normální rozdělení". J Qual Technol. 12 (4): 236–238.
  • Elandt RC (1961). "Skládané normální rozdělení: dvě metody odhadu parametrů z momentů". Technometrics. 3 (4): 551–562. doi:10.2307/1266561. JSTOR  1266561.
  • Lin PC (2005). "Aplikace zobecněného rozložení složeného normálu na opatření způsobilosti procesu". Int J Adv Manuf Technol. 26 (7–8): 825–830. doi:10.1007 / s00170-003-2043-x.
  • Psarakis, S .; Panaretos, J. (1990). "Skládané t rozdělení". Komunikace ve statistice - teorie a metody. 19 (7): 2717–2734.
  • Psarakis, S .; Panaretos, J. (2001). "Na některých dvojrozměrných rozšířeních složeného normálu a složeného t rozdělení". Journal of Applied Statistical Science. 10 (2): 119–136.
  • Chakraborty, A. K .; Moutushi, C. (2013). "Na vícerozměrném složeném normálním rozdělení". Sankhya B.. 75 (1): 1–15.

externí odkazy