normální-gama Parametry μ {displaystyle mu,} umístění (nemovitý ) λ > 0 {displaystyle lambda> 0,} (nemovitý) α > 0 {displaystyle alpha> 0,} (nemovitý) β > 0 {displaystyle eta> 0,} (nemovitý)Podpěra, podpora X ∈ ( − ∞ , ∞ ) , τ ∈ ( 0 , ∞ ) {displaystyle xin (-infty, infty),!,; au in (0, infty)} PDF F ( X , τ ∣ μ , λ , α , β ) = β α λ Γ ( α ) 2 π τ α − 1 2 E − β τ E − λ τ ( X − μ ) 2 2 {displaystyle f (x, au mid mu, lambda, alpha, eta) = {frac {eta ^ {alpha} {sqrt {lambda}}} {gama (alfa) {sqrt {2pi}}}}, au ^ {alfa - {frac {1} {2}}}, e ^ {- eta au}, e ^ {- {frac {lambda au (x-mu) ^ {2}} {2}}}} Znamenat [1] E ( X ) = μ , E ( T ) = α β − 1 {displaystyle operatorname {E} (X) = mu,!, quad operatorname {E} (mathrm {T}) = alpha eta ^ {- 1}} Režim ( μ , α − 1 2 β ) {displaystyle left (mu, {frac {alpha - {frac {1} {2}}} {eta}} ight)} Rozptyl [1] var ( X ) = ( β λ ( α − 1 ) ) , var ( T ) = α β − 2 {displaystyle operatorname {var} (X) = {Big (} {frac {eta} {lambda (alpha -1)}} {Big)}, quad operatorname {var} (mathrm {T}) = alpha eta ^ {- 2}}
v teorie pravděpodobnosti a statistika , normální-gama distribuce (nebo Gaussovo-gama rozdělení ) je dvojrozměrná čtyřparametrická rodina spojitých rozdělení pravděpodobnosti . To je před konjugátem a normální distribuce s neznámým znamenat a přesnost .[2]
Definice Pro pár náhodné proměnné , (X ,T ), předpokládejme, že podmíněné rozdělení z X daný T darováno
X ∣ T ∼ N ( μ , 1 / ( λ T ) ) , {displaystyle Xmid Tsim N (mu, 1 / (lambda T)),!,} což znamená, že podmíněné rozdělení je a normální distribuce s znamenat μ {displaystyle mu} a přesnost λ T {displaystyle lambda T} - ekvivalentně s rozptyl 1 / ( λ T ) . {displaystyle 1 / (lambda T).}
Předpokládejme také, že okrajové rozdělení T darováno
T ∣ α , β ∼ Gama ( α , β ) , {displaystyle Tmid alfa, eta sim operatorname {Gamma} (alfa, eta),} kde to znamená T má gama distribuce . Tady λ , α a β jsou parametry společného rozdělení.
Pak (X ,T ) má normální rozdělení gama a toto je označeno
( X , T ) ∼ NormálníGamma ( μ , λ , α , β ) . {displaystyle (X, T) sim operatorname {NormalGamma} (mu, lambda, alpha, eta).} Vlastnosti Funkce hustoty pravděpodobnosti Kloub funkce hustoty pravděpodobnosti z (X ,T ) je[Citace je zapotřebí ]
F ( X , τ ∣ μ , λ , α , β ) = β α λ Γ ( α ) 2 π τ α − 1 2 E − β τ exp ( − λ τ ( X − μ ) 2 2 ) {displaystyle f (x, au mid mu, lambda, alpha, eta) = {frac {eta ^ {alpha} {sqrt {lambda}}} {gama (alfa) {sqrt {2pi}}}}, au ^ {alfa - {frac {1} {2}}}, e ^ {- eta au} exp left (- {frac {lambda au (x-mu) ^ {2}} {2}} ight)} Okrajové rozdělení Podle konstrukce je mezní rozdělení z τ {displaystyle au} je gama distribuce a podmíněné rozdělení z X {displaystyle x} daný τ {displaystyle au} je Gaussovo rozdělení . The mezní rozdělení z X {displaystyle x} je tříparametrový nestandardizovaný Studentova t-distribuce s parametry ( ν , μ , σ 2 ) = ( 2 α , μ , β / ( λ α ) ) {displaystyle (u, mu, sigma ^ {2}) = (2alpha, mu, eta / (lambda alpha))} .[Citace je zapotřebí ]
Exponenciální rodina Normální rozdělení gama je čtyřparametrové exponenciální rodina s přirozené parametry α − 1 / 2 , − β − λ μ 2 / 2 , λ μ , − λ / 2 {displaystyle alpha -1 / 2, - eta -lambda mu ^ {2} / 2, lambda mu, -lambda / 2} a přírodní statistiky ln τ , τ , τ X , τ X 2 {displaystyle ln au, au, au x, au x ^ {2}} .[Citace je zapotřebí ]
Okamžiky přirozené statistiky Následující momenty lze snadno vypočítat pomocí funkce generování momentů dostatečné statistiky :[Citace je zapotřebí ]
E ( ln T ) = ψ ( α ) − ln β , {displaystyle operatorname {E} (ln T) = psi left (alpha ight) -ln eta,} kde ψ ( α ) {displaystyle psi left (alpha ight)} je funkce digamma ,
E ( T ) = α β , E ( T X ) = μ α β , E ( T X 2 ) = 1 λ + μ 2 α β . {displaystyle {egin {aligned} operatorname {E} (T) & = {frac {alpha} {eta}}, [5pt] operatorname {E} (TX) & = mu {frac {alpha} {eta}}, [5pt] operatorname {E} (TX ^ {2}) & = {frac {1} {lambda}} + mu ^ {2} {frac {alpha} {eta}}. End {aligned}}} Škálování Li ( X , T ) ∼ N Ó r m A l G A m m A ( μ , λ , α , β ) , {displaystyle (X, T) sim mathrm {NormalGamma} (mu, lambda, alpha, eta),} pak pro všechny b > 0, (bX ,bT ) je distribuován jako[Citace je zapotřebí ] N Ó r m A l G A m m A ( b μ , λ , α , b 2 β ) . {displaystyle {m {NormalGamma}} (bmu, lambda, alpha, b ^ {2} eta).} [pochybný – diskutovat ]
Zadní rozdělení parametrů Předpokládat, že X je distribuován podle normálního rozdělení s neznámým průměrem μ {displaystyle mu} a přesnost τ {displaystyle au} .
X ∼ N ( μ , τ − 1 ) {displaystyle xsim {mathcal {N}} (mu, au ^ {- 1})} a že předchozí distribuce na μ {displaystyle mu} a τ {displaystyle au} , ( μ , τ ) {displaystyle (mu, au)} , má normální rozdělení gama
( μ , τ ) ∼ NormálníGamma ( μ 0 , λ 0 , α 0 , β 0 ) , {displaystyle (mu, au) sim {ext {NormalGamma}} (mu _ {0}, lambda _ {0}, alpha _ {0}, eta _ {0}),} pro které je hustota π splňuje
π ( μ , τ ) ∝ τ α 0 − 1 2 exp [ − β 0 τ ] exp [ − λ 0 τ ( μ − μ 0 ) 2 2 ] . {displaystyle pi (mu, au) propto au ^ {alpha _ {0} - {frac {1} {2}}}, exp [- eta _ {0} au], exp vlevo [- {frac {lambda _ { 0} au (mu -mu _ {0}) ^ {2}} {2}} v pořádku].} Předpokládat
X 1 , … , X n ∣ μ , τ ∼ i . i . d . N ( μ , τ − 1 ) , {displaystyle x_ {1}, ldots, x_ {n} mid mu, au sim operatorname {{i.} {i.} {d.}} operatorname {N} left (mu, au ^ {- 1} ight), } tj. komponenty X = ( X 1 , … , X n ) {displaystyle mathbf {X} = (x_ {1}, ldots, x_ {n})} jsou podmíněně nezávislé μ , τ {displaystyle mu, au} a podmíněné rozdělení každého z nich μ , τ {displaystyle mu, au} je normální s očekávanou hodnotou μ {displaystyle mu} a rozptyl 1 / τ . {displaystyle 1 / au.} Zadní rozdělení μ {displaystyle mu} a τ {displaystyle au} vzhledem k této datové sadě X {displaystyle mathbb {X}} lze analyticky určit pomocí Bayesova věta .[3] Výslovně,
P ( τ , μ ∣ X ) ∝ L ( X ∣ τ , μ ) π ( τ , μ ) , {displaystyle mathbf {P} (au, mu mid mathbf {X}) propto mathbf {L} (mathbf {X} mid au, mu) pi (au, mu),} kde L {displaystyle mathbf {L}} je pravděpodobnost dat daných parametry.
Vzhledem k tomu, že data jsou i.i.d, pravděpodobnost celého souboru údajů se rovná součinu pravděpodobností jednotlivých vzorků dat:
L ( X ∣ τ , μ ) = ∏ i = 1 n L ( X i ∣ τ , μ ) . {displaystyle mathbf {L} (mathbf {X} mid au, mu) = prod _ {i = 1} ^ {n} mathbf {L} (x_ {i} mid au, mu).} Tento výraz lze zjednodušit takto:
L ( X ∣ τ , μ ) ∝ ∏ i = 1 n τ 1 / 2 exp [ − τ 2 ( X i − μ ) 2 ] ∝ τ n / 2 exp [ − τ 2 ∑ i = 1 n ( X i − μ ) 2 ] ∝ τ n / 2 exp [ − τ 2 ∑ i = 1 n ( X i − X ¯ + X ¯ − μ ) 2 ] ∝ τ n / 2 exp [ − τ 2 ∑ i = 1 n ( ( X i − X ¯ ) 2 + ( X ¯ − μ ) 2 ) ] ∝ τ n / 2 exp [ − τ 2 ( n s + n ( X ¯ − μ ) 2 ) ] , {displaystyle {egin {aligned} mathbf {L} (mathbf {X} mid au, mu) & propto prod _ {i = 1} ^ {n} au ^ {1/2} exp left [{frac {- au} { 2}} (x_ {i} -mu) ^ {2} ight] [5pt] & propto au ^ {n / 2} exp vlevo [{frac {- au} {2}} součet _ {i = 1} ^ {n} (x_ {i} -mu) ^ {2} ight] [5pt] & propto au ^ {n / 2} exp vlevo [{frac {- au} {2}} součet _ {i = 1} ^ {n} (x_ {i} - {ar {x}} + {ar {x}} - mu) ^ {2} ight] [5pt] & propto au ^ {n / 2} exp left [{frac {- au} {2}} součet _ {i = 1} ^ {n} vlevo ((x_ {i} - {ar {x}}) ^ {2} + ({ar {x}} - mu) ^ {2 } ight) ight] [5pt] & propto au ^ {n / 2} exp left [{frac {- au} {2}} left (ns + n ({ar {x}} - mu) ^ {2} ight ) ight], konec {zarovnáno}}} kde X ¯ = 1 n ∑ i = 1 n X i {displaystyle {ar {x}} = {frac {1} {n}} součet _ {i = 1} ^ {n} x_ {i}} průměr vzorků dat a s = 1 n ∑ i = 1 n ( X i − X ¯ ) 2 {displaystyle s = {frac {1} {n}} součet _ {i = 1} ^ {n} (x_ {i} - {ar {x}}) ^ {2}} , rozptyl vzorku.
Zadní rozdělení parametrů je úměrné pravděpodobnosti předchozí doby.
P ( τ , μ ∣ X ) ∝ L ( X ∣ τ , μ ) π ( τ , μ ) ∝ τ n / 2 exp [ − τ 2 ( n s + n ( X ¯ − μ ) 2 ) ] τ α 0 − 1 2 exp [ − β 0 τ ] exp [ − λ 0 τ ( μ − μ 0 ) 2 2 ] ∝ τ n 2 + α 0 − 1 2 exp [ − τ ( 1 2 n s + β 0 ) ] exp [ − τ 2 ( λ 0 ( μ − μ 0 ) 2 + n ( X ¯ − μ ) 2 ) ] {displaystyle {egin {aligned} mathbf {P} (au, mu mid mathbf {X}) & propto mathbf {L} (mathbf {X} mid au, mu) pi (au, mu) & propto au ^ {n / 2 } exp left [{frac {- au} {2}} left (ns + n ({ar {x}} - mu) ^ {2} ight) ight] au ^ {alpha _ {0} - {frac {1 } {2}}}, exp [{- eta _ {0} au}], exp vlevo [- {frac {lambda _ {0} au (mu -mu _ {0}) ^ {2}} {2} } ight] & propto au ^ {{frac {n} {2}} + alpha _ {0} - {frac {1} {2}}} exp vlevo [- au left ({frac {1} {2}} ns + eta _ {0} ight) ight] exp left [- {frac {au} {2}} left (lambda _ {0} (mu -mu _ {0}) ^ {2} + n ({ar {x }} - mu) ^ {2} ight) ight] konec {zarovnáno}}} Konečný exponenciální člen je zjednodušen vyplněním čtverce.
λ 0 ( μ − μ 0 ) 2 + n ( X ¯ − μ ) 2 = λ 0 μ 2 − 2 λ 0 μ μ 0 + λ 0 μ 0 2 + n μ 2 − 2 n X ¯ μ + n X ¯ 2 = ( λ 0 + n ) μ 2 − 2 ( λ 0 μ 0 + n X ¯ ) μ + λ 0 μ 0 2 + n X ¯ 2 = ( λ 0 + n ) ( μ 2 − 2 λ 0 μ 0 + n X ¯ λ 0 + n μ ) + λ 0 μ 0 2 + n X ¯ 2 = ( λ 0 + n ) ( μ − λ 0 μ 0 + n X ¯ λ 0 + n ) 2 + λ 0 μ 0 2 + n X ¯ 2 − ( λ 0 μ 0 + n X ¯ ) 2 λ 0 + n = ( λ 0 + n ) ( μ − λ 0 μ 0 + n X ¯ λ 0 + n ) 2 + λ 0 n ( X ¯ − μ 0 ) 2 λ 0 + n {displaystyle {egin {aligned} lambda _ {0} (mu -mu _ {0}) ^ {2} + n ({ar {x}} - mu) ^ {2} & = lambda _ {0} mu ^ {2} -2lambda _ {0} mu mu _ {0} + lambda _ {0} mu _ {0} ^ {2} + nmu ^ {2} -2n {ar {x}} mu + n {ar { x}} ^ {2} & = (lambda _ {0} + n) mu ^ {2} -2 (lambda _ {0} mu _ {0} + n {ar {x}}) mu + lambda _ {0} mu _ {0} ^ {2} + n {ar {x}} ^ {2} & = (lambda _ {0} + n) (mu ^ {2} -2 {frac {lambda _ { 0} mu _ {0} + n {ar {x}}} {lambda _ {0} + n}} mu) + lambda _ {0} mu _ {0} ^ {2} + n {ar {x} } ^ {2} & = (lambda _ {0} + n) vlevo (mu - {frac {lambda _ {0} mu _ {0} + n {ar {x}}} {lambda _ {0} + n}} ight) ^ {2} + lambda _ {0} mu _ {0} ^ {2} + n {ar {x}} ^ {2} - {frac {left (lambda _ {0} mu _ { 0} + n {ar {x}} ight) ^ {2}} {lambda _ {0} + n}} & = (lambda _ {0} + n) vlevo (mu - {frac {lambda _ {0) } mu _ {0} + n {ar {x}}} {lambda _ {0} + n}} ight) ^ {2} + {frac {lambda _ {0} n ({ar {x}} - mu _ {0}) ^ {2}} {lambda _ {0} + n}} konec {zarovnáno}}} Po vložení zpět do výše uvedeného výrazu
P ( τ , μ ∣ X ) ∝ τ n 2 + α 0 − 1 2 exp [ − τ ( 1 2 n s + β 0 ) ] exp [ − τ 2 ( ( λ 0 + n ) ( μ − λ 0 μ 0 + n X ¯ λ 0 + n ) 2 + λ 0 n ( X ¯ − μ 0 ) 2 λ 0 + n ) ] ∝ τ n 2 + α 0 − 1 2 exp [ − τ ( 1 2 n s + β 0 + λ 0 n ( X ¯ − μ 0 ) 2 2 ( λ 0 + n ) ) ] exp [ − τ 2 ( λ 0 + n ) ( μ − λ 0 μ 0 + n X ¯ λ 0 + n ) 2 ] {displaystyle {egin {aligned} mathbf {P} (au, mu mid mathbf {X}) & propto au ^ {{frac {n} {2}} + alpha _ {0} - {frac {1} {2}} } exp left [- au left ({frac {1} {2}} ns + eta _ {0} ight) ight] exp left [- {frac {au} {2}} left (left (lambda _ {0} + noc) vlevo (mu - {frac {lambda _ {0} mu _ {0} + n {ar {x}}} {lambda _ {0} + n}} ight) ^ {2} + {frac {lambda _ {0} n ({ar {x}} - mu _ {0}) ^ {2}} {lambda _ {0} + n}} ight) ight] & propto au ^ {{frac {n} {2} } + alpha _ {0} - {frac {1} {2}}} exp left [- au left ({frac {1} {2}} ns + eta _ {0} + {frac {lambda _ {0} n ({ar {x}} - mu _ {0}) ^ {2}} {2 (lambda _ {0} + n)}} ight) ight] exp vlevo [- {frac {au} {2}} vlevo (lambda _ {0} + noc) vlevo (mu - {frac {lambda _ {0} mu _ {0} + n {ar {x}}} {lambda _ {0} + n}} vpravo) ^ {2 } hned] konec {zarovnáno}}} Tento konečný výraz je v přesně stejné formě jako distribuce normální gama, tj.
P ( τ , μ ∣ X ) = NormálníGamma ( λ 0 μ 0 + n X ¯ λ 0 + n , λ 0 + n , α 0 + n 2 , β 0 + 1 2 ( n s + λ 0 n ( X ¯ − μ 0 ) 2 λ 0 + n ) ) {displaystyle mathbf {P} (au, mu mid mathbf {X}) = {ext {NormalGamma}} left ({frac {lambda _ {0} mu _ {0} + n {ar {x}}} {lambda _ {0} + n}}, lambda _ {0} + n, alpha _ {0} + {frac {n} {2}}, eta _ {0} + {frac {1} {2}} vlevo (ns + {frac {lambda _ {0} n ({ar {x}} - mu _ {0}) ^ {2}} {lambda _ {0} + n}} ight) ight)} Interpretace parametrů Interpretace parametrů z hlediska pseudo pozorování je následující:
Nový průměr bere vážený průměr starého pseudo-průměru a pozorovaný průměr vážený počtem souvisejících (pseudo-) pozorování. Přesnost byla odhadnuta z 2 α {displaystyle 2alpha} pseudo pozorování (tj. možná odlišný počet pseudo pozorování, aby bylo možné samostatně kontrolovat odchylku průměru a přesnosti) s průměrem vzorku μ {displaystyle mu} a rozptyl vzorku β α {displaystyle {frac {eta} {alpha}}} (tj. se součtem čtvercové odchylky 2 β {displaystyle 2 eta} ). Zadní aktualizuje počet pseudo pozorování ( λ 0 {displaystyle lambda _ {0}} ) jednoduše přidáním odpovídajícího počtu nových pozorování ( n {displaystyle n} ). Nový součet čtverců odchylek se vypočítá sečtením předchozích příslušných součtů čtverců odchylek. Je však zapotřebí třetí „člen interakce“, protože dvě sady čtvercových odchylek byly vypočítány s ohledem na různé prostředky, a proto součet těchto dvou podceňuje skutečnou celkovou čtvercovou odchylku. V důsledku toho, pokud má někdo předchozí průměr μ 0 {displaystyle mu _ {0}} z n μ {displaystyle n_ {mu}} vzorky a předchozí přesnost τ 0 {displaystyle au _ {0}} z n τ {displaystyle n_ {au}} vzorky, předchozí distribuce přes μ {displaystyle mu} a τ {displaystyle au} je
P ( τ , μ ∣ X ) = NormálníGamma ( μ 0 , n μ , n τ 2 , n τ 2 τ 0 ) {displaystyle mathbf {P} (au, mu mid mathbf {X}) = operatorname {NormalGamma} left (mu _ {0}, n_ {mu}, {frac {n_ {au}} {2}}, {frac { n_ {au}} {2 au _ {0}}} hned)} a po pozorování n {displaystyle n} vzorky se střední hodnotou μ {displaystyle mu} a rozptyl s {displaystyle s} , zadní pravděpodobnost je
P ( τ , μ ∣ X ) = NormálníGamma ( n μ μ 0 + n μ n μ + n , n μ + n , 1 2 ( n τ + n ) , 1 2 ( n τ τ 0 + n s + n μ n ( μ − μ 0 ) 2 n μ + n ) ) {displaystyle mathbf {P} (au, mu mid mathbf {X}) = {ext {NormalGamma}} left ({frac {n_ {mu} mu _ {0} + nmu} {n_ {mu} + n}}, n_ {mu} + n, {frac {1} {2}} (n_ {au} + n), {frac {1} {2}} vlevo ({frac {n_ {au}} {au _ {0} }} + ns + {frac {n_ {mu} n (mu -mu _ {0}) ^ {2}} {n_ {mu} + n}} ight) ight)} Všimněte si, že v některých programovacích jazycích, například Matlab , je distribuce gama implementována s inverzní definicí β {displaystyle eta} , takže čtvrtý argument distribuce Normal-Gamma je 2 τ 0 / n τ {displaystyle 2 au _ {0} / n_ {au}} .
Generování náhodných hodnot normální gama se liší Generování náhodných variací je jednoduché:
Vzorek τ {displaystyle au} z distribuce gama s parametry α {displaystyle alpha} a β {displaystyle eta} Vzorek X {displaystyle x} z normálního rozdělení s průměrem μ {displaystyle mu} a rozptyl 1 / ( λ τ ) {displaystyle 1 / (lambda au)} Související distribuce Poznámky ^ A b Bernardo & Smith (1993, s. 434) ^ Bernardo & Smith (1993, strany 136, 268, 434) ^ „Archivovaná kopie“ . Archivováno z původního dne 2014-08-07. Citováno 2014-08-05 .CS1 maint: archivovaná kopie jako titul (odkaz) Reference Bernardo, J.M .; Smith, A.F.M. (1993) Bayesiánská teorie Wiley. ISBN 0-471-49464-X Dearden a kol. „Bayesovské Q-učení“ , Sborník příspěvků z 15. národní konference o umělé inteligenci (AAAI-98) , 26. – 30. Července 1998, Madison, Wisconsin, USA. Diskrétní univariate s konečnou podporou Diskrétní univariate s nekonečnou podporou Kontinuální univariate podporováno v omezeném intervalu Kontinuální univariate podporováno v poloneomezeném intervalu Kontinuální univariate podporováno na celé reálné linii Kontinuální univariate s podporou, jejíž typ se liší Smíšený spojitý-diskrétní univariate Vícerozměrný (společný) Směrový Degenerovat a jednotné číslo Rodiny