Vztahy mezi distribucemi pravděpodobnosti - Relationships among probability distributions

v teorie pravděpodobnosti a statistika, existuje několik vztahů mezi nimi rozdělení pravděpodobnosti. Tyto vztahy lze rozdělit do následujících skupin:
- Jedna distribuce je speciální případ jiného se širším prostorem parametrů
- Transformace (funkce náhodné proměnné);
- Kombinace (funkce několika proměnných);
- Aproximační (mezní) vztahy;
- Složené vztahy (užitečné pro Bayesiánský závěr);
- Dualita[je zapotřebí objasnění ];
- Konjugujte prior.
Zvláštní případ parametrizace distribuce
- A binomický (n, p) náhodná proměnná s n = 1, je a Bernoulli (p) náhodná proměnná.
- A negativní binomické rozdělení s n = 1 je a geometrické rozdělení.
- A gama distribuce s tvarovým parametrem α = 1 a parametr měřítka θ je exponenciální distribuce s očekávanou hodnotouθ.
- A gama (α, β) náhodná proměnná s α = ν/ 2 a β = 2, je a chi-kvadrát náhodná proměnná s ν stupně svobody.
- A distribuce chí-kvadrát se 2 stupni volnosti je exponenciální rozdělení s průměrem 2 a naopak.
- A Weibulle (1, β) náhodná proměnná je exponenciální náhodná veličina se střední hodnotou β.
- A beta náhodná proměnná s parametry α = β = 1 je a jednotný náhodná proměnná.
- A beta-binomický (n, 1, 1) náhodná proměnná je diskrétní jednotná náhodná proměnná nad hodnotami 0, ..., n.
- Náhodná proměnná s a t distribuce s jedním stupněm volnosti je a Cauchy (0,1) náhodná proměnná.
- Když c = 1, distribuce Burr typu XII se stane distribucí Pareto Type II (Lomax).
Transformace proměnné
Násobek náhodné proměnné
Vynásobení proměnné libovolnými kladnými reálnými konstantními výnosy a škálování Některé se samy replikují, což znamená, že škálování přináší stejnou rodinu distribucí, i když s jiným parametrem:normální distribuce, gama distribuce, Cauchyovo rozdělení, exponenciální rozdělení, Erlang distribuce, Weibullova distribuce, logistická distribuce, distribuce chyb, rozdělení moci a zákona, Rayleighova distribuce.
Příklad:
- Li X je náhodná proměnná gama s parametry tvaru a rychlosti (r, λ), pak Y = sekera je náhodná proměnná gama s parametry (r,λ/A).
- Li X je náhodná proměnná gama s parametry tvaru a měřítka (α, β), pak Y = sekera je náhodná proměnná gama s parametry (α,aβ).
Lineární funkce náhodné proměnné
Afinní transformace sekera + b výnosy a přemístění a změna měřítka původní distribuce. Následující se samy replikují:Normální distribuce, Cauchyovo rozdělení, Logistická distribuce, Distribuce chyb, Distribuce energie, Rayleighova distribuce.
Příklad:
- Li Z je normální náhodná proměnná s parametry (μ = m, σ2 = s2), pak X = aZ + b je normální náhodná proměnná s parametry (μ = dopoledne + b, σ2 = A2s2).
Reciproční náhodné proměnné
Reciproční 1 /X náhodné proměnné X, je členem stejné distribuční rodiny jako X, v následujících případech:Cauchyovo rozdělení, F distribuce, log logistická distribuce.
Příklady:
- Pokud X je Cauchy (μ, σ) náhodná proměnná, pak 1 /X je Cauchy (μ/C, σ/C) náhodná proměnná kde C = μ2 + σ2.
- Li X je F(ν1, ν2) náhodná proměnná pak 1 /X je F(ν2, ν1) náhodná proměnná.
Ostatní případy
Některé distribuce jsou invariantní při konkrétní transformaci.
Příklad:
- Li X je beta (α, β) náhodná proměnná pak (1 - X) je beta (β, α) náhodná proměnná.
- Li X je binomický (n, p) náhodná proměnná pak (n − X) je binomický (n, 1 − p) náhodná proměnná.
- Li X má kumulativní distribuční funkce FX, pak inverzní kumulativní distribuce F
X(X) je standard jednotný (0,1) náhodná proměnná - Li X je normální (μ, σ2) náhodná proměnná poté EX je lognormální (μ, σ2) náhodná proměnná.
- Naopak, pokud X je lognormální (μ, σ2) náhodná proměnná a poté se přihlasteX je normální (μ, σ2) náhodná proměnná.
- Li X je exponenciální náhodná veličina se střední hodnotou β, pak X1/y je Weibulle (y, β) náhodná proměnná.
- Náměstí a standardní normální náhodná proměnná má a chi-kvadrát distribuce s jedním stupněm volnosti.
- Li X je Student's t náhodná proměnná s ν stupeň svobody X2 je F (1,ν) náhodná proměnná.
- Li X je dvojitý exponenciál náhodná proměnná se střední hodnotou 0 a stupnicí λ, pak |X| je exponenciální náhodná veličina se střední hodnotou λ.
- A geometrický náhodná proměnná je podlaha z exponenciální náhodná proměnná.
- A obdélníkový náhodná proměnná je podlaha a jednotný náhodná proměnná.
- A reciproční náhodná proměnná je exponenciál a jednotný náhodná proměnná.
Funkce několika proměnných
Součet proměnných
Rozdělení součtu nezávislé náhodné proměnné je konvoluce jejich distribucí. Předpokládat je součet nezávislé náhodné proměnné každý s pravděpodobnostní hromadné funkce . Pak
má
Pokud má distribuci ze stejné distribuční rodiny jako původní proměnné, říká se, že tato distribuční rodina je uzavřen konvolucí.
Příklady takových univariate distribuce jsou: normální distribuce, Poissonovo rozdělení, binomické distribuce (s běžnou pravděpodobností úspěchu), negativní binomické distribuce (s běžnou pravděpodobností úspěchu), gama distribuce (se společným parametr rychlosti ), chi-kvadrát distribuce, Cauchyho rozdělení, hyperexponenciální distribuce.
- Li X1 a X2 jsou jed náhodné proměnné s prostředky μ1 a μ2 respektive tedy X1 + X2 je jed náhodná veličina se střední hodnotou μ1 + μ2.
- Součet gama (ni, β) náhodné proměnné má a gama (Σni, β) rozdělení.
- Li X1 je Cauchy (μ1, σ1) náhodná proměnná a X2 je Cauchy (μ2, σ2), pak X1 + X2 je Cauchy (μ1 + μ2, σ1 + σ2) náhodná proměnná.
- Pokud X1 a X2 jsou chi-kvadrát náhodné proměnné s ν1 a ν2 stupně volnosti, pak X1 + X2 je chi-kvadrát náhodná proměnná s ν1 + ν2 stupně svobody.
- Li X1 je normální (μ1, σ2
1) náhodná proměnná a X2 je normální (μ2, σ2
2) náhodná proměnná, pak X1 + X2 je normální (μ1 + μ2, σ2
1 + σ2
2) náhodná proměnná. - Součet N chi-kvadrát (1) náhodné proměnné má chi-kvadrát distribuci s N stupně svobody.
Ostatní distribuce nejsou uzavřeny konvolucí, ale jejich součet má známé rozdělení:
- Součet n Bernoulli (p) náhodné proměnné je a binomický (n, p) náhodná proměnná.
- Součet n geometrický náhodné proměnné s pravděpodobností úspěchu p je negativní binomický náhodná proměnná s parametry n a p.
- Součet n exponenciální (β) náhodné proměnné je a gama (n, β) náhodná proměnná.
- Pokud mají exponenciální náhodné proměnné společný parametr rychlosti, jejich součet má Erlang distribuce, speciální případ distribuce gama.
- Součet čtverců z N standardní normální náhodné proměnné má a chi-kvadrát distribuce s N stupni volnosti.
Produkt proměnných
Produkt nezávislých náhodných proměnných X a Y může patřit do stejné distribuční rodiny jako X a Y: Bernoulliho distribuce a normální distribuce protokolu.
Příklad:
- Li X1 a X2 jsou nezávislé normální log náhodné proměnné s parametry (μ1, σ2
1) a (μ2, σ2
2) X1 X2 je normální log náhodná proměnná s parametry (μ1 + μ2, σ2
1 + σ2
2).
Minimum a maximum nezávislých náhodných proměnných
U některých distribucí minimální hodnota několika nezávislých náhodných proměnných je členem stejné rodiny s různými parametry:Bernoulliho distribuce, Geometrické rozdělení, Exponenciální rozdělení, Extrémní rozdělení hodnot, Paretova distribuce, Rayleighova distribuce, Weibullova distribuce.
Příklady:
- Li X1 a X2 jsou nezávislé geometrický náhodné proměnné s pravděpodobností úspěchu p1 a p2 respektive pak min (X1, X2) je geometrická náhodná proměnná s pravděpodobností úspěchu p = p1 + p2 − p1 p2. Vztah je jednodušší, je-li vyjádřen pravděpodobností selhání: q = q1 q2.
- Li X1 a X2 jsou nezávislé exponenciální náhodné proměnné s rychlostí μ1 a μ2 respektive pak min (X1, X2) je exponenciální náhodná proměnná s rychlostí μ = μ1 + μ2.
Podobně distribuce, pro které maximum hodnota několika nezávislých náhodných proměnných je členem stejné distribuční rodiny patří:Bernoulliho distribuce, Zákon o moci rozdělení.
jiný
- Li X a Y jsou nezávislé standardní normální náhodné proměnné, X/Y je Cauchy (0,1) náhodná proměnná.
- Li X1 a X2 jsou nezávislé chi-kvadrát náhodné proměnné s ν1 a ν2 stupně volnosti, pak (X1/ν1)/(X2/ν2) je F(ν1, ν2) náhodná proměnná.
- Li X je standardní normální náhodná proměnná a U je nezávislá chi-kvadrát náhodná proměnná s ν stupně volnosti je Studentské t(ν) náhodná proměnná.
- Li X1 je gama (α1, 1) náhodná proměnná a X2 je nezávislý gama (α2, 1) náhodná proměnná poté X1/(X1 + X2) je beta(α1, α2) náhodná proměnná. Obecněji, pokud X1 je gama (α1, β1) náhodná proměnná a X2 je nezávislé gama (α2, β2) náhodná proměnná pak β2 X1/(β2 X1 + β1 X2) je beta (α1, α2) náhodná proměnná.
- Li X a Y jsou nezávislé exponenciální náhodné proměnné se střední μ, pak X − Y je dvojitý exponenciál náhodná veličina se střední hodnotou 0 a stupnicí μ.
Přibližné (omezené) vztahy
Přibližný nebo limitovaný vztah znamená
- buď kombinace nekonečného počtu iid náhodné proměnné mají sklon k určité distribuci,
- nebo že limit, když má parametr tendenci k určité hodnotě, se blíží jiné distribuci.
Kombinace iid náhodné proměnné:
- Za určitých podmínek bude součet (tedy průměr) dostatečně velkého počtu iid náhodných proměnných, z nichž každá má konečný průměr a rozptyl, přibližně normálně distribuován. To je teorém centrálního limitu (CLT).
Zvláštní případ parametrizace distribuce:
- X je hypergeometrický (m, N, n) náhodná proměnná. Li n a m jsou velké v porovnání s N, a p = m/N není tedy blízko 0 nebo 1 X přibližně má Binomický(n, p) rozdělení.
- X je beta-binomický náhodná proměnná s parametry (n, α, β). Nechat p = α/(α + β) a předpokládejme α + β je tedy velký X přibližně má binomický(n, p) rozdělení.
- Li X je binomický (n, p) náhodná proměnná a pokud n je velký a np je tedy malý X přibližně má jed(np) rozdělení.
- Li X je negativní binomický náhodná proměnná s r velký, P blízko 1 a r(1 − P) = λ, pak X přibližně má jed rozdělení se střední hodnotou λ.
Důsledky CLT:
- Li X je jed náhodná proměnná s velkým průměrem, pak pro celá čísla j a k, P (j ≤ X ≤ k) přibližně se rovná P(j − 1/2 ≤ Y ≤ k + 1/2) kde Y je normální distribuce se stejným průměrem a rozptylem jako X.
- Li X je binomický(n, p) náhodná proměnná s velkým np a n(1 − p), pak pro celá čísla j a k, P (j ≤ X ≤ k) přibližně se rovná P (j − 1/2 ≤ Y ≤ k + 1/2) kde Y je normální náhodná proměnná se stejným průměrem a rozptylem jako X, tj. np a np(1 − p).
- Li X je beta náhodná proměnná s parametry α a β stejné a velké X přibližně má normální distribuce se stejným průměrem a rozptylem, tj. E. znamenat α/(α + β) a rozptyl αβ/((α + β)2(α + β + 1)).
- Li X je gama(α, β) náhodná proměnná a parametr tvaru α je velký vzhledem k parametru měřítka β, pak X přibližně má normální náhodná proměnná se stejným průměrem a rozptylem.
- Li X je Studentské t náhodná proměnná s velkým počtem stupňů volnosti ν pak X přibližně má standardní normální rozdělení.
- Li X je F(ν, ω) náhodná proměnná s ω tedy velký νX je přibližně distribuován jako a chi-kvadrát náhodná proměnná s ν stupně svobody.
Složené (nebo Bayesovské) vztahy
Pokud jsou jeden nebo více parametrů distribuce náhodné proměnné, sloučenina distribuce je marginální distribuce proměnné.
Příklady:
- Li X | N je binomický (N,p) náhodná proměnná, kde parametr N je náhodná proměnná se zápornou binomickou hodnotou (m, r) distribuce, pak X je distribuován jako záporně-dvojčlen (m, r/(p + qr)).
- Li X | N je binomický (N,p) náhodná proměnná, kde parametr N je náhodná proměnná s Poissonem (μ) distribuce, pak X je distribuován jako jed (μp).
- Li X | μ je jed(μ) náhodná proměnná a parametr μ je náhodná proměnná s gama (m, θ) distribuce (kde θ je parametr měřítka) X je distribuován jako záporně-dvojčlen (m, θ/(1 + θ)), někdy nazývaný gama-Poissonovo rozdělení.
Některé distribuce byly speciálně pojmenovány jako sloučeniny:beta-binomická distribuce, distribuce beta-Pascal, gama-normální rozdělení.
Příklady:
- Li X je binomický (n,p) náhodná proměnná a parametr p je náhodná proměnná s beta (α, β) distribuce, pak X je distribuován jako beta-binomický (α,β,n).
- Li X je záporný binomický (m,p) náhodná proměnná a parametr p je náhodná proměnná s beta (α,β) distribuce, pak X je distribuován jako Beta-Pascal (α,β,m).
Viz také
Reference
- ^ LEEMIS, Lawrence M .; Jacquelyn T. MCQUESTON (únor 2008). „Jednorozměrné distribuční vztahy“ (PDF). Americký statistik. 62 (1): 45–53. doi:10.1198 / 000313008x270448.
- ^ Swat, MJ; Grenon, P; Wimalaratne, S (2016). „ProbOnto: ontologie a znalostní báze rozdělení pravděpodobnosti“. Bioinformatika. 32 (17): 2719–21. doi:10.1093 / bioinformatika / btw170. PMC 5013898. PMID 27153608.
- ^ Cook, John D. "Schéma distribučních vztahů".
- ^ Dinov, Ivo D .; Siegrist, Kyle; Pearl, Dennis; Kalinin, Alex; Christou, Nicolas (2015). „Pravděpodobnost Distributome: webová výpočetní infrastruktura pro zkoumání vlastností, vzájemných vztahů a aplikací pravděpodobnostních distribucí“. Výpočetní statistika. 594 (2): 249–271. doi:10.1007 / s00180-015-0594-6. PMC 4856044. PMID 27158191.
externí odkazy
- Interaktivní grafika: Jednorozměrné distribuční vztahy
- ProbOnto - Ontologie a znalostní báze rozdělení pravděpodobnosti: ProbOnto
- Projekt Pravděpodobnost Distributome zahrnuje kalkulačky, simulátory, experimenty a navigátory pro interdistribuční refashions a distribuční metadata.