Podmíněnost (pravděpodobnost) - Conditioning (probability)

Víra závisí na dostupných informacích. Tato myšlenka je formalizována v teorie pravděpodobnosti podle klimatizace. Podmíněné pravděpodobnosti, podmíněná očekávání, a podmíněné rozdělení pravděpodobnosti jsou zpracovávány na třech úrovních: diskrétní pravděpodobnosti, funkce hustoty pravděpodobnosti, a teorie míry. Podmínka vede k nenáhodnému výsledku, pokud je podmínka zcela specifikována; jinak, pokud je podmínka ponechána náhodná, je výsledek podmínění také náhodný.

Podmínka na diskrétní úrovni

Příklad: Férová mince je hodena 10krát; the náhodná proměnná X je počet hlav v těchto 10 losováních a Y - počet hlav v prvních 3 losováních. Navzdory tomu, že Y se objeví před X může se stát, že to někdo ví X ale ne Y.

Podmíněná pravděpodobnost

Vzhledem k tomu X = 1, podmíněná pravděpodobnost události Y = 0 je

Obecněji,

Podmíněnou pravděpodobnost lze také považovat za náhodnou proměnnou, - funkci náhodné proměnné X, jmenovitě

The očekávání této náhodné proměnné se rovná (bezpodmínečné) pravděpodobnosti,

a to,

což je instance zákon celkové pravděpodobnosti

Tím pádem, lze považovat za hodnotu náhodné proměnné souhlasí s X = 1. Na druhou stranu, je dobře definovaný bez ohledu na další možné hodnoty X.

Podmíněné očekávání

Vzhledem k tomu X = 1, podmíněné očekávání náhodné proměnné Y je Obecněji,

(V tomto příkladu se jeví jako lineární funkce, ale obecně je nelineární.) Podmíněné očekávání lze také považovat za náhodnou proměnnou, - funkci náhodné proměnné. X, jmenovitě

Očekávání této náhodné proměnné se rovná (bezpodmínečnému) očekávání Y,

a to,

nebo jednoduše

což je instance zákon úplného očekávání

Náhodná proměnná je nejlepším prediktorem Y daný X. To znamená, že minimalizuje střední čtvercovou chybu na třídu všech náhodných proměnných formuláře F(X). Tato třída náhodných proměnných zůstává nedotčena, pokud X je nahrazen řekněme 2X. Tím pádem, To neznamená spíše, Zejména, Obecněji, pro každou funkci G to je jedna ku jedné na množině všech možných hodnot X. Hodnoty X jsou irelevantní; důležitý je oddíl (označte jej αX)

vzorkovacího prostoru Ω do disjunktních množin {X = Xn}. (Tady jsou všechny možné hodnoty X.) Vzhledem k libovolnému rozdělení α o Ω lze definovat náhodnou proměnnou E ( Y | α). Ještě pořád, E (E ( Y | α)) = E ( Y ).

Podmíněnou pravděpodobnost lze považovat za zvláštní případ podmíněného očekávání. A to, P ( A | X ) = E ( Y | X ) -li Y je indikátor z A. Podmíněná pravděpodobnost proto také závisí na rozdělení αX generováno uživatelem X spíše než dál X sám; P ( A | G(X)) = P (A | X) = P (A | α), α = αX = αG(X).

Na druhou stranu kondicionování na akci B je dobře definovaný za předpokladu, že bez ohledu na jakýkoli oddíl, který může obsahovat B jako jedna z několika částí.

Podmíněné rozdělení

Dáno X = x, podmíněné rozdělení Y je

pro 0 ≤ y ≤ min (3, X ). To je hypergeometrická distribuce H ( X; 3, 7 ), nebo ekvivalentně H (3; X, 10-X ). Odpovídající očekávání 0,3 X, získané z obecného vzorce

pro H ( n; R, Ž ), není nic jiného než podmíněné očekávání E (Y | X = X) = 0.3 X.

Léčení H ( X; 3, 7 ) jako náhodné rozdělení (náhodný vektor ve čtyřrozměrném prostoru všech měr na {0,1,2,3}) lze přijmout jeho očekávání a získat bezpodmínečné rozdělení Y, - binomická distribuce Koš (3, 0,5). Tato skutečnost se rovná rovnosti

pro y = 0,1,2,3; což je instance zákon celkové pravděpodobnosti.

Podmínka na úrovni hustoty

Příklad. Bod koule X2 + y2 + z2 = 1 je vybrán náhodně podle n-sphere # Generování bodů na povrchu n-míče[1] Náhodné proměnné X, Y, Z jsou souřadnice náhodného bodu. Hustota spojů X, Y, Z neexistuje (protože koule má nulový objem), ale hustota spáry FX,Y z X, Y existuje,

(Hustota je nekonstantní kvůli nekonstantnímu úhlu mezi koule a letadlo.) Hustota X lze vypočítat integrací,

výsledek překvapivě nezávisí X v (-1,1),

což znamená, že X je rovnoměrně rozloženo na (−1,1). Totéž platí pro Y a Z (a ve skutečnosti pro sekera + podle + cZ kdykoli A2 + b2 + c2 = 1).

Příklad. Níže je uvedeno jiné měřítko výpočtu funkce okrajového rozdělení [2][3]

Podmíněná pravděpodobnost

Výpočet

Vzhledem k tomu X = 0,5, podmíněná pravděpodobnost události Y ≤ 0,75 je integrál podmíněné hustoty,

Obecněji,

pro všechny X a y takové, že −1 < X <1 (jinak jmenovatel FX(X) zmizí) a (jinak podmíněná pravděpodobnost degeneruje na 0 nebo 1). Podmíněnou pravděpodobnost lze také považovat za náhodnou proměnnou, - funkci náhodné proměnné X, jmenovitě

Očekávání této náhodné proměnné se rovná (bezpodmínečné) pravděpodobnosti,

což je instance zákon celkové pravděpodobnosti E (P ( A | X )) = P ( A ).

Výklad

Podmíněná pravděpodobnost P ( Y ≤ 0.75 | X = 0.5 ) nelze interpretovat jako P ( Y ≤ 0.75, X = 0,5) / P ( X = 0.5 ), protože ten dává 0/0. V souladu s tím P ( Y ≤ 0.75 | X = 0.5 ) nelze interpretovat pomocí empirických frekvencí, protože přesná hodnota X = 0,5 nemá šanci objevit se náhodně, dokonce ani jednou během nekonečného sledu nezávislých studií.

Podmíněnou pravděpodobnost lze interpretovat jako limit,

Podmíněné očekávání

Podmíněné očekávání E ( Y | X = 0.5 ) je malý zájem; mizí jen symetrií. Je zajímavější to vypočítat E (|Z| | X = 0.5 ) ošetřování |Z| jako funkce X, Y:

Obecněji,

pro −1 < X <1. Lze také považovat podmíněné očekávání za náhodnou proměnnou, - funkci náhodné proměnné X, jmenovitě

Očekávání této náhodné proměnné se rovná (bezpodmínečnému) očekávání |Z|,

a to,

což je instance zákon úplného očekávání E (E ( Y | X )) = E ( Y ).

Náhodná proměnná E (|Z| | X) je nejlepším prediktorem |Z| daný X. To znamená, že minimalizuje střední čtvercovou chybu E (|Z| - F(X) )2 na třídu všech náhodných proměnných formuláře F(X). Podobně jako v diskrétním případě E (|Z| | G(X)) = E (|Z| | X ) pro každou měřitelnou funkci G to je jedna ku jedné na (-1,1).

Podmíněné rozdělení

Dáno X = x, podmíněné rozdělení Y, dané hustotou FY|X=X(y), je (změněná) distribuce arcsinu; jeho kumulativní distribuční funkce je

pro všechny X a y takhle X2 + y2 <1. Odpovídající očekávání h(X,Y) není nic jiného než podmíněné očekávání E ( h(X,Y) | X=X ). The směs těchto podmíněných distribucí, které jsou brány pro všechny X (podle rozdělení X) je bezpodmínečné rozdělení Y. Tato skutečnost se rovná rovnosti

druhý je instancí zákona o úplné pravděpodobnosti zmíněno výše.

Co není klimatizace

Na diskrétní úrovni je kondicionování možné pouze v případě, že podmínka je nenulová pravděpodobnost (nelze ji dělit nulou). Na úrovni hustoty, klimatizace zapnuta X = X je možné, i když P ( X = X ) = 0. Tento úspěch může vytvořit iluzi, že podmíněnost je vždy možný. Bohužel tomu tak není, a to z několika níže uvedených důvodů.

Geometrická intuice: opatrnost

Výsledek P ( Y ≤ 0.75 | X = 0.5 ) = 5/6, výše, je geometricky evidentní v následujícím smyslu. Body (X,y,z) koule X2 + y2 + z2 = 1, splňující podmínku X = 0,5, jsou kruh y2 + z2 = 0,75 poloměru v letadle X = 0,5. Nerovnost y ≤ 0,75 drží na oblouku. Délka oblouku je 5/6 délky kruhu, proto je podmíněná pravděpodobnost rovna 5/6.

Toto úspěšné geometrické vysvětlení může vytvořit iluzi, že následující otázka je triviální.

Bod dané koule je vybrán náhodně (jednotně). Vzhledem k tomu, že bod leží na dané rovině, jaké je jeho podmíněné rozdělení?

Může se zdát evidentní, že podmíněné rozdělení musí být na dané kružnici (průsečík dané koule a dané roviny) rovnoměrné. Někdy to opravdu je, ale obecně tomu tak není. Zvláště, Z je distribuován rovnoměrně na (-1, + 1) a nezávisle na poměru Y/X, tím pádem, P ( Z ≤ 0.5 | Y/X ) = 0.75. Na druhé straně nerovnost z ≤ 0,5 drží na oblouku kruhu X2 + y2 + z2 = 1, y = cx (pro všechny dané C). Délka oblouku je 2/3 délky kruhu. Podmíněná pravděpodobnost je však 3/4, nikoli 2/3. Toto je projev klasického Borellova paradoxu.[4][5]

Odvolání k symetrii mohou být zavádějící, pokud nejsou formalizována jako invariantní argumenty.

— Otruby[6]

Další příklad. A náhodné střídání trojrozměrného prostoru je rotace o náhodný úhel kolem náhodné osy. Geometrická intuice naznačuje, že úhel je nezávislý na ose a je rovnoměrně rozložen. Ten druhý je však špatný; malé hodnoty úhlu jsou méně pravděpodobné.

Omezující postup

Vzhledem k události B nulové pravděpodobnosti, vzorec je k ničemu, je možné to zkusit pro vhodný sled událostí Bn nenulové pravděpodobnosti takové, že BnB (to znamená, a ). Je uveden jeden příklad výše. Další dva příklady jsou Brownův most a Brownova exkurze.

V posledních dvou příkladech je zákon celkové pravděpodobnosti irelevantní, protože je uvedena pouze jedna událost (podmínka). Naproti tomu v příkladu výše zákon totální pravděpodobnosti platí, od události X = 0,5 je zahrnuto do rodiny událostí X = X kde X přeběhne (−1,1) a tyto události jsou oddílem prostoru pravděpodobnosti.

Aby se předešlo paradoxům (např Borelův paradox ), je třeba vzít v úvahu následující důležité rozlišení. Pokud je daná událost nenulová pravděpodobnost, pak je její podmínění dobře definované (bez ohledu na jakékoli jiné události), jak bylo uvedeno výše. Naproti tomu, pokud je daná událost nulová pravděpodobnost, pak je její podmínění špatně definováno, pokud není poskytnut nějaký další vstup. Špatná volba tohoto dodatečného vstupu vede ke špatným podmíněným pravděpodobnostem (očekávání, rozdělení). V tomto smyslu, "koncept podmíněné pravděpodobnosti s ohledem na izolovanou hypotézu, jejíž pravděpodobnost se rovná 0, je nepřípustný." (Kolmogorov.[6]

Dalším vstupem může být (a) symetrie (invariantní skupina); b) sled událostí Bn takhle BnB, P ( Bn )> 0; c) oddíl obsahující danou událost. Podmíněná teoretická podmínka (níže) zkoumá případ (c), popisuje jeho vztah k (b) obecně a k (a), pokud je to relevantní.

Některé události s nulovou pravděpodobností jsou mimo možnosti podmínění. Příklad: let Xn být nezávislé náhodné proměnné rovnoměrně rozložené na (0,1) a B událost "Xn → 0 tak jako n → ∞"; co takhle P ( Xn < 0.5 | B ) ? Má tendenci k 1, nebo ne? Další příklad: let X být náhodná proměnná rovnoměrně rozdělená na (0,1) a B událost "X je racionální číslo “; a co P ( X = 1/n | B ) ? Jedinou odpovědí je, že opět

koncept podmíněné pravděpodobnosti s ohledem na izolovanou hypotézu, jejíž pravděpodobnost se rovná 0, je nepřípustný.

— Kolmogorov[6]

Podmínka na úrovni teorie míry

Příklad. Nechat Y být náhodná proměnná rovnoměrně rozdělená na (0,1) a X = F(Y) kde F je daná funkce. Níže jsou uvedeny dva případy: F = F1 a F = F2, kde F1 je spojitá po částech lineární funkce

a F2 je Funkce Weierstrass.

Geometrická intuice: opatrnost

Dáno X = 0,75, dvě hodnoty Y jsou možné, 0,25 a 0,5. Může se zdát evidentní, že obě hodnoty mají podmíněnou pravděpodobnost 0,5 jen proto, že jeden bod je shodný do jiného bodu. To je však iluze; viz. níže.

Podmíněná pravděpodobnost

Podmíněná pravděpodobnost P ( Y ≤ 1/3 | X ) lze definovat jako nejlepší prediktor indikátoru

daný X. To znamená, že minimalizuje střední čtvercovou chybu E ( - G(X) )2 na třídu všech náhodných proměnných formuláře G (X).

V případě F = F1 příslušnou funkci G = G1 lze vypočítat výslovně,[podrobnosti 1]

Alternativně lze použít omezující postup,

dává stejný výsledek.

Tím pádem, P ( Y ≤ 1/3 | X ) = G1 (X). Očekávání této náhodné proměnné se rovná (bezpodmínečné) pravděpodobnosti, E (P ( Y ≤ 1/3 | X )) = P ( Y ≤ 1/3 ), a to,

což je instance zákon celkové pravděpodobnosti E (P ( A | X )) = P ( A ).

V případě F = F2 příslušnou funkci G = G2 pravděpodobně nelze výslovně vypočítat. Přesto existuje a lze jej vypočítat numericky. Opravdu prostor L2 (Ω) všech čtvercových integrovatelných náhodných proměnných je a Hilbertův prostor; indikátor je vektorem tohoto prostoru; a náhodné proměnné formuláře G (X) jsou (uzavřený, lineární) podprostor. The ortogonální projekce tohoto vektoru do tohoto podprostoru je dobře definovaný. Lze jej vypočítat numericky pomocí konečně-dimenzionální aproximace do nekonečně dimenzionálního Hilbertova prostoru.

Ještě jednou očekávání náhodné proměnné P ( Y ≤ 1/3 | X ) = G2 (X) se rovná (bezpodmínečné) pravděpodobnosti, E (P ( Y ≤ 1/3 | X )) = P ( Y ≤ 1/3 ), a to,

Hilbertův vesmírný přístup však zachází G2 jako třída ekvivalence funkcí spíše než individuální funkce. Měřitelnost G2 je zajištěna, ale kontinuita (nebo dokonce Riemannova integrovatelnost ) není. Hodnota G2 (0,5) je určen jednoznačně, protože bod 0,5 je atom distribuce X. Jiné hodnoty X nejsou atomy, tedy odpovídající hodnoty G2 (X) nejsou určeny jednoznačně. Ještě jednou, "koncept podmíněné pravděpodobnosti s ohledem na izolovanou hypotézu, jejíž pravděpodobnost se rovná 0, je nepřípustný." (Kolmogorov.[6]

Alternativně stejná funkce G (budiž G1 nebo G2) lze definovat jako Derivát Radon – Nikodym

kde míry μ, ν jsou definovány pomocí

pro všechny sady Borel To znamená, μ je (bezpodmínečné) rozdělení X, zatímco ν je jedna třetina jeho podmíněného rozdělení,

Oba přístupy (přes Hilbertův prostor a přes derivát Radon – Nikodym) zacházejí G jako třída ekvivalence funkcí; dvě funkce G a G' jsou považovány za rovnocenné, pokud G (X) = G' (X) téměř jistě. V souladu s tím podmíněná pravděpodobnost P ( Y ≤ 1/3 | X ) je považováno za třídu ekvivalence náhodných proměnných; jako obvykle jsou dvě náhodné proměnné považovány za ekvivalentní, pokud jsou si téměř jisté.

Podmíněné očekávání

Podmíněné očekávání lze definovat jako nejlepší prediktor Y daný X. To znamená, že minimalizuje střední čtvercovou chybu na třídu všech náhodných proměnných formuláře h(X).

V případě F = F1 příslušnou funkci h = h1 lze vypočítat výslovně,[podrobnosti 2]

Alternativně lze použít omezující postup,

dává stejný výsledek.

Tím pádem, Očekávání této náhodné proměnné se rovná (bezpodmínečnému) očekávání, a to,

což je instance zákon úplného očekávání

V případě F = F2 příslušnou funkci h = h2 pravděpodobně nelze výslovně vypočítat. Přesto existuje a lze jej vypočítat numericky stejným způsobem jako G2 výše, - jako ortogonální projekce v Hilbertově prostoru. Zákon totálního očekávání platí, protože projekce nemůže změnit skalární součin konstantou 1 patřící do podprostoru.

Alternativně stejná funkce h (budiž h1 nebo h2) lze definovat jako Derivát Radon – Nikodym

kde míry μ, ν jsou definovány pomocí

pro všechny sady Borel Tady je omezené očekávání, nesmí být zaměňováno s podmíněným očekáváním

Podmíněné rozdělení

V případě F = F1 podmíněné kumulativní distribuční funkce lze vypočítat výslovně, podobně jako G1. Postup omezení poskytuje:

což nemůže být správné, protože kumulativní distribuční funkce musí být pravý spojitý!

Tento paradoxní výsledek je vysvětlen teorií opatření následovně. Za dané y korespondence je dobře definován (prostřednictvím Hilbertovho prostoru nebo derivátu Radon-Nikodym) jako třída ekvivalence funkcí ( X). Považováno za funkci y za dané X je špatně definován, pokud není poskytnut nějaký další vstup. Jmenovitě funkce (z X) musí být vybrán v každé (nebo alespoň téměř každé) třídě ekvivalence. Špatná volba vede ke špatným funkcím podmíněné kumulativní distribuce.

Správnou volbu lze provést následovně. Za prvé, se uvažuje pro racionální čísla y pouze. (Jakákoli jiná hustá spočetná množina může být použita stejně dobře.) Je tedy použita pouze spočetná množina tříd ekvivalence; všechny volby funkcí v těchto třídách jsou vzájemně ekvivalentní a odpovídající funkce racionální y je dobře definovaný (pro téměř všechny X). Za druhé, funkce je rozšířena z racionálních čísel na reálná čísla pravou spojitostí.

Obecně je podmíněné rozdělení definováno téměř pro všechny X (podle rozdělení X), ale někdy je výsledek v X, v tom případě jsou jednotlivé hodnoty přijatelné. V uvažovaném příkladu je tomu tak; správný výsledek pro X = 0.75,

ukazuje, že podmíněné rozdělení Y daný X = 0,75 se skládá ze dvou atomů, při 0,25 a 0,5, pravděpodobností 1/3 a 2/3.

Podobně lze podmíněné rozdělení vypočítat pro všechny X v (0, 0,5) nebo (0,5, 1).

Hodnota X = 0,5 je atom distribuce X, tedy odpovídající podmíněné rozdělení je dobře definované a lze jej vypočítat elementárními prostředky (jmenovatel nezmizí); podmíněné rozdělení Y daný X = 0,5 je uniformní na (2/3, 1). Teorie měření vede ke stejnému výsledku.

Směs všech podmíněných distribucí je (bezpodmínečné) rozdělení Y.

Podmíněné očekávání není nic jiného než očekávání s ohledem na podmíněné rozdělení.

V případě F = F2 korespondence pravděpodobně nelze výslovně vypočítat. Za dané y je dobře definován (přes Hilbertův prostor nebo derivát Radon-Nikodym) jako třída ekvivalence funkcí ( X). Správný výběr funkcí v rámci těchto tříd ekvivalence lze provést výše; vede ke správným funkcím podmíněného kumulativního rozdělení, tedy k podmíněnému rozdělení. Podmíněné distribuce obecně nemusí být atomový nebo absolutně kontinuální (ani směsi obou typů). Pravděpodobně v uvažovaném příkladu jsou jednotné číslo (jako Distribuce Cantor ).

Směs všech podmíněných distribucí je opět (bezpodmínečné) rozdělení a podmíněné očekávání je očekávání vzhledem k podmíněnému rozdělení.

Technické údaje

  1. ^ Důkaz:
    zbývá si toho povšimnout (1−A )2 + 2A2 je minimální na A = 1/3.
  2. ^ Důkaz:
    zbývá si toho povšimnout
    je minimální na a je minimální na

Viz také

Poznámky

  1. ^ „Mathematica / Uniform Spherical Distribution - Wikibooks, open books for an open world“. en.wikibooks.org. Citováno 2018-10-27.
  2. ^ Buchanan, K .; Huff, G. H. (červenec 2011). Msgstr "Porovnání geometricky vázaných náhodných polí v euklidovském prostoru". 2011 IEEE International Symposium on Antennas and Propagation (APSURSI): 2008–2011. doi:10.1109 / APS.2011.5996900. ISBN  978-1-4244-9563-4.
  3. ^ Buchanan, K .; Flores, C .; Wheeland, S .; Jensen, J .; Grayson, D .; Huff, G. (květen 2017). "Přenášet tvar paprsku pro radarové aplikace pomocí kruhově zúžených náhodných polí". Radarová konference IEEE 2017: 0112–0117. doi:10.1109 / RADAR.2017.7944181. ISBN  978-1-4673-8823-8.
  4. ^ Pollard 2002, Oddíl. 5.5, Příklad 17 na straně 122.
  5. ^ Durrett 1996, Oddíl. 4.1 (a), příklad 1.6 na straně 224.
  6. ^ A b C d Pollard 2002, Oddíl. 5,5, strana 122.

Reference