Zákon totální odchylky - Law of total variance

v teorie pravděpodobnosti, zákon totální odchylky[1] nebo varianční rozkladový vzorec nebo vzorce podmíněné odchylky nebo zákon iterovaných odchylek také známý jako Evin zákon,[2] uvádí, že pokud X a Y jsou náhodné proměnné na stejné pravděpodobnostní prostor a rozptyl z Y je tedy konečný

V jazyce, který je statistikům pravděpodobně lépe známý než teoretici pravděpodobnosti, jsou dva pojmy „nevysvětlitelná“ a „vysvětlená“ složka rozptylu (srov. zlomek rozptylu nevysvětlitelný, vysvětlená variace ). v pojistněmatematická věda konkrétně teorie důvěryhodnosti, první složka se nazývá očekávaná hodnota variance procesu (EVPV) a druhé se nazývá rozptyl hypotetických prostředků (VHM).[3] Tyto dvě složky jsou rovněž zdrojem termínu „Evin zákon“, od iniciál EV VE pro „očekávání rozptylu“ a „rozptyl očekávání“.

Existuje obecný vzorec rozkladu rozptylu pro C ≥ 2 komponenty (viz níže).[4] Například se dvěma podmíněnými náhodnými proměnnými:

který vyplývá ze zákona úplné podmíněné odchylky:[4]

Všimněte si, že podmíněná očekávaná hodnota E( Y | X ) je náhodná proměnná sama o sobě, jejíž hodnota závisí na hodnotě X. Všimněte si, že podmíněná očekávaná hodnota Y vzhledem k událost X = X je funkce X (to je místo, kde se stává důležitým dodržování konvenčního a přísně rozlišovaného zápisu teorie pravděpodobnosti!). Pokud napíšeme E (Y | X = X ) = G(X) pak náhodná proměnná E( Y | X ) je jen G(X). Podobné komentáře platí pro podmíněná odchylka.

Jeden zvláštní případ (podobný případu) zákon úplného očekávání ) uvádí, že pokud je oddíl celého výsledného prostoru, tj. tyto události se tedy vzájemně vylučují a jsou vyčerpávající

V tomto vzorci je první složkou očekávání podmíněné odchylky; další dva řádky jsou rozptylem podmíněného očekávání.

Důkaz

Zákon totální odchylky lze prokázat pomocí zákon úplného očekávání.[5] Za prvé,

z definice rozptylu. Z definice rozptylu máme opět

Nyní přepíšeme podmíněný druhý moment Y, pokud jde o jeho rozptyl a první okamžik:

Protože očekávání součtu je součtem očekávání, lze nyní přeskupit podmínky:

Nakonec poznáváme výrazy v závorkách jako rozptyl podmíněného očekávání E [Y | X]:

Obecný rozptylový rozklad použitelný pro dynamické systémy

Následující vzorec ukazuje, jak použít obecný vzorec pro měření rozkladu teoretické variance [4] na stochastické dynamické systémy. Nechat Y(t) je hodnota systémové proměnné v čase t. Předpokládejme, že máme vnitřní historii (přírodní filtrace ) , z nichž každý odpovídá historii (trajektorii) jiné sbírky systémových proměnných. Kolekce nemusí být disjunktní. Rozptyl Y(t) lze vždy rozložitt, do C ≥ 2 komponenty takto:

Rozklad není ojedinělý. Závisí to na pořadí kondicionování v postupném rozkladu.

Čtverec korelace a vysvětlené (nebo informační) variace

V případech, kdy (YX) jsou takové, že podmíněná očekávaná hodnota je lineární; tj. v případech, kdy

z bilinearity kovariance vyplývá, že

a

a vysvětlená složka rozptylu dělená celkovou odchylkou je jen druhou mocninou korelace mezi Y a X; tj. v takových případech

Jedním z příkladů této situace je, když (X, Y) mají dvojrozměrné normální (gaussovské) rozdělení.

Obecněji, když je podmíněné očekávání E( Y | X ) je nelineární funkceX

[4]

které lze odhadnout jako R na druhou od nelineární regrese Y na Xpomocí dat získaných ze společné distribuce (X,Y). Když E( Y | X ) má Gaussovo rozdělení (a je invertibilní funkcí X), nebo Y sám má (marginální) Gaussovo rozdělení, tato vysvětlená složka variace nastavuje dolní mez na vzájemné informace:[4]

Vyšší okamžiky

Podobný zákon pro třetí centrální moment μ3 říká

Pro vyšší kumulanty existuje zevšeobecnění. Vidět zákon totální kumulace.

Viz také

Reference

  1. ^ Neil A. Weiss, Kurz pravděpodobnosti, Addison – Wesley, 2005, strany 385–386.
  2. ^ Joseph K. Blitzstein a Jessica Hwang: „Úvod do pravděpodobnosti“
  3. ^ Mahler, Howard C .; Dean, Curtis Gary (2001). „Kapitola 8: Důvěryhodnost“ (PDF). v Pojistněmatematická společnost (vyd.). Základy pojistněmatematické vědy (4. vydání). Pojistněmatematická společnost. str. 525–526. ISBN  978-0-96247-622-8. Citováno 25. června 2015.
  4. ^ A b C d E Bowsher, C.G. a P.S. Swain, Identifikace zdrojů variací a tok informací v biochemických sítích, PNAS 15. května 2012, 109 (20) E1320-E1328.
  5. ^ Neil A. Weiss, Kurz pravděpodobnosti„Addison – Wesley, 2005, strany 380–383.
  • Blitzstein, Joe. „Stat 110 Final Review (Eve's Law)“ (PDF). stat110.net. Harvardská univerzita, ministerstvo statistiky. Citováno 9. července 2014.
  • Billingsley, Patrick (1995). Pravděpodobnost a míra. New York, NY: John Wiley & Sons, Inc. ISBN  0-471-00710-2. (Problém 34.10 (b))