Normálně distribuovaný a nekorelovaný neznamená nezávislý - Normally distributed and uncorrelated does not imply independent

v teorie pravděpodobnosti, ačkoli to ilustrují jednoduché příklady lineární nekorelace dvou náhodných proměnných obecně neznamená jejich nezávislost, to je někdy mylně si myslel, že to znamená, že když dvě náhodné proměnné jsou normálně distribuováno. Tento článek ukazuje, že předpoklad normálního rozdělení nemá tento důsledek, ačkoli vícerozměrné normální rozdělení, včetně rozdělit normální rozdělení, dělá.

Řekněme, že ten pár náhodných proměnných má dvojrozměrné normální rozdělení znamená, že každý lineární kombinace z a pro konstantní (tj. ne náhodné) koeficienty a má jednorozměrné normální rozdělení. V takovém případě, pokud a nesouvisí, pak jsou nezávislé.[1] Je však možné pro dvě náhodné proměnné a být tak distribuovány společně, že každý z nich je okrajově normálně distribuován a nejsou vzájemně propojeny, ale nejsou nezávislé; příklady jsou uvedeny níže.

Příklady

Symetrický příklad

Dvě normálně distribuované, nekorelované, ale závislé proměnné.
Společný sortiment a . Tmavší znamená vyšší hodnotu funkce hustoty.

Předpokládat má normální rozdělení s očekávaná hodnota 0 a rozptyl 1. Let mít Distribuce Rademacher, aby nebo , každý s pravděpodobností 1/2, a předpokládejme je nezávislý na . Nechat . Pak

  • a nesouvisí;
  • oba mají stejné normální rozdělení; a
  • a nejsou nezávislí.[2]

To vidět a nesouvisí, lze zvážit kovariance : podle definice je

Pak podle definice náhodných proměnných , , a a nezávislost z , jeden má

To vidět má stejné normální rozdělení jako , zvážit

(od té doby a oba mají stejné normální rozdělení), kde je kumulativní distribuční funkce normálního rozdělení ..

To vidět a nejsou nezávislí, pozorujte to nebo tak .

Nakonec rozdělení jednoduché lineární kombinace koncentruje kladnou pravděpodobnost na 0: . Proto náhodná proměnná není normálně distribuován, a tak také a nejsou společně běžně distribuovány (podle výše uvedené definice).

Asymetrický příklad

Hustota spojů a . Tmavší znamená vyšší hodnotu hustoty.

Předpokládat má normální rozdělení s očekávaná hodnota 0 a rozptyl 1. Let

kde je kladné číslo, které bude uvedeno níže. Li je velmi malý, pak korelace je blízko -li je tedy velmi velký je blízko 1. Protože korelace je a spojitá funkce z , věta o střední hodnotě znamená, že existuje určitá konkrétní hodnota což dělá korelaci 0. Tato hodnota je přibližně 1,54. V tom případě, a nesouvisí, ale zjevně nejsou nezávislé, protože zcela určuje .

To vidět je normálně distribuován - ve skutečnosti je jeho distribuce stejná jako distribuce —Jeden může vypočítat jeho kumulativní distribuční funkce:

kde předposlední rovnost vyplývá ze symetrie distribuce a symetrii podmínky, která .

V tomto příkladu rozdíl není zdaleka normálně distribuován, protože má podstatnou pravděpodobnost (asi 0,88), že se bude rovnat 0. Naproti tomu normální distribuce, která je spojitou distribucí, nemá diskrétní část - to znamená, že se nekoncentruje více než nulová pravděpodobnost v kterémkoli jednotlivém bodě. tudíž a nejsou společně normálně distribuovány, i když jsou samostatně normálně distribuovány.[3]

Příklady s podporou téměř všude v ℝ2

Je dobře známo, že poměr dvou nezávislých standardních normálních náhodných odchylek a Cauchyovo rozdělení. Stejně dobře lze začít s Cauchyho náhodnou proměnnou a odvodit podmíněné rozdělení splnit požadavek, že s a nezávislé a standardní normální. Když to projde matematikou, zjistí to

ve kterém je Rademacherova náhodná proměnná a je Chi-čtvercová náhodná proměnná se dvěma stupni volnosti.

Zvažte dvě sady , . Všimněte si, že není indexován pomocí - to znamená stejná náhodná proměnná Cauchy se používá při definici obou a . Toto sdílení má za následek závislosti napříč indexy: žádný ani je nezávislý na . Nicméně všechny a jsou nekorelované, protože všechna dvojrozměrná rozdělení mají reflexní symetrii napříč osami.

Neobvyklé společné rozdělení s normálními okraji.

Obrázek ukazuje rozptýlené vzorky odebrané z výše uvedené distribuce. Toto poskytuje dva příklady bivariantních distribucí, které nejsou korelované a mají normální marginální distribuce, ale nejsou nezávislé. Levý panel zobrazuje společné rozdělení a ; distribuce má podporu všude kromě původu. Pravý panel zobrazuje společné rozdělení a ; distribuce má podporu všude kromě podél os a má diskontinuitu v počátku: hustota se rozchází, když se k počátku přibližuje po jakékoli přímé dráze kromě podél os.

Viz také

Reference

  1. ^ Hogg, Robert; Tanis, Elliot (2001). „Kapitola 5.4 Bivariační normální rozdělení“. Pravděpodobnost a statistická inference (6. vydání). str. 258–259. ISBN  0130272949.
  2. ^ UIUC, přednáška 21. Normální rozdělení více proměnných, 21.6: „Individuálně Gaussian versus společně Gaussian“.
  3. ^ Edward L. Melnick a Aaron Tenenbein, „Miss Specifications of the Normal Distribution“, Americký statistik, svazek 36, číslo 4. listopadu 1982, strany 372–373