Ilustrace centrální limitní věty - Illustration of the central limit theorem

V teorii pravděpodobnosti je teorém centrálního limitu (CLT) uvádí, že v mnoha situacích, když jsou přidány nezávislé náhodné proměnné, má jejich správně normalizovaný součet tendenci k normálnímu rozdělení. Tento článek poskytuje dvě ilustrace této věty. Oba zahrnují součet nezávislé a identicky distribuované náhodné proměnné a ukázat, jak rozdělení pravděpodobnosti součtu se blíží k normální distribuce jak se počet termínů v součtu zvyšuje.

První ilustrace zahrnuje a spojité rozdělení pravděpodobnosti, pro které mají náhodné proměnné a funkce hustoty pravděpodobnosti. Druhá ilustrace, pro kterou lze většinu výpočtů provést ručně, zahrnuje a diskrétní rozdělení pravděpodobnosti, který se vyznačuje a funkce pravděpodobnostní hmotnosti.

Ilustrace spojitého případu

The hustota součtu dvou nezávislých náhodných proměnných se skutečnou hodnotou rovná se konvoluce hustotních funkcí původních proměnných.

Tedy hustota součtu m+n podmínky posloupnosti nezávislých identicky distribuovaných proměnných se rovnají konvoluci hustot součtů m podmínky a n období. Zejména hustota součtu n+1 členy se rovná konvoluci hustoty součtu n výrazy s původní hustotou („součet“ 1 výrazu).

A funkce hustoty pravděpodobnosti je zobrazen na prvním obrázku níže. Pak hustoty součtu dvou, tří a čtyř nezávislé identicky distribuované proměnné, z nichž každá má původní hustotu, jsou zobrazeny na následujících obrázcích. je-li původní hustota a po částech polynomiální, jak je to v příkladu, pak také jsou součet hustot, stále vyššího stupně. Ačkoli původní hustota není zdaleka normální, hustota součtu jen několika proměnných s touto hustotou je mnohem plynulejší a má některé kvalitativní rysy normální hustota.

Křivky byly vypočítány pomocí diskrétní Fourierova transformace. Seznam hodnot y = F(X0 + k ΔX) byla postavena, kde F je původní funkce hustoty a ΔX je přibližně rovno 0,002 a k je rovno 0 až 1000. Diskrétní Fourierova transformace Y z y byl vypočítán. Pak konvoluce F je samo o sobě úměrné inverzní diskrétní Fourierově transformaci bodový produkt z Y sám se sebou.

Funkce hustoty pravděpodobnosti.

Původní funkce hustoty pravděpodobnosti

Začneme funkcí hustoty pravděpodobnosti. Tato funkce, i když je diskontinuální, není zdaleka nejpatologičtějším příkladem, jaký by bylo možné vytvořit. Je to po částech polynom s částmi stupňů 0 a 1. Průměr tohoto rozdělení je 0 a jeho směrodatná odchylka je 1.

Hustota součtu dvou proměnných.

Funkce hustoty pravděpodobnosti součtu dvou členů

Dále vypočítáme hustotu součtu dvou nezávislých proměnných, z nichž každá má výše uvedenou hustotu. Hustota součtu je konvoluce výše uvedené hustoty sám se sebou.

Součet dvou proměnných má průměr 0. Hustotu zobrazenou na obrázku vpravo změnilo měřítko , takže jeho směrodatná odchylka je 1.

Tato hustota je již hladší než originál. Existují zjevné hrudky, které odpovídají intervalům, ve kterých byla definována původní hustota.

Hustota součtu tří proměnných.

Funkce hustoty pravděpodobnosti součtu tří členů

Poté vypočítáme hustotu součtu tří nezávislých proměnných, z nichž každá má výše uvedenou hustotu. Hustota součtu je konvoluce první hustoty s druhou.

Součet tří proměnných má průměr 0. Hustotu zobrazenou na obrázku vpravo změnilo měřítko 3, takže jeho směrodatná odchylka je 1.

Tato hustota je ještě plynulejší než ta předchozí. Na tomto obrázku lze jen těžko detekovat hrudky.

Hustota součtu čtyř proměnných

Funkce hustoty pravděpodobnosti součtu čtyř členů

Nakonec vypočítáme hustotu součtu čtyř nezávislých proměnných, z nichž každá má výše uvedenou hustotu. Hustota součtu je konvoluce první hustoty se třetí (nebo druhé hustoty sama o sobě).

Součet čtyř proměnných má průměr 0. Hustotu zobrazenou na obrázku vpravo změnilo měřítko 4, takže jeho směrodatná odchylka je 1.

Tato hustota se jeví jako kvalitativně velmi podobná normální hustotě. Podle oka nelze rozlišit žádné hrudky.

Ilustrace diskrétního případu

Tato část ilustruje centrální limitní větu na příkladu, pro který lze výpočet provést rychle ručně na papíře, na rozdíl od příkladu náročnějšího na výpočet v předchozí části.

Součet všech permutací délky 1 vybraných ze sady celých čísel 1, 2, 3

Původní funkce pravděpodobnostní hmotnosti

Předpokládejme rozdělení pravděpodobnosti a diskrétní náhodná proměnná X klade stejnou váhu na 1, 2 a 3:

Funkce pravděpodobnostní hmotnosti náhodné proměnné X může být znázorněno následujícím sloupcový graf:


Je zřejmé, že to nevypadá jako zvonovitá křivka normálního rozdělení. Porovnejte výše uvedené s níže uvedenými vyobrazeními.

Součet všech permutací délky 2 vybraných ze sady celých čísel 1, 2, 3

Pravděpodobnostní hromadná funkce součtu dvou členů

Nyní zvažte součet dvou nezávislých kopií X:

Funkce pravděpodobnostní hmotnosti tohoto součtu může být znázorněna takto:

To stále nevypadá moc jako křivka ve tvaru zvonu, ale jako křivka ve tvaru zvonu a na rozdíl od funkce pravděpodobnostní hmotnosti X sama o sobě je ve středu vyšší než ve dvou ocasech.

Součet všech permutací délky 3 vybraných ze sady celých čísel 1, 2, 3

Pravděpodobnostní hromadná funkce součtu tří členů

Nyní zvažte součet tři nezávislé kopie této náhodné proměnné:

Funkce pravděpodobnostní hmotnosti tohoto součtu může být znázorněna takto:

Nejen, že je to ve středu větší než u ocasů, ale jak se člověk pohybuje směrem ke středu z kteréhokoli ocasu, sklon se nejprve zvětšuje a poté zmenšuje, stejně jako u křivky ve tvaru zvonu.

Stupeň jeho podobnosti se zvonovitou křivkou lze kvantifikovat následovně. Zvážit

Pr (X1 + X2 + X3 ≤ 7) = 1/27 + 3/27 + 6/27 + 7/27 + 6/27 = 23/27 = 0.85185... .

Jak blízko je to k tomu, co normální aproximace by dala? Je snadno vidět, že očekávaná hodnota Y = X1 + X2 + X3 je 6 a směrodatná odchylka Y je druhá odmocnina ze 2. Od té doby Y ≤ 7 (slabá nerovnost) právě tehdy Y <8 (přísná nerovnost), používáme a korekce spojitosti a hledat

kde Z má standardní normální rozdělení. Rozdíl mezi 0,85185 ... a 0,85558 ... se zdá být pozoruhodně malý, když se vezme v úvahu, že počet nezávislých náhodných proměnných, které byly přidány, byl pouze tři.

Funkce pravděpodobnostní hmotnosti součtu 1 000 členů

Centrální věta 2. svg

Následující obrázek ukazuje výsledek simulace založené na příkladu uvedeném na této stránce. Extrakce z rovnoměrného rozdělení se opakuje 1000krát a výsledky se sečtou.

Protože simulace je založena na Metoda Monte Carlo, proces se opakuje 10 000krát. Výsledky ukazují, že rozdělení součtu 1 000 uniformních extrakcí se velmi dobře podobá křivce ve tvaru zvonu.

externí odkazy