Zkoumáme spojitou náhodnou proměnnou. Nechat být charakteristickou funkcí jeho distribuce, jejíž hustotní funkce je F, a své kumulanty. Rozšiřujeme se o známé rozdělení s funkcí hustoty pravděpodobnosti ψcharakteristická funkce a kumulanty . Hustota ψ je obecně zvolen jako normální distribuce, ale jsou možné i jiné možnosti. Podle definice kumulantů máme (viz Wallace, 1958)[3]
a
což dává následující formální identitu:
Vlastnosti Fourierovy transformace je Fourierova transformace , kde D je operátor diferenciálu s ohledem na X. Tedy po změně s na obou stranách rovnice najdeme pro F formální expanze
Li ψ je vybrána jako normální hustota
se střední hodnotou a rozptylem daným vztahem F, to znamená, že a rozptyl , pak se stane expanze
od té doby pro všechny r > 2, protože vyšší kumulanty normálního rozdělení jsou 0. Rozšířením exponenciálního a sbírání členů podle pořadí derivací se dostáváme k sérii Gram – Charlier A. Taková expanze může být napsána kompaktně ve smyslu Polynomy zvonu tak jako
Od n-té derivace Gaussovy funkce je uveden v termínech Poustevnický polynom tak jako
to nám dává konečné vyjádření řady Gram – Charlier A as
Pokud zahrneme pouze první dva opravné členy do normálního rozdělení, získáme
s a .
Upozorňujeme, že tento výraz není zaručeně kladný, a proto nejde o platné rozdělení pravděpodobnosti. Série Gram – Charlier A se v mnoha zajímavých případech liší - konverguje pouze tehdy, když spadne rychleji než v nekonečnu (Cramér 1957). Pokud se nesbližuje, řada také není pravdivá asymptotická expanze, protože není možné odhadnout chybu expanze. Z tohoto důvodu je série Edgeworth (viz další část) obecně upřednostňována před sériemi Gram – Charlier A.
Nechat být posloupností nezávislé a identicky distribuované náhodné veličiny se střední hodnotou a rozptyl a nechte být jejich standardizovanými částkami:
pro každého , pokud jsou průměr a rozptyl konečné.
Nyní předpokládejme, že kromě toho, že máme na mysli a rozptyl , i.i.d. náhodné proměnné mít vyšší kumulanty . Z aditivních a homogenních vlastností kumulantů jsou kumulanty z pokud jde o kumulanty jsou pro ,
Pokud expandujeme z hlediska standardního normálního rozdělení, tedy pokud nastavíme
pak kumulační rozdíly ve formálním vyjádření charakteristické funkce z jsou
Série Gram – Charlier A pro funkci hustoty je teď
Série Edgeworth je vyvinuta podobně jako série Gram – Charlier A, pouze nyní jsou termíny shromažďovány podle pravomocí . Koeficienty n-m / 2 termín lze získat sběrem monomiálů Bellových polynomů odpovídajících celočíselným oddílům m. Máme tedy charakteristickou funkci jako
kde je polynomiální stupně . Opět po inverzní Fourierově transformaci funkce hustoty následuje jako
Podobně integrací řady získáme distribuční funkci
Můžeme explicitně napsat polynom tak jako
kde je součet přes všechny celočíselné oddíly m takhle a a
Například pokud m = 3, pak existují tři způsoby, jak rozdělit toto číslo: 1 + 1 + 1 = 2 + 1 = 3. Proto musíme zkoumat tři případy:
1 + 1 + 1 = 1 · k1, takže máme k1 = 3, l1 = 3 a s = 9.
1 + 2 = 1 · k1 + 2 · k2, takže máme k1 = 1, k2 = 1, l1 = 3, l2 = 4 a s = 7.
Tady, φ(j)(X) je j-tý derivát φ (·) v bodě X. Pamatuji si, že deriváty hustoty normálního rozdělení se vztahují k normální hustotě do , (kde je Poustevnický polynom řádu n), vysvětluje alternativní reprezentace z hlediska funkce hustoty. Blinnikov a Moessner (1998) poskytli jednoduchý algoritmus pro výpočet podmínek expanze vyššího řádu.
Všimněte si, že v případě distribucí mřížky (které mají diskrétní hodnoty) musí být přizpůsobení Edgeworth přizpůsobeno tak, aby zohledňovalo nespojité skoky mezi mřížovými body.[6]
Ilustrace: průměrná hustota vzorku ze tří
Hustota střední hodnoty vzorku tří proměnných chi2. Graf porovnává skutečnou hustotu, normální aproximaci a dvě Edgeworthovy expanze.
U konečných vzorků není zaručeno, že rozšíření Edgeworth bude správné rozdělení pravděpodobnosti protože hodnoty CDF v některých bodech mohou jít dále .
Zaručují (asymptoticky) absolutní chyby, ale relativní chyby lze snadno posoudit porovnáním vedoucího termínu Edgeworth ve zbytku s celkovým vedoucím termínem. [7]
Martin, Douglas; Arora, Rohit (2017). "Neúčinnost a zkreslení modifikované hodnoty v riziku a očekávaného schodku". Journal of Risk. 19 (6): 59–84. doi:10.21314 / JOR.2017.365.
J. E. Kolassa (2006). Metody aproximace sérií ve statistice (3. vyd.). (Poznámky k přednášce ve statistice č. 88). Springer, New York.