Série Edgeworth - Edgeworth series

The Série Gram – Charlier A. (pojmenováno na počest Jørgen Pedersen Gram a Carl Charlier ) a Série Edgeworth (pojmenováno na počest Francis Ysidro Edgeworth ) jsou série že přibližné a rozdělení pravděpodobnosti pokud jde o jeho kumulanty.[1] Série jsou stejné; ale uspořádání termínů (a tedy přesnost zkrácení řady) se liší.[2] Klíčovou myšlenkou těchto expanzí je napsat charakteristická funkce distribuce, jejíž funkce hustoty pravděpodobnosti F je třeba aproximovat z hlediska charakteristické funkce distribuce se známými a vhodnými vlastnostmi a obnovit F přes inverzní Fourierova transformace.

Série Gram – Charlier A.

Zkoumáme spojitou náhodnou proměnnou. Nechat být charakteristickou funkcí jeho distribuce, jejíž hustotní funkce je F, a své kumulanty. Rozšiřujeme se o známé rozdělení s funkcí hustoty pravděpodobnosti ψcharakteristická funkce a kumulanty . Hustota ψ je obecně zvolen jako normální distribuce, ale jsou možné i jiné možnosti. Podle definice kumulantů máme (viz Wallace, 1958)[3]

a

což dává následující formální identitu:

Vlastnosti Fourierovy transformace je Fourierova transformace , kde D je operátor diferenciálu s ohledem na X. Tedy po změně s na obou stranách rovnice najdeme pro F formální expanze

Li ψ je vybrána jako normální hustota

se střední hodnotou a rozptylem daným vztahem F, to znamená, že a rozptyl , pak se stane expanze

od té doby pro všechny r > 2, protože vyšší kumulanty normálního rozdělení jsou 0. Rozšířením exponenciálního a sbírání členů podle pořadí derivací se dostáváme k sérii Gram – Charlier A. Taková expanze může být napsána kompaktně ve smyslu Polynomy zvonu tak jako

Od n-té derivace Gaussovy funkce je uveden v termínech Poustevnický polynom tak jako

to nám dává konečné vyjádření řady Gram – Charlier A as

Integrace série nám dává kumulativní distribuční funkce

kde je CDF normálního rozdělení.

Pokud zahrneme pouze první dva opravné členy do normálního rozdělení, získáme

s a .

Upozorňujeme, že tento výraz není zaručeně kladný, a proto nejde o platné rozdělení pravděpodobnosti. Série Gram – Charlier A se v mnoha zajímavých případech liší - konverguje pouze tehdy, když spadne rychleji než v nekonečnu (Cramér 1957). Pokud se nesbližuje, řada také není pravdivá asymptotická expanze, protože není možné odhadnout chybu expanze. Z tohoto důvodu je série Edgeworth (viz další část) obecně upřednostňována před sériemi Gram – Charlier A.

Série Edgeworth

Edgeworth vyvinul podobnou expanzi jako vylepšení teorém centrálního limitu.[4] Výhodou řady Edgeworth je, že chyba je řízena, takže je pravdivá asymptotická expanze.

Nechat být posloupností nezávislé a identicky distribuované náhodné veličiny se střední hodnotou a rozptyl a nechte být jejich standardizovanými částkami:

Nechat označit kumulativní distribuční funkce proměnných . Pak podle centrální limitní věty,

pro každého , pokud jsou průměr a rozptyl konečné.

Nyní předpokládejme, že kromě toho, že máme na mysli a rozptyl , i.i.d. náhodné proměnné mít vyšší kumulanty . Z aditivních a homogenních vlastností kumulantů jsou kumulanty z pokud jde o kumulanty jsou pro ,

Pokud expandujeme z hlediska standardního normálního rozdělení, tedy pokud nastavíme

pak kumulační rozdíly ve formálním vyjádření charakteristické funkce z jsou

Série Gram – Charlier A pro funkci hustoty je teď

Série Edgeworth je vyvinuta podobně jako série Gram – Charlier A, pouze nyní jsou termíny shromažďovány podle pravomocí . Koeficienty n-m / 2 termín lze získat sběrem monomiálů Bellových polynomů odpovídajících celočíselným oddílům m. Máme tedy charakteristickou funkci jako

kde je polynomiální stupně . Opět po inverzní Fourierově transformaci funkce hustoty následuje jako

Podobně integrací řady získáme distribuční funkci

Můžeme explicitně napsat polynom tak jako

kde je součet přes všechny celočíselné oddíly m takhle a a

Například pokud m = 3, pak existují tři způsoby, jak rozdělit toto číslo: 1 + 1 + 1 = 2 + 1 = 3. Proto musíme zkoumat tři případy:

  • 1 + 1 + 1 = 1 · k1, takže máme k1 = 3, l1 = 3 a s = 9.
  • 1 + 2 = 1 · k1 + 2 · k2, takže máme k1 = 1, k2 = 1, l1 = 3, l2 = 4 a s = 7.
  • 3 = 3 · k3, takže máme k3 = 1, l3 = 5 a s = 5.

Požadovaný polynom tedy je

Prvních pět podmínek expanze je[5]

Tady, φ(j)(X) je j-tý derivát φ (·) v bodě X. Pamatuji si, že deriváty hustoty normálního rozdělení se vztahují k normální hustotě do , (kde je Poustevnický polynom řádu n), vysvětluje alternativní reprezentace z hlediska funkce hustoty. Blinnikov a Moessner (1998) poskytli jednoduchý algoritmus pro výpočet podmínek expanze vyššího řádu.

Všimněte si, že v případě distribucí mřížky (které mají diskrétní hodnoty) musí být přizpůsobení Edgeworth přizpůsobeno tak, aby zohledňovalo nespojité skoky mezi mřížovými body.[6]

Ilustrace: průměrná hustota vzorku ze tří

Hustota střední hodnoty vzorku tří proměnných chi2. Graf porovnává skutečnou hustotu, normální aproximaci a dvě Edgeworthovy expanze.

Vzít a průměr vzorku .

Můžeme použít několik distribucí pro :

  • Přesné rozdělení, které následuje a gama distribuce: .
  • Asymptotické normální rozdělení: .
  • Dvě Edgeworthovy expanze stupňů 2 a 3.

Diskuse o výsledcích

  • U konečných vzorků není zaručeno, že rozšíření Edgeworth bude správné rozdělení pravděpodobnosti protože hodnoty CDF v některých bodech mohou jít dále .
  • Zaručují (asymptoticky) absolutní chyby, ale relativní chyby lze snadno posoudit porovnáním vedoucího termínu Edgeworth ve zbytku s celkovým vedoucím termínem. [7]

Viz také

Reference

  1. ^ Stuart, A., & Kendall, M. G. (1968). Pokročilá teorie statistiky. Nakladatelská společnost Hafner.
  2. ^ Kolassa, J. E. (2006). Metody aproximace řad ve statistice (svazek 88). Springer Science & Business Media.
  3. ^ Wallace, D.L. (1958). „Asymptotické aproximace distribucí“. Annals of Mathematical Statistics. 29 (3): 635–654. doi:10.1214 / aoms / 1177706528. JSTOR  2237255.
  4. ^ Hall, P. (2013). Bootstrap a Edgeworth expanze. Springer Science & Business Media.
  5. ^ Weisstein, Eric W. "Série Edgeworth". MathWorld.
  6. ^ Kolassa, John E .; McCullagh, Peter (1990). "Edgeworthova řada pro mřížkové distribuce". Annals of Statistics. 18 (2): 981–985. doi:10.1214 / aos / 1176347637. JSTOR  2242145.
  7. ^ Kolassa, John E. (2006). Metody aproximace řad ve statistice (3. vyd.). Springer. ISBN  0387322272.

Další čtení