Zobecněná distribuce chí-kvadrát - Generalized chi-squared distribution
Funkce hustoty pravděpodobnosti ![]() | |||
Funkce kumulativní distribuce ![]() | |||
Parametry | , vektor hmotností chí-kvadrát komponent , vektor stupňů volnosti chí-kvadrát komponent , vektor parametrů necentrality chí-kvadrát komponent , stupnice normálního členu | ||
---|---|---|---|
Podpěra, podpora | |||
Znamenat | |||
Rozptyl | |||
CF |
v teorie pravděpodobnosti a statistika, zobecněná distribuce chí-kvadrát (nebo zobecněná distribuce chí-kvadrát) je distribuce lineárního součtu nezávislých necentrální chí-kvadrát proměnné a a normální proměnná nebo ekvivalentně distribuce a kvadratická forma a multinormální proměnná (normální vektor). Existuje několik dalších takových zobecnění, pro které se někdy používá stejný termín; některé z nich jsou speciálními případy zde diskutované rodiny, například gama distribuce.
Definice
Zobecněnou proměnnou chí-kvadrát lze popsat několika způsoby. Jedním z nich je napsat to jako lineární součet nezávislých necentrálních chí-kvadrátových proměnných a normální proměnné:[1][2]
Zde jsou parametry váhy a a stupně svobody a non-centralities složených chí-čtverců. Některé důležité speciální případy mají všechny koeficienty stejného znaménka, vynechávají normální člen nebo mají centrální chí-kvadrát složky.
Dalším rovnocenným způsobem je formulovat jej jako kvadratickou formu normálního vektoru :[3]
- .
Tady je matice, je vektor a je skalární. Ty spolu s průměrem a kovarianční matice normálního vektoru , parametrizujte distribuci. Pokud (a pouze pokud) v této formulaci je pozitivní-definitivní, pak vše v první formulaci bude mít stejné znaménko.
V nejobecnějším případě lze redukci na běžný standardní formulář provést pomocí vyjádření následujícího formuláře:[4]
kde D je diagonální matice a kde X představuje vektor nekorelovaného standardní normální náhodné proměnné.
Výpočet čísel pdf / cdf / inverzní cdf / náhodných čísel
Funkce hustoty pravděpodobnosti, kumulativní distribuce a inverzní kumulativní distribuční funkce zobecněné proměnné chí-kvadrát proměnné nemají jednoduché výrazy uzavřeného tvaru. Numerické algoritmy [4][2][5] a počítačový kód (Fortran a C., Matlab, R ) byly publikovány za účelem vyhodnocení některých z nich a ke generování náhodných vzorků.
Aplikace
Zobecněný chí-kvadrát je distribuce statistické odhady v případech, kdy je obvyklé statistická teorie neplatí, jako v příkladech níže.
Při montáži a výběru modelu
Pokud prediktivní model je vybaven nejmenší čtverce, ale zbytky buď autokorelace nebo heteroscedasticita, pak lze srovnávat alternativní modely (v výběr modelu ) souvisejícími změnami v součet čtverců do asymptoticky platné zobecněná distribuce chí-kvadrát.[3]
Klasifikace normálních vektorů pomocí Gaussovské diskriminační analýzy
Li je normální vektor, jeho logaritmická pravděpodobnost je a kvadratická forma z , a je proto distribuován jako zobecněný chí-kvadrát. Poměr pravděpodobnosti log, že vyplývá z jednoho normálního rozdělení oproti druhému je také a kvadratická forma, tak distribuován jako zobecněný chí-kvadrát.
V Gaussově diskriminační analýze jsou vzorky z multinormálních distribucí optimálně odděleny pomocí a kvadratický klasifikátor, hranice, která je kvadratickou funkcí (např. křivka definovaná nastavením poměru pravděpodobnosti mezi dvěma Gaussiány na 1). Míry chyb klasifikace různých typů (falešně pozitivní a falešně negativní) jsou integrály normálního rozdělení v kvadratických oblastech definovaných tímto klasifikátorem. Jelikož je to matematicky ekvivalentní integraci kvadratické formy normálního vektoru, výsledkem je integrál zobecněné proměnné chí-kvadrát.
Při zpracování signálu
Následující aplikace vyvstává v kontextu Fourierova analýza v zpracování signálu, teorie obnovy v teorie pravděpodobnosti, a víceanténové systémy v bezdrátová komunikace. Společným faktorem těchto oblastí je, že je důležitý součet exponenciálně distribuovaných proměnných (nebo shodně součet čtvercových velikostí kruhově symetrický středový komplex Gaussian proměnné).
Li jsou k nezávislý, kruhově symetrický středový komplex Gaussian náhodné proměnné s znamenat 0 a rozptyl , pak náhodná proměnná
má zobecněnou distribuci chí-kvadrát určité formy. Rozdíl oproti standardní distribuci chí-kvadrát je v tom jsou složité a mohou mít různé odchylky a rozdíl od obecnější zobecněné distribuce chí-kvadrát spočívá v tom, že příslušná škálovací matice A je úhlopříčka. Li pro všechny i, pak , zmenšen o (tj. vynásobeno ), má distribuce chí-kvadrát, , také známý jako Erlang distribuce. Li mají odlišné hodnoty pro všechny i, pak má pdf[6]
Pokud existují sady opakovaných odchylek mezi , předpokládejme, že jsou rozděleny na M množiny, z nichž každá představuje určitou hodnotu odchylky. Označit je počet opakování v každé skupině. Toto je mTato sada obsahuje proměnné, které mají rozptyl Představuje libovolnou lineární kombinaci nezávislých -distribuované náhodné proměnné s různými stupni volnosti:
PDF z je[7]
kde
s ze sady všech oddílů (s ) definováno jako
Viz také
- Stupně volnosti (statistika) # Alternativní
- Noncentrální distribuce chí-kvadrát
- Distribuce chí-kvadrát
Reference
- ^ Davies, R.B. (1973) Numerická inverze charakteristické funkce. Biometrika, 60 (2), 415–417
- ^ A b Davies, R, B. (1980) "Algoritmus AS155: Distribuce lineární kombinace χ2 náhodné proměnné ", Aplikovaná statistika, 29, 323–333
- ^ A b Jones, D.A. (1983) „Statistická analýza empirických modelů vybavených optimalizací“, Biometrika, 70 (1), 67–88
- ^ A b Sheil, J., O'Muircheartaigh, I. (1977) „Algoritmus AS106: Distribuce nezáporných kvadratických forem v normálních proměnných“,Aplikovaná statistika, 26, 92–98
- ^ Imhof, J. P. (1961). "Výpočet rozdělení kvadratických forem v normálních proměnných" (PDF). Biometrika. 48 (3/4): 419–426. doi:10.2307/2332763. JSTOR 2332763.
- ^ D. Hammarwall, M. Bengtsson, B. Ottersten (2008) „Získání částečného CSI pro prostorově selektivní přenos pomocí okamžité zpětné vazby normy kanálu“, Transakce IEEE při zpracování signálu, 56, 1188–1204
- ^ E. Björnson, D. Hammarwall, B. Ottersten (2009) „Využití zpětné vazby kvantované normy kanálu prostřednictvím podmíněné statistiky v libovolně korelovaných systémech MIMO“, Transakce IEEE při zpracování signálu, 57, 4027–4041