Minimální odhad chí-kvadrát - Minimum chi-square estimation
Ve statistikách minimální odchylka musí být chí-kvadrát odhad je metoda odhad nepozorovaných množství na základě pozorovaných údajů.[1]
V určitých chí-kvadrát testech jeden odmítá a nulová hypotéza o distribuci populace, pokud je zadaná statistika testu příliš velká, když by tato statistika měla přibližně distribuci chí-kvadrát, pokud je nulová hypotéza pravdivá. Při odhadu minimálního chí-kvadrátu najdeme hodnoty parametrů, díky nimž je statistika testu co nejmenší.
Mezi důsledky jeho použití je, že statistika testu ve skutečnosti má přibližně a distribuce chí-kvadrát když velikost vzorku je velký. Obecně platí, že jeden snižuje o 1 počet stupně svobody pro každý parametr odhadovaný touto metodou.
Ilustrace na příkladu
Předpokládejme jisté náhodná proměnná bere hodnoty v sadě nezáporných celých čísel 1, 2, 3,. . . . A jednoduchý náhodný vzorek velikosti 20, čímž se získá následující soubor dat. Je žádoucí test the nulová hypotéza že populace, ze které byl tento vzorek odebrán, sleduje a Poissonovo rozdělení.
The odhad maximální věrohodnosti průměr populace je 3,3. Jeden by se mohl přihlásit Pearsonův test chí-kvadrát toho, zda je distribuce populace Poissonovo rozdělení s očekávaná hodnota 3.3. Nulová hypotéza však nespecifikovala, že se jednalo o konkrétní Poissonovo rozdělení, ale pouze o to, že jde o nějaké Poissonovo rozdělení, a číslo 3,3 pocházelo z dat, nikoli z nulové hypotézy. Pravidlo říká, že když se odhadne parametr, sníží se počet stupně svobody o 1, v tomto případě od 9 (protože existuje 10 buněk) do 8. Lze doufat, že výsledná statistika testu bude mít přibližně distribuci chí-kvadrát, když je nulová hypotéza pravdivá. To však není obecně případ, kdy je použit odhad maximální pravděpodobnosti. Je to však pravda asymptoticky, když se použije minimální odhad chí-kvadrátu.
Nalezení minimálního chí-kvadrátového odhadu
Minimální chí-kvadrát odhad počtu obyvatel znamená λ je číslo, které minimalizuje statistiku chí-kvadrát
kde A je odhadovaný očekávaný počet v buňce „> 8“ a zobrazí se „20“, protože se jedná o velikost vzorku. Hodnota A je 20krát větší pravděpodobnost, že Poissonově distribuovaná náhodná proměnná přesáhne 8, a lze ji snadno vypočítat jako 1 minus součet pravděpodobností odpovídajících 0 až 8. Triviální algebrou se poslední člen jednoduše redukuje naA. Numerický výpočet ukazuje, že hodnota λ který minimalizuje statistiku chí-kvadrát je asi 3,5242. To je minimální odhad chí-kvadrátu λ. Pro tuto hodnotu λ, statistika chí-kvadrát je asi 3,062764. K dispozici je 10 buněk. Pokud by nulová hypotéza specifikovala jediné rozdělení, spíše než vyžadovat λ odhadnout, pak nulové rozdělení testovací statistiky bude distribucí chí-kvadrát s 10 - 1 = 9 stupňů volnosti. Od té doby λ muselo být odhadnuto, je ztracen další stupeň volnosti. Očekávaná hodnota chí-kvadrát náhodné proměnné s 8 stupni volnosti je 8. Pozorovaná hodnota, 3,062764, je tedy poměrně skromná a nulová hypotéza není odmítnuta.
Poznámky a odkazy
- ^ Berkson, Joseph (1980). „Minimální chí-kvadrát, ne maximální věrohodnost!“. Annals of Statistics. 8 (3): 457–487. doi:10.1214 / aos / 1176345003. JSTOR 2240587.