DAgostinos K-kvadrát test - DAgostinos K-squared test - Wikipedia
v statistika, D'Agostino K.2 test, pojmenovaný pro Ralph D'Agostino, je dobrota míra odletu z normálnost, to je cílem testu zjistit, zda daný vzorek pochází z normálně distribuované populace. Test je založen na transformacích vzorku špičatost a šikmost, a má sílu pouze proti alternativám, že distribuce je vychýlená a / nebo kurtická.
Šikovnost a špičatost
V následujícím, {Xi } označuje vzorek n pozorování, G1 a G2 jsou vzorky šikmost a špičatost, mjJsou j-tý vzorek ústřední momenty, a je vzorek znamenat. Často v literatuře související s testování normality, šikmost a špičatost jsou označeny jako √β1 a β2 resp. Takový zápis může být nepohodlný, protože například √β1 může být záporné množství.
Ukázková šikmost a špičatost jsou definovány jako
Tato množství důsledně odhadnout teoretickou šikmost distribuce, respektive špičatost distribuce. Kromě toho, pokud vzorek skutečně pochází z normální populace, lze přesně analyzovat konečné konečné rozdělení vzorků šikmosti a špičatosti z hlediska jejich průměrů μ1odchylky μ2, špejle y1a kurtosy y2. To bylo provedeno uživatelem Pearson (1931), kteří odvodili následující výrazy:[je zapotřebí lepší zdroj ]
a
Například vzorek s velikostí n = 1000 lze očekávat, že čerpané z normálně distribuované populace bude šikmé 0, SD 0,08 a špičatost 0, SD 0,15, kde SD označuje směrodatnou odchylku.[Citace je zapotřebí ]
Transformovaná vzorová šikmost a špičatost
Ukázková šikmost G1 a špičatost G2 jsou oba asymptoticky normální. Míra jejich konvergence k distribučnímu limitu je však frustrovaně nízká, zejména pro G2. Například dokonce s n = 5000 pozorování ukázkové špičatosti G2 má jak šikmost, tak špičatost přibližně 0,3, což není zanedbatelné. Aby se tato situace napravila, bylo navrženo převést množství G1 a G2 takovým způsobem, aby se jejich distribuce co nejvíce přiblížila standardnímu normálu.
Zejména, D’Agostino (1970) navrhl následující transformaci pro vzorek šikmost:
kde konstanty α a δ jsou počítány jako
a kde μ2 = μ2(G1) je rozptyl G1, a y2 = y2(G1) je špičatost - výrazy uvedené v předchozí části.
Podobně, Anscombe & Glynn (1983) navrhl transformaci pro G2, který funguje přiměřeně dobře pro velikosti vzorku 20 nebo větší:
kde
a μ1 = μ1(G2), μ2 = μ2(G2), y1 = y1(G2) jsou množství vypočítaná Pearsonem.
Omnibus K.2 statistický
Statistika Z1 a Z2 lze kombinovat a vytvořit souhrnný test, který dokáže detekovat odchylky od normality buď kvůli šikmě nebo špičatosti (D’Agostino, Belanger & D’Agostino 1990 ) :
Pokud nulová hypotéza normality je tedy pravda K.2 je přibližně χ2-distribuováno se 2 stupni volnosti.
Všimněte si, že statistiky G1, G2 nejsou nezávislí, pouze nesouvisí. Proto jejich transformace Z1, Z2 bude závislý také (Shenton & Bowman 1977 ), což činí platnost χ2 aproximace sporná. Simulace ukazují, že při nulové hypotéze K.2 statistiku testu charakterizuje
očekávaná hodnota | standardní odchylka | 95% kvantil | |
---|---|---|---|
n = 20 | 1.971 | 2.339 | 6.373 |
n = 50 | 2.017 | 2.308 | 6.339 |
n = 100 | 2.026 | 2.267 | 6.271 |
n = 250 | 2.012 | 2.174 | 6.129 |
n = 500 | 2.009 | 2.113 | 6.063 |
n = 1000 | 2.000 | 2.062 | 6.038 |
χ2(2) distribuce | 2.000 | 2.000 | 5.991 |
Viz také
Reference
- Anscombe, F.J .; Glynn, William J. (1983). "Rozdělení statistiky o špičatosti b2 pro normální statistiku ". Biometrika. 70 (1): 227–234. doi:10.1093 / biomet / 70.1.227. JSTOR 2335960.
- D’Agostino, Ralph B. (1970). "Transformace na normálnost nulového rozdělení G1". Biometrika. 57 (3): 679–681. doi:10.1093 / biomet / 57.3.679. JSTOR 2334794.
- D’Agostino, Ralph B .; Albert Belanger; Ralph B. D’Agostino, Jr (1990). „Návrh na použití výkonných a informativních testů normality“ (PDF). Americký statistik. 44 (4): 316–321. doi:10.2307/2684359. JSTOR 2684359. Archivovány od originál (PDF) dne 2012-03-25.
- Pearson, Egon S. (1931). "Poznámka k testům normality". Biometrika. 22 (3/4): 423–424. doi:10.1093 / biomet / 22.3-4.423. JSTOR 2332104.
- Shenton, L.R .; Bowman, K.O. (1977). "Bivariační model pro distribuci √b1 a b2". Journal of the American Statistical Association. 72 (357): 206–211. doi:10.1080/01621459.1977.10479940. JSTOR 2286939.