Test normality - Normality test
v statistika, testy normality se používají k určení, zda a soubor dat je dobře modelován a normální distribuce a vypočítat, jak je pravděpodobné pro a náhodná proměnná soubor dat, který má být normálně distribuován.
Přesněji řečeno, testy jsou formou výběr modelu, a může být interpretován několika způsoby, v závislosti na něčí interpretace pravděpodobnosti:
- v deskriptivní statistika podmínky, jeden měří a dobrota fit normálního modelu k datům - pokud je fit špatný, pak data nejsou v tomto ohledu dobře modelována normálním rozdělením, aniž by bylo třeba posoudit jakoukoli podkladovou proměnnou.
- v časté statistiky statistické testování hypotéz, data jsou testována proti nulová hypotéza že je normálně distribuován.
- v Bayesovské statistiky, jeden „netestuje normálnost“ sám o sobě, ale spíše počítá pravděpodobnost, že data pocházejí z normálního rozdělení s danými parametry μ,σ (pro všechny μ,σ) a srovnává to s pravděpodobností, že data pocházejí z jiných uvažovaných distribucí, nejjednodušší pomocí a Bayesův faktor (což dává relativní pravděpodobnost vidění dat s ohledem na různé modely), nebo jemněji převzetí a předchozí distribuce o možných modelech a parametrech a výpočtech a zadní distribuce vzhledem k vypočítaným pravděpodobnostem.
Test normality se používá k určení, zda byla data vzorku čerpána z normálně distribuované populace (v rámci určité tolerance). Řada statistických testů, jako je Studentův t-test a jednosměrná a obousměrná ANOVA, vyžaduje normálně distribuovanou populaci vzorků
Grafické metody
Neformálním přístupem k testování normality je srovnání a histogram vzorku dat na normální křivku pravděpodobnosti. Empirické rozložení dat (histogram) by mělo mít tvar zvonu a mělo by se podobat normálnímu rozložení. Může být obtížné zjistit, zda je vzorek malý. V tomto případě je možné postupovat regresí dat proti kvantily normálního rozdělení se stejným průměrem a rozptylem jako vzorek. Nedostatek přizpůsobení regresní přímce naznačuje odklon od normality (viz koeficient Andersona Darlinga a minitab).
Grafickým nástrojem pro hodnocení normality je normální pravděpodobnostní graf, a kvantil-kvantilní graf (QQ graf) standardizovaných dat proti standardní normální rozdělení. Tady korelace mezi vzorkovanými daty a normálními kvantily (míra dobré shody) měří, jak dobře jsou data modelována normálním rozdělením. U normálních dat by body vynesené v grafu QQ měly padat přibližně na přímku, což naznačuje vysokou pozitivní korelaci. Tyto grafy lze snadno interpretovat a jejich výhodou je také snadná identifikace odlehlých hodnot.
Zkouška zadní části obálky
Jednoduchý zadní část obálky test trvá vzorek maximální a minimální a spočítá jejich z-skóre nebo přesněji t-statistika (počet směrodatných odchylek vzorku, že vzorek je nad nebo pod průměrem vzorku) a porovnává jej s Pravidlo 68–95–99,7: pokud má jeden 3σ událost (správně, 3s událost) a podstatně méně než 300 vzorků, nebo 4s událost a podstatně méně než 15 000 vzorků, pak normální rozdělení podhodnocuje maximální velikost odchylek v údajích o vzorku.
Tento test je užitečný v případech, kdy člověk čelí riziko kurtózy - tam, kde záleží na velkých odchylkách - a má výhody, které je velmi snadné spočítat a komunikovat: statistici to snadno pochopí „6σ události jsou v běžných distribucích velmi vzácné “.
Časté testy
Testy jednorozměrné normality zahrnují následující:
- D'Agostinův K-kvadrát test,
- Jarque – Bera test,
- Anderson – Darlingův test,
- Kritérium Cramér – von Mises,
- Kolmogorov – Smirnovův test (tento funguje pouze tehdy, pokud se předpokládá průměr a rozptyl normálu známé pod nulovou hypotézou),
- Lillieforsův test (na základě testu Kolmogorov – Smirnov, upraveného o odhadovaný průměr a rozptyl z údajů),
- Shapiro – Wilkův test, a
- Pearsonův test chí-kvadrát.
Studie z roku 2011 dospěla k závěru, že Shapiro – Wilk má to nejlepší Napájení pro daný význam, těsně následovaný Andersonem – Darlingem při porovnání testů Shapiro – Wilk, Kolmogorov – Smirnov, Lilliefors a Anderson – Darling.[1]
Některé publikované práce doporučují Jarque-Bera test,[2][3] ale test má slabost. Zkouška má zejména nízký výkon pro distribuce s krátkými ocasy, zejména pro bimodální distribuce.[4] Někteří autoři odmítli zahrnout jeho výsledky do svých studií kvůli jeho špatnému celkovému výkonu.[5]
Historicky třetí a čtvrtý standardizované momenty (šikmost a špičatost ) byly některé z prvních testů normality. The Lin-Mudholkarův test konkrétně se zaměřuje na asymetrické alternativy.[6] The Jarque – Bera test je sám o sobě odvozen od šikmost a špičatost odhady. Mardia je vícerozměrné zkoušky šikmosti a špičatosti zobecnit momentové testy na vícerozměrný případ.[7] Jiné brzy statistika testů zahrnout poměr znamená absolutní odchylku na směrodatnou odchylku a rozsah na směrodatnou odchylku.[8]
Mezi novější testy normality patří energetický test[9] (Székely a Rizzo) a testy založené na empirická charakteristická funkce (ECF) (např. Epps a kladka,[10] Henze – Zirkler,[11] BHEP test[12]). Energetické a ECF testy jsou výkonné testy, které platí pro testování jednorozměrných nebo vícerozměrná normalita a jsou statisticky konzistentní s obecnými alternativami.
Normální rozdělení má nejvyšší entropie jakéhokoli rozdělení pro danou směrodatnou odchylku. Na základě této vlastnosti existuje celá řada testů normality, z nichž první lze připsat Vašicovi.[13]
Bayesovské testy
Kullback – Leiblerovy divergence mezi celou zadní distribucí sklonu a rozptylem nenaznačují nenormálnost. Poměr očekávání těchto posteriorů a očekávání poměrů však poskytuje podobné výsledky jako statistika Shapiro – Wilk, s výjimkou velmi malých vzorků, kdy se používají neinformativní priority.[14]
Spiegelhalter navrhuje použít a Bayesův faktor porovnat normálnost s jinou třídou distribučních alternativ.[15] Tento přístup rozšířili Farrell a Rogers-Stewart.[16]
Aplikace
Jednou z aplikací testů normality je zbytky od a lineární regrese Modelka.[17] Pokud nejsou normálně distribuovány, zbytky by neměly být použity při Z testech ani při jiných testech odvozených od normálního rozdělení, jako např. t testy, F testy a chí-kvadrát testy. Pokud zbytky nejsou normálně distribuovány, pak závislá proměnná nebo alespoň jedna vysvětlující proměnná může mít nesprávnou funkční formu nebo mohou chybět důležité proměnné atd. Oprava jedné nebo více těchto systematických chyb může způsobit zbytky, které jsou normálně distribuovány.[Citace je zapotřebí ]
Viz také
Poznámky
- ^ Razali, Nornadiah; Wah, Yap Bee (2011). „Silová srovnání testů Shapiro – Wilk, Kolmogorov – Smirnov, Lilliefors a Anderson – Darling” (PDF). Časopis statistického modelování a analýzy. 2 (1): 21–33. Archivovány od originál (PDF) dne 2015-06-30.
- ^ Soudce, George G .; Griffiths, W. E .; Hill, R. Carter; Lütkepohl, Helmut; Lee, T. (1988). Úvod do teorie a praxe ekonometrie (Druhé vydání.). Wiley. 890–892. ISBN 978-0-471-08277-4.
- ^ Gujarati, Damodar N. (2002). Základní ekonometrie (Čtvrté vydání). McGraw Hill. 147–148. ISBN 978-0-07-123017-9.
- ^ Thadewald, Thorsten; Büning, Herbert (1. ledna 2007). „Test Jarque – Bera a jeho konkurenti pro testování normality - srovnání výkonu“. Journal of Applied Statistics. 34 (1): 87–105. CiteSeerX 10.1.1.507.1186. doi:10.1080/02664760600994539.
- ^ Sürücü, Barış (1. září 2008). "Srovnání výkonu a simulační studie testů shody". Počítače a matematika s aplikacemi. 56 (6): 1617–1625. doi:10.1016 / j.camwa.2008.03.010.
- ^ Lin, C. C .; Mudholkar, G. S. (1980). „Jednoduchý test normality proti asymetrickým alternativám“. Biometrika. 67 (2): 455–461. doi:10.1093 / biomet / 67.2.455. Citováno 15. listopadu 2015.
- ^ Mardia, K. V. (1970). Míry vícerozměrné šikmosti a špičatosti s aplikacemi. Biometrika 57, 519–530.
- ^ Filliben, J. J. (únor 1975). "Test korelačního koeficientu pravděpodobnosti spiknutí pro normálnost". Technometrics. 17 (1): 111–117. doi:10.2307/1268008. JSTOR 1268008.
- ^ Székely, G. J. a Rizzo, M. L. (2005) Nový test multivariační normality, Journal of Multivariate Analysis 93, 58–80.
- ^ Epps, T. W. a Pulley, L. B. (1983). Test normality založený na empirické charakteristické funkci. Biometrika 70, 723–726.
- ^ Henze, N. a Zirkler, B. (1990). Třída invariantních a konzistentních testů pro vícerozměrné normality. Komunikace ve statistice - teorie a metody 19, 3595–3617.
- ^ Henze, N. a Wagner, T. (1997). Nový přístup k testům BHEP na vícerozměrné normality. Journal of Multivariate Analysis 62, 1–23.
- ^ Vasicek, Oldrich (1976). "Test normality založený na vzorové entropii". Journal of the Royal Statistical Society. Řada B (metodická). 38 (1): 54–59. JSTOR 2984828.
- ^ Young K. D. S. (1993), „Bayesovská diagnostika pro kontrolu předpokladů normality“. Journal of Statistical Computation and Simulation, 47 (3–4),167–180
- ^ Spiegelhalter, D.J. (1980). Souhrnný test normality pro malé vzorky. Biometrika, 67, 493–496. doi:10.1093 / biomet / 67.2.493
- ^ Farrell, P.J., Rogers-Stewart, K. (2006) „Komplexní studie testů normality a symetrie: rozšíření Spiegelhalterova testu“. Journal of Statistical Computation and Simulation, 76(9), 803 – 816. doi:10.1080/10629360500109023
- ^ Portney, L.G. & Watkins, M.P. (2000). Základy klinického výzkumu: aplikace v praxi. New Jersey: Zdraví Prentice Hall. str. 516–517. ISBN 0838526950.CS1 maint: více jmen: seznam autorů (odkaz)
Další čtení
- Ralph B. D'Agostino (1986). "Testy pro normální rozdělení". V D'Agostino, R.B .; Stephens, M.A. (eds.). Techniky dobré shody. New York: Marcel Dekker. ISBN 978-0-8247-7487-5.
- Henry C. Thode, Jr. (2002). Testování normality. New York: Marcel Dekker, Inc. str.479. ISBN 978-0-8247-9613-6.