F-test rovnosti odchylek - F-test of equality of variances

Ve statistikách an F-test rovnosti odchylek je test pro nulová hypotéza ty dva normální populace mají stejné rozptyl. Pojmově jakýkoli F-test lze považovat za srovnání dvou odchylek, ale konkrétním případem diskutovaným v tomto článku je případ dvou populací, kde statistika testu používá se poměr dvou odchylky vzorku.[1] Tato konkrétní situace je důležitá v roce 2006 matematická statistika protože poskytuje základní příklad, ve kterém F-distribuce lze odvodit.[2] Pro použití v použité statistiky, existují obavy[Citace je zapotřebí ] že test je natolik citlivý na předpoklad normality, že by bylo nevhodné jej používat jako rutinní test rovnosti odchylek. Jinými slovy, jedná se o případ, kdy „přibližná normalita“ (což by se v podobných kontextech často ospravedlňovalo pomocí teorém centrálního limitu ), není dost dobrý na to, aby byl zkušební postup přibližně platný v přijatelné míře.

Zkouška

Nechat X1, ..., Xn a Y1, ..., Ym být nezávislé a identicky distribuované vzorky ze dvou populací, z nichž každá má a normální distribuce. The očekávané hodnoty pro dvě populace se mohou lišit a hypotéza, která má být testována, je, že rozptyly jsou stejné. Nechat

být vzorek znamená. Nechat

být odchylky vzorku. Pak statistika testu

F-distribuce s n - 1 a m - 1 stupeň volnosti, pokud nulová hypotéza rovnosti odchylek je pravda. V opačném případě sleduje distribuci F škálovanou poměrem skutečných odchylek. Nulová hypotéza je odmítnuta, pokud F je buď příliš velký, nebo příliš malý na základě požadované úrovně alfa (tj. statistická významnost ).

Vlastnosti

Je známo, že tento F-test je extrémně citlivý nenormálnost,[3][4] tak Levenův test, Bartlettův test, nebo Brown-Forsythe test jsou lepší testy pro testování rovnosti dvou odchylek. (Všechny tyto testy však vytvářejí experimenty chyba typu I. inflace, jsou-li prováděny jako test předpokladu homoscedasticity před zkouškou účinků.[5]) F-testy pro rovnost odchylek lze v praxi použít opatrně, zejména tam, kde je vyžadována rychlá kontrola, a podléhají související diagnostické kontrole: praktické učebnice[6] navrhnout grafické i formální kontroly předpokladu.

F-testy se používají pro další statistické účely testy hypotéz, například testování rozdílů ve prostředcích ve třech nebo více skupinách nebo ve faktoriálním rozvržení. Tyto F-testy obecně nejsou robustní pokud dojde k porušení předpokladu, že každá populace dodržuje normální distribuce, zejména pro malé úrovně alfa a nevyvážené rozvržení.[7] Pro velké hladiny alfa (např. Alespoň 0,05) a vyvážené rozložení je však F-test relativně robustní, i když (pokud neplatí předpoklad normality) trpí ztrátou srovnávací statistické síly ve srovnání s neparametrickými protějšky.

Zobecnění

Okamžité zobecnění výše popsaného problému se týká situací, kdy existují více než dvě skupiny nebo populace, a hypotéza je, že všechny varianty jsou stejné. To je problém, který řeší Hartleyho test a Bartlettův test.

Viz také

Reference

  1. ^ Snedecor, George W. a Cochran, William G. (1989), Statistické metody, osmé vydání, Iowa State University Press.
  2. ^ Johnson, N.L., Kotz, S., Balakrishnan, N. (1995) Continuous Univariate Distribuce, díl 2Wiley. ISBN  0-471-58494-0 (Část 27.1)
  3. ^ Box, G.E.P. (1953). „Nenormalita a testy na odchylky“. Biometrika. 40 (3/4): 318–335. doi:10.1093 / biomet / 40,3-4,318. JSTOR  2333350.
  4. ^ Markowski, Carol A; Markowski, Edward P. (1990). "Podmínky pro účinnost předběžného testu odchylky". Americký statistik. 44 (4): 322–326. doi:10.2307/2684360. JSTOR  2684360.
  5. ^ Sawilowsky, S. (2002). „Fermat, Schubert, Einstein a Behrens – Fisher: Pravděpodobný rozdíl mezi dvěma prostředky, když σ12 ≠ σ22", Journal of Modern Applied Statistical Methods, 1(2), 461–472.
  6. ^ Rees, D.G. (2001) Základní statistiky (4. vydání), Chapman & Hall / CRC, ISBN  1-58488-007-4. Oddíl 10.15
  7. ^ Blair, R. C. (1981). „Reakce na„ Důsledky nesplnění předpokladů, z nichž vychází analýza fixních účinků rozptylu a kovariance'". Recenze pedagogického výzkumu. 51: 499–507. doi:10.3102/00346543051004499.