Wald-Wolfowitzův test - Wald–Wolfowitz runs test

The Wald-Wolfowitzův test (nebo jednoduše běží test), pojmenovaný podle statistiků Abraham Wald a Jacob Wolfowitz je neparametrické statistický test, který kontroluje hypotézu náhodnosti pro dvě hodnoty sekvence dat. Přesněji lze na to zvyknout otestujte hypotézu že prvky sekvence jsou vzájemně nezávislý.

Definice

A běh sekvence je maximální neprázdný segment sekvence skládající se ze sousedních stejných prvků. Například sekvence dlouhá 22 prvků

+ + + + − − − + + + − − + + + + + + − − − −

sestává ze 6 běhů, z nichž 3 se skládají z „+“ a ostatní z „-“. Test běhu je založen na nulová hypotéza že každý prvek v sekvenci je nezávisle čerpán ze stejné distribuce.

Podle nulové hypotézy počet běhů v sekvenci N elementy[poznámka 1] je náhodná proměnná jehož podmíněné rozdělení vzhledem k pozorování N+ kladné hodnoty[poznámka 2] a N záporné hodnoty (N = N+ + N) je přibližně normální, s:[1][2]

  • znamenat
  • rozptyl

Tyto parametry nepředpokládají, že pozitivní a negativní prvky mají stejnou pravděpodobnost výskytu, ale pouze předpokládají, že prvky jsou nezávislé a identicky distribuované. Pokud je počet běhů výrazně vyšší nebo nižší, než se očekávalo, lze hypotézu statistické nezávislosti prvků odmítnout.

Aplikace

Testy běhů lze použít k testování:

  1. náhodnost rozdělení tím, že se vezmou data v daném pořadí a označí se + data většími než medián, as - data menší než medián (čísla rovnající se mediánu jsou vynechána.)
  2. zda funkce dobře zapadá do a soubor dat, označením dat přesahujících hodnotu funkce pomocí + a ostatní data pomocí -. Pro toto použití je test běhů, který bere v úvahu značky, ale nikoli vzdálenosti, doplňkem k test chi square, který bere v úvahu vzdálenosti, ale ne značky.

Související testy

The Kolmogorov – Smirnovův test Ukázalo se, že je silnější než Wald-Wolfowitzův test pro detekci rozdílů mezi distribucemi, které se liší pouze jejich umístěním. Opak je však pravdou, pokud se distribuce liší v rozptylu a mají nanejvýš jen malý rozdíl v umístění.[Citace je zapotřebí ]

Test běhu Wald-Wolfowitze byl rozšířen pro použití s ​​několika Vzorky.[3][4][5][6]

Poznámky

  1. ^ N je počet prvků, nikoli počet běhů.
  2. ^ N+ je počet prvků s kladnými hodnotami, nikoli počet kladných běhů

Reference

  1. ^ "Spustí test pro detekci nenáhodnosti".
  2. ^ Ukázka 33092: Wald-Wolfowitzův (nebo běhový) test náhodnosti
  3. ^ Magel, RC; Wibowo, SH (1997). „Srovnání pravomocí zkoušek Wald-Wolfowitz a Kolmogorov-Smirnov“. Biometrický deník. 39 (6): 665–675. doi:10.1002 / bimj.4710390605.
  4. ^ Barton, DE; David, FN (1957). "Více běhů". Biometrika. 44 (1–2): 168–178. doi:10.1093 / biomet / 44.1-2.168.
  5. ^ Sprent P, Smeeton NC (2007) Applied Nonparametric Statistical Methods, str. 217-219. Boca Raton: Chapman & Hall / CRC.
  6. ^ Alhakim, A; Hooper, W (2008). "Neparametrický test pro několik nezávislých vzorků". Journal of Nonparametric Statistics. 20 (3): 253–261. CiteSeerX  10.1.1.568.6110. doi:10.1080/10485250801976741.

externí odkazy