Kritérium Cramér – von Mises - Cramér–von Mises criterion

v statistika the Kritérium Cramér – von Mises je kritériem používaným pro posouzení dobrota fit a kumulativní distribuční funkce ve srovnání s daným empirická distribuční funkce , nebo pro porovnání dvou empirických distribucí. Používá se také jako součást jiných algoritmů, jako je minimální odhad vzdálenosti. Je definován jako

V aplikacích s jedním vzorkem je teoretické rozdělení a je empiricky pozorovaná distribuce. Alternativně mohou být obě distribuce empiricky odhadované; tomu se říká případ se dvěma vzorky.

Kritérium je pojmenováno po Harald Cramér a Richard Edler von Mises kdo to poprvé navrhl v letech 1928–1930.[1][2] Zobecnění na dva vzorky je způsobeno Anderson.[3]

Test Cramér – von Mises je alternativou k Kolmogorov – Smirnovův test (1933).[4]

Cramér – von Misesův test (jeden vzorek)

Nechat být sledovanými hodnotami v rostoucím pořadí. Pak je statistika[3]:1153[5]

Pokud je tato hodnota větší než tabulková hodnota, pak hypotéza, že data pocházejí z distribuce lze odmítnout.

Watsonův test

Upravenou verzí testu Cramér – von Mises je Watsonův test[6] který používá statistiku U2, kde[5]

kde

Cramér – von Misesův test (dva vzorky)

Nechat a být pozorované hodnoty v prvním a druhém vzorku v pořadí, ve vzrůstajícím pořadí Nechat být řadami x v kombinovaném vzorku a nechat být řadami y v kombinovaném vzorku. Anderson[3]:1149 ukázat to

kde U je definována jako

Pokud je hodnota T větší než hodnoty v tabulce,[3]:1154–1159 hypotézu, že oba vzorky pocházejí ze stejné distribuce, lze odmítnout. (Nějaké knihy[upřesnit ] dát kritické hodnoty pro U, což je pohodlnější, protože se tak vyhnete nutnosti počítat T pomocí výše uvedeného výrazu. Závěr bude stejný).

Výše uvedené předpokládá, že v souboru nejsou žádné duplikáty , , a sekvence. Tak je jedinečný a jeho hodnost je v seřazeném seznamu . Pokud existují duplikáty, a přes jsou soubor identických hodnot v seřazeném seznamu, pak je jedním společným přístupem midrank[7] metoda: každému duplikátu přiřadit "hodnost" . Ve výše uvedených rovnicích, ve výrazech a , duplikáty mohou upravit všechny čtyři proměnné , , , a .

Reference

  1. ^ Cramér, H. (1928). "O složení elementárních chyb". Skandinávský pojistněmatematický deník. 1928 (1): 13–74. doi:10.1080/03461238.1928.10416862.
  2. ^ von Mises, R. E. (1928). Wahrscheinlichkeit, Statistik und Wahrheit. Julius Springer.
  3. ^ A b C d Anderson, T. W. (1962). „O distribuci kritéria dvou vzorků Cramer – von Mises“ (PDF). Annals of Mathematical Statistics. Ústav matematické statistiky. 33 (3): 1148–1159. doi:10.1214 / aoms / 1177704477. ISSN  0003-4851. Citováno 12. června 2009.
  4. ^ A.N. Kolmogorov, „Sulla determinizione empirica di una legge di distribuzione“ Giorn. Ist. Ital. Attuari, 4 (1933), str. 83–91
  5. ^ A b Pearson, E.S. Hartley, H.O. (1972) Tabulky Biometrika pro statistiky, svazek 2CUP. ISBN  0-521-06937-8 (strana 118 a tabulka 54)
  6. ^ Watson, G.S. (1961) „Goodness-Of-Fit Tests on a Circle“, Biometrika, 48 (1/2), 109-114 JSTOR  2333135
  7. ^ Ruymgaart, F. H., (1980) „Unified approach to the asymptotic distribution theory of certain midrank statistics“. V: Statistique non Parametrique Asymptotique, 1 ± 18, J. P. Raoult (ed.), Lecture Notes on Mathematics, No. 821, Springer, Berlin.
  • M. A. Stephens (1986). "Testy založené na statistice EDF". V D'Agostino, R.B .; Stephens, M.A. (eds.). Techniky dobré shody. New York: Marcel Dekker. ISBN  0-8247-7487-6.

Další čtení