Kritérium Cramér – von Mises - Cramér–von Mises criterion
v statistika the Kritérium Cramér – von Mises je kritériem používaným pro posouzení dobrota fit a kumulativní distribuční funkce ve srovnání s daným empirická distribuční funkce , nebo pro porovnání dvou empirických distribucí. Používá se také jako součást jiných algoritmů, jako je minimální odhad vzdálenosti. Je definován jako
V aplikacích s jedním vzorkem je teoretické rozdělení a je empiricky pozorovaná distribuce. Alternativně mohou být obě distribuce empiricky odhadované; tomu se říká případ se dvěma vzorky.
Kritérium je pojmenováno po Harald Cramér a Richard Edler von Mises kdo to poprvé navrhl v letech 1928–1930.[1][2] Zobecnění na dva vzorky je způsobeno Anderson.[3]
Test Cramér – von Mises je alternativou k Kolmogorov – Smirnovův test (1933).[4]
Cramér – von Misesův test (jeden vzorek)
Nechat být sledovanými hodnotami v rostoucím pořadí. Pak je statistika[3]:1153[5]
Pokud je tato hodnota větší než tabulková hodnota, pak hypotéza, že data pocházejí z distribuce lze odmítnout.
Watsonův test
Upravenou verzí testu Cramér – von Mises je Watsonův test[6] který používá statistiku U2, kde[5]
kde
Cramér – von Misesův test (dva vzorky)
Nechat a být pozorované hodnoty v prvním a druhém vzorku v pořadí, ve vzrůstajícím pořadí Nechat být řadami x v kombinovaném vzorku a nechat být řadami y v kombinovaném vzorku. Anderson[3]:1149 ukázat to
kde U je definována jako
Pokud je hodnota T větší než hodnoty v tabulce,[3]:1154–1159 hypotézu, že oba vzorky pocházejí ze stejné distribuce, lze odmítnout. (Nějaké knihy[upřesnit ] dát kritické hodnoty pro U, což je pohodlnější, protože se tak vyhnete nutnosti počítat T pomocí výše uvedeného výrazu. Závěr bude stejný).
Výše uvedené předpokládá, že v souboru nejsou žádné duplikáty , , a sekvence. Tak je jedinečný a jeho hodnost je v seřazeném seznamu . Pokud existují duplikáty, a přes jsou soubor identických hodnot v seřazeném seznamu, pak je jedním společným přístupem midrank[7] metoda: každému duplikátu přiřadit "hodnost" . Ve výše uvedených rovnicích, ve výrazech a , duplikáty mohou upravit všechny čtyři proměnné , , , a .
Reference
- ^ Cramér, H. (1928). "O složení elementárních chyb". Skandinávský pojistněmatematický deník. 1928 (1): 13–74. doi:10.1080/03461238.1928.10416862.
- ^ von Mises, R. E. (1928). Wahrscheinlichkeit, Statistik und Wahrheit. Julius Springer.
- ^ A b C d Anderson, T. W. (1962). „O distribuci kritéria dvou vzorků Cramer – von Mises“ (PDF). Annals of Mathematical Statistics. Ústav matematické statistiky. 33 (3): 1148–1159. doi:10.1214 / aoms / 1177704477. ISSN 0003-4851. Citováno 12. června 2009.
- ^ A.N. Kolmogorov, „Sulla determinizione empirica di una legge di distribuzione“ Giorn. Ist. Ital. Attuari, 4 (1933), str. 83–91
- ^ A b Pearson, E.S. Hartley, H.O. (1972) Tabulky Biometrika pro statistiky, svazek 2CUP. ISBN 0-521-06937-8 (strana 118 a tabulka 54)
- ^ Watson, G.S. (1961) „Goodness-Of-Fit Tests on a Circle“, Biometrika, 48 (1/2), 109-114 JSTOR 2333135
- ^ Ruymgaart, F. H., (1980) „Unified approach to the asymptotic distribution theory of certain midrank statistics“. V: Statistique non Parametrique Asymptotique, 1 ± 18, J. P. Raoult (ed.), Lecture Notes on Mathematics, No. 821, Springer, Berlin.
- M. A. Stephens (1986). "Testy založené na statistice EDF". V D'Agostino, R.B .; Stephens, M.A. (eds.). Techniky dobré shody. New York: Marcel Dekker. ISBN 0-8247-7487-6.
Další čtení
- Xiao, Y .; A. Gordon; A. Jakovlev (leden 2007). „Program C ++ pro dvou ukázkový test Cramér – von Mises“ (PDF). Žurnál statistického softwaru. Americká statistická asociace. 17 (8). ISSN 1548-7660. OCLC 42456366. Citováno 12. června 2009.