Kritérium Cramér – von Mises - Cramér–von Mises criterion

v statistika the Kritérium Cramér – von Mises je kritériem používaným pro posouzení dobrota fit a kumulativní distribuční funkce ${displaystyle F ^ {*}}$ ve srovnání s daným empirická distribuční funkce ${displaystyle F_ {n}}$ , nebo pro porovnání dvou empirických distribucí. Používá se také jako součást jiných algoritmů, jako je minimální odhad vzdálenosti. Je definován jako

{displaystyle omega ^ {2} = int _ {- infty} ^ {infty} [F_ {n} (x) -F ^ {*} (x)] ^ {2}, mathrm {d} F ^ {*} (X)}

V aplikacích s jedním vzorkem ${displaystyle F ^ {*}}$ je teoretické rozdělení a ${displaystyle F_ {n}}$ je empiricky pozorovaná distribuce. Alternativně mohou být obě distribuce empiricky odhadované; tomu se říká případ se dvěma vzorky.

Kritérium je pojmenováno po Harald Cramér a Richard Edler von Mises kdo to poprvé navrhl v letech 1928–1930.^[1]^[2] Zobecnění na dva vzorky je způsobeno Anderson.^[3]

Test Cramér – von Mises je alternativou k Kolmogorov – Smirnovův test (1933).^[4]

Cramér – von Misesův test (jeden vzorek)

Nechat ${displaystyle x_ {1}, x_ {2}, cdots, x_ {n}}$ být sledovanými hodnotami v rostoucím pořadí. Pak je statistika^[3]^:1153^[5]

{displaystyle T = nomega ^ {2} = {frac {1} {12n}} + součet _ {i = 1} ^ {n} vlevo [{frac {2i-1} {2n}} - F (x_ {i }) ight] ^ {2}.}

Pokud je tato hodnota větší než tabulková hodnota, pak hypotéza, že data pocházejí z distribuce ${displaystyle F}$ lze odmítnout.

Watsonův test

Upravenou verzí testu Cramér – von Mises je Watsonův test^[6] který používá statistiku U², kde^[5]

{displaystyle U ^ {2} = T-n ({ar {F}} - {frac {1} {2}}) ^ {2},}

kde

{displaystyle {ar {F}} = {frac {1} {n}} součet _ {i = 1} ^ {n} F (x_ {i}).}

Cramér – von Misesův test (dva vzorky)

Nechat ${displaystyle x_ {1}, x_ {2}, cdots, x_ {N}}$ a ${displaystyle y_ {1}, y_ {2}, cdots, y_ {M}}$ být pozorované hodnoty v prvním a druhém vzorku v pořadí, ve vzrůstajícím pořadí Nechat ${displaystyle r_ {1}, r_ {2}, cdots, r_ {N}}$ být řadami x v kombinovaném vzorku a nechat ${displaystyle s_ {1}, s_ {2}, cdots, s_ {M}}$ být řadami y v kombinovaném vzorku. Anderson^[3]^:1149 ukázat to

{displaystyle T = {frac {NM} {N + M}} omega ^ {2} = {frac {U} {NM (N + M)}} - {frac {4MN-1} {6 (M + N) }}}

kde U je definována jako

{displaystyle U = Nsum _ {i = 1} ^ {N} (r_ {i} -i) ^ {2} + Msum _ {j = 1} ^ {M} (s_ {j} -j) ^ {2 }}

Pokud je hodnota T větší než hodnoty v tabulce,^[3]^:1154–1159 hypotézu, že oba vzorky pocházejí ze stejné distribuce, lze odmítnout. (Nějaké knihy^{[upřesnit ]} dát kritické hodnoty pro U, což je pohodlnější, protože se tak vyhnete nutnosti počítat T pomocí výše uvedeného výrazu. Závěr bude stejný).

Výše uvedené předpokládá, že v souboru nejsou žádné duplikáty ${displaystyle x}$ , ${displaystyle y}$ , a ${displaystyle r}$ sekvence. Tak ${displaystyle x_ {i}}$ je jedinečný a jeho hodnost je ${displaystyle i}$ v seřazeném seznamu ${displaystyle x_ {1}, ... x_ {N}}$ . Pokud existují duplikáty, a ${displaystyle x_ {i}}$ přes ${displaystyle x_ {j}}$ jsou soubor identických hodnot v seřazeném seznamu, pak je jedním společným přístupem midrank^[7] metoda: každému duplikátu přiřadit "hodnost" ${displaystyle (i + j) / 2}$ . Ve výše uvedených rovnicích, ve výrazech ${displaystyle (r_ {i} -i) ^ {2}}$ a ${displaystyle (s_ {j} -j) ^ {2}}$ , duplikáty mohou upravit všechny čtyři proměnné ${displaystyle r_ {i}}$ , ${displaystyle i}$ , ${displaystyle s_ {j}}$ , a ${displaystyle j}$ .

Reference

^ Cramér, H. (1928). "O složení elementárních chyb". Skandinávský pojistněmatematický deník. 1928 (1): 13–74. doi:10.1080/03461238.1928.10416862.
^ von Mises, R. E. (1928). Wahrscheinlichkeit, Statistik und Wahrheit. Julius Springer.
^ ^A ^b ^C ^d Anderson, T. W. (1962). „O distribuci kritéria dvou vzorků Cramer – von Mises“ (PDF). Annals of Mathematical Statistics. Ústav matematické statistiky. 33 (3): 1148–1159. doi:10.1214 / aoms / 1177704477. ISSN 0003-4851. Citováno 12. června 2009.
^ A.N. Kolmogorov, „Sulla determinizione empirica di una legge di distribuzione“ Giorn. Ist. Ital. Attuari, 4 (1933), str. 83–91
^ ^A ^b Pearson, E.S. Hartley, H.O. (1972) Tabulky Biometrika pro statistiky, svazek 2CUP. ISBN 0-521-06937-8 (strana 118 a tabulka 54)
^ Watson, G.S. (1961) „Goodness-Of-Fit Tests on a Circle“, Biometrika, 48 (1/2), 109-114 JSTOR 2333135
^ Ruymgaart, F. H., (1980) „Unified approach to the asymptotic distribution theory of certain midrank statistics“. V: Statistique non Parametrique Asymptotique, 1 ± 18, J. P. Raoult (ed.), Lecture Notes on Mathematics, No. 821, Springer, Berlin.

M. A. Stephens (1986). "Testy založené na statistice EDF". V D'Agostino, R.B .; Stephens, M.A. (eds.). Techniky dobré shody. New York: Marcel Dekker. ISBN 0-8247-7487-6.

Další čtení

Xiao, Y .; A. Gordon; A. Jakovlev (leden 2007). „Program C ++ pro dvou ukázkový test Cramér – von Mises“ (PDF). Žurnál statistického softwaru. Americká statistická asociace. 17 (8). ISSN 1548-7660. OCLC 42456366. Citováno 12. června 2009.

[1] Cramér, H. (1928). "O složení elementárních chyb". Skandinávský pojistněmatematický deník. 1928 (1): 13–74. doi:10.1080/03461238.1928.10416862.

[2] von Mises, R. E. (1928). Wahrscheinlichkeit, Statistik und Wahrheit. Julius Springer.

[anderson-3] A ^b ^C ^d Anderson, T. W. (1962). „O distribuci kritéria dvou vzorků Cramer – von Mises“ (PDF). Annals of Mathematical Statistics. Ústav matematické statistiky. 33 (3): 1148–1159. doi:10.1214 / aoms / 1177704477. ISSN 0003-4851. Citováno 12. června 2009.

[4] A.N. Kolmogorov, „Sulla determinizione empirica di una legge di distribuzione“ Giorn. Ist. Ital. Attuari, 4 (1933), str. 83–91

[PH1-5] A ^b Pearson, E.S. Hartley, H.O. (1972) Tabulky Biometrika pro statistiky, svazek 2CUP. ISBN 0-521-06937-8 (strana 118 a tabulka 54)

[W1-6] Watson, G.S. (1961) „Goodness-Of-Fit Tests on a Circle“, Biometrika, 48 (1/2), 109-114 JSTOR 2333135

[7] Ruymgaart, F. H., (1980) „Unified approach to the asymptotic distribution theory of certain midrank statistics“. V: Statistique non Parametrique Asymptotique, 1 ± 18, J. P. Raoult (ed.), Lecture Notes on Mathematics, No. 821, Springer, Berlin.

[1]

[2]

[3]

[4]

[5]

[6]

[7]