McNemarsův test - McNemars test - Wikipedia
![]() | tento článek může být pro většinu čtenářů příliš technická na to, aby je pochopili.Listopad 2012) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
v statistika, McNemarův test je statistický test používaný na spárováno nominální údaje. Aplikuje se na 2 × 2 kontingenční tabulky s dichotomický vlastnost se shodnými dvojicemi subjektů k určení, zda jsou okrajové frekvence řádků a sloupců stejné (tj. zda existuje „mezní homogenita“). Je pojmenován po Quinn McNemar, který ji představil v roce 1947.[1]Aplikace testu v genetice je test nerovnováhy přenosu pro detekci vazebná nerovnováha.[2] Běžně používané parametry pro hodnocení diagnostického testu v lékařských vědách jsou citlivost a specificita. Citlivost je schopnost testu správně identifikovat osoby s onemocněním. Specifičnost je schopnost testu správně identifikovat osoby bez onemocnění. Nyní předpokládejme, že u stejné skupiny pacientů jsou provedeny dva testy. A také předpokládejme, že tyto testy mají stejnou citlivost a specificitu. V této situaci je člověk těmito nálezy unesen a předpokládá se, že oba testy jsou rovnocenné. To však nemusí platit. Za tímto účelem musíme studovat pacienty s onemocněním a pacienty bez onemocnění (referenčním testem). Musíme také zjistit, kde se tyto dva testy navzájem neshodují. To je přesně základ McNemarova testu. Tento test porovnává citlivost a specificitu dvou diagnostických testů na stejné skupině pacientů.[3]
Definice
Test se aplikuje na pohotovostní tabulku 2 × 2, která obsahuje výsledky dvou testů na vzorku n předměty.
Test 2 pozitivní | Test 2 negativní | Celkem řádek | |
Test 1 pozitivní | A | b | A + b |
Test 1 negativní | C | d | C + d |
Celkem sloupce | A + C | b + d | n |
The nulová hypotéza mezní homogenity uvádí, že dvě mezní pravděpodobnosti pro každý výsledek jsou stejné, tj. pA + pb = pA + pC a pC + pd = pb + pd.
Nulové a alternativní hypotézy tedy jsou[1]
Tady pAatd., označují teoretickou pravděpodobnost výskytu v buňkách s odpovídajícím štítkem.
McNemar statistika testu je:
Podle nulové hypotézy s dostatečně velkým počtem diskordantů (buňky b a c), má distribuce chí-kvadrát s 1 stupeň svobody. Pokud výsledek je významný, to poskytuje dostatečné důkazy pro odmítnutí nulové hypotézy ve prospěch alternativní hypotézy, která pb ≠ pC, což by znamenalo, že mezní proporce se od sebe výrazně liší.
Variace
Pokud ano b nebo C je malý (b + C <25) pak není dobře aproximován distribucí chí-kvadrát.[Citace je zapotřebí ] Potom lze použít přesný binomický test, kde b je ve srovnání s a binomická distribuce s parametrem velikosti n = b + C (Pozor: n má nový význam!) a p = 0,5. Přesný binomický test efektivně vyhodnotí nevyváženost diskordantů b a C. K dosažení oboustranné P-hodnoty je třeba vynásobit P-hodnotu extrémního ocasu 2. For b ≥ C:
což je jednoduše dvojnásobek binomické distribuce kumulativní distribuční funkce s p = 0,5 a n = b + C.
Edwards[4] navrhla následující verzi McNemarova testu s korekcí kontinuity, aby se přiblížila binomická přesná hodnota P:
Mid-P McNemarův test (mid-p binomický test) se vypočítá odečtením poloviční pravděpodobnosti pozorovaného b z přesně jednostranné P-hodnoty, pak ji zdvojnásobte, abyste získali oboustrannou střední P-hodnotu:[5][6]
To odpovídá:
kde druhý člen je binomické rozdělení funkce pravděpodobnostní hmotnosti a n = b + C. Binomické distribuční funkce jsou snadno dostupné v běžných softwarových balíčcích a lze snadno vypočítat test McNemar mid-P.[6]
Tradiční radou bylo použít přesný binomický test, když b + C <25. Simulace však ukázaly, že přesný binomický test i McNemarův test s korekcí kontinuity jsou příliš konzervativní.[6] Když b + C <6, přesná hodnota P vždy přesahuje běžnou hladinu významnosti 0,05. Původní McNemarův test byl nejsilnější, ale často mírně liberální. Verze mid-P byla téměř stejně silná jako asymptotický McNemarův test a nebylo zjištěno, že překračuje nominální hladinu významnosti.
Příklady
V prvním příkladu se výzkumník pokouší zjistit, zda má lék účinek na konkrétní nemoc. Počty jednotlivců jsou uvedeny v tabulce s diagnózou (nemoc: současnost, dárek nebo chybí) před léčbou uvedenou v řádcích a diagnóza po ošetření ve sloupcích. Test vyžaduje, aby byly do měření před a po zahrnuty stejné předměty (párované páry).
Po: současnost, dárek | Po: chybí | Celkem řádek | |
Před: současnost, dárek | 101 | 121 | 222 |
Před: chybí | 59 | 33 | 92 |
Celkem sloupce | 160 | 154 | 314 |
V tomto příkladu by nulová hypotéza „mezní homogenity“ znamenala, že nedošlo k žádnému účinku léčby. Z výše uvedených údajů statistika testu McNemar:
má hodnotu 21,35, což je velmi nepravděpodobné, že by vytvořilo rozdělení implikované nulovou hypotézou (P <0,001). Test tedy poskytuje přesvědčivé důkazy o odmítnutí nulové hypotézy o žádném účinku léčby.
Druhý příklad ilustruje rozdíly mezi asymptotickým McNemarovým testem a alternativami.[6] Tabulka dat je formátována jako dříve, s různými čísly v buňkách:
Po: současnost, dárek | Po: chybí | Celkem řádek | |
Před: současnost, dárek | 59 | 6 | 65 |
Před: chybí | 16 | 80 | 96 |
Celkem sloupce | 75 | 86 | 161 |
S těmito daty není velikost vzorku (161 pacientů) malá, výsledky z McNemarova testu a jiných verzí se však liší. Přesný binomický test dává P = 0,053 a McNemarův test s korekcí kontinuity dává = 3,68 a P = 0,055. Asymptotický McNemarův test dává = 4,55 a P = 0,033 a McNemarův test v polovině P dává P = 0,035. McNemarův test i verze mid-P poskytují v tomto druhém příkladu silnější důkazy o statisticky významném efektu léčby.
Diskuse
Zajímavým postřehem při interpretaci McNemarova testu je, že prvky hlavní úhlopříčky nepřispívají k rozhodnutí o tom, zda je (ve výše uvedeném příkladu) příznivější stav před nebo po léčbě. Tedy součet b + C může být malá a statistická síla výše popsaných testů může být nízká, i když počet párů A + b + C + d je velký (viz druhý příklad výše).
Rozšíření McNemarova testu existuje v situacích, kdy nezávislost nemusí nutně platit mezi páry; místo toho existují klastry spárovaných dat, kde páry v klastru nemusí být nezávislé, ale nezávislost platí mezi různými klastry.[7] Příkladem je analýza účinnosti zubního zákroku; v tomto případě pár odpovídá léčbě jednotlivého zubu u pacientů, kteří by mohli mít ošetřeno více zubů; účinnost léčby dvou zubů u stejného pacienta pravděpodobně nebude nezávislá, ale léčba dvou zubů u různých pacientů pravděpodobně nebude nezávislá.[8]
Informace ve dvojicích
V 70. letech se předpokládalo, že uchování něčích mandlí může chránit před Hodgkinův lymfom. John Rice napsal:[9]
85 Hodgkinových pacientů [...] mělo sourozence stejného pohlaví, kteří nebyli nemocní a jejichž věk byl do 5 let od pacientky. Tito vyšetřovatelé předložili následující tabulku:
Vypočítali a statistika chí-kvadrát [...] [udělali chybu ve své analýze tím, že ignorovali párování. [...] [jejich] vzorky nebyly nezávislé, protože sourozenci byli spárováni [...] sestavili jsme tabulku, která vystavuje párování:
McNemarův test lze použít na druhou tabulku. Všimněte si, že součet čísel v druhé tabulce je 85 - počet páry sourozenců - zatímco součet čísel v první tabulce je dvakrát tak velký, 170 - počet jednotlivců. Druhá tabulka poskytuje více informací než ta první. Čísla v první tabulce lze najít pomocí čísel v druhé tabulce, ale ne naopak. Čísla v první tabulce udávají pouze okrajové součty čísel v druhé tabulce.
Související testy
- Dvojčlen podepsat test dává přesný test pro McNemarův test.
- The Cochranův Q test je rozšířením McNemarova testu pro více než dvě „ošetření“.
- The Liddellův přesný test je přesná alternativa k McNemarovu testu.[10][11]
- The Stuart – Maxwellov test je jiné zobecnění testu McNemar, který se používá k testování mezní homogenity ve čtvercové tabulce s více než dvěma řádky / sloupci.[12][13][14]
- The Bhapkarův test (1966) je výkonnější alternativou k testu Stuart – Maxwell,[15][16] ale bývá to liberální. K dispozici jsou konkurenční alternativy k existujícím metodám.[17]
- McNemarův test je zvláštním případem Cochran – Mantel – Haenszelův test; je ekvivalentní testu CMH s jednou vrstvou pro každý z N párů a v každé vrstvě tabulkou 2x2 ukazující spárované binární odpovědi.[18]
Viz také
Reference
- ^ A b McNemar, Quinn (18. června 1947). Msgstr "Poznámka k chybě vzorkování rozdílu mezi korelovanými proporcemi nebo procenty". Psychometrika. 12 (2): 153–157. doi:10.1007 / BF02295996. PMID 20254758.
- ^ Spielman RS; McGinnis RE; Ewens WJ (Březen 1993). „Přenosový test na vazebnou nerovnováhu: oblast genu pro inzulin a inzulín-dependentní diabetes mellitus (IDDM)“. Jsem J Hum Genet. 52 (3): 506–16. PMC 1682161. PMID 8447318.
- ^ Hawass, N E (duben 1997). "Porovnání citlivosti a specifičnosti dvou diagnostických postupů prováděných u stejné skupiny pacientů". British Journal of Radiology. 70 (832): 360–366. doi:10,1259 / bjr.70,832,9166071. ISSN 0007-1285. PMID 9166071.
- ^ Edwards, A (1948). „Poznámka k„ korekci na kontinuitu “při testování významnosti rozdílu mezi korelovanými proporcemi.“ Psychometrika. 13 (3): 185–187. doi:10.1007 / bf02289261. PMID 18885738.
- ^ Lancaster, H.O. (1961). "Testy významnosti v diskrétních distribucích". J Am Stat Assoc. 56 (294): 223–234. doi:10.1080/01621459.1961.10482105.
- ^ A b C d Fagerland, M.W .; Lydersen, S .; Laake, P. (2013). „McNemarův test pro binární data párovaných párů: mid-p a asymptotické jsou lepší než přesné podmíněné“. Metodika lékařského výzkumu BMC. 13: 91. doi:10.1186/1471-2288-13-91. PMC 3716987. PMID 23848987.
- ^ Yang, Z .; Sun, X .; Hardin, J.W. (2010). "Poznámka k testům na klastrovaná dvojitá binární data". Biometrický deník. 52 (5): 638–652. doi:10.1002 / bimj.201000035. PMID 20976694.
- ^ Durkalski, V.L .; Palesch, Y.Y .; Lipsitz, S.R .; Rust, P.F. (2003). „Analýza seskupených dat párových párů“. Statistika v medicíně. 22 (15): 2417–28. doi:10.1002 / sim.1438. PMID 12872299. Archivovány od originál 5. ledna 2013. Citováno 1. dubna 2009.
- ^ Rice, John (1995). Matematická statistika a analýza dat (Druhé vydání.). Belmont, Kalifornie: Duxbury Press. str.492 –494. ISBN 978-0-534-20934-6.
- ^ Liddell, D. (1976). "Praktické testy pohotovostních tabulek 2 × 2". Journal of the Royal Statistical Society. 25 (4): 295–304. JSTOR 2988087.
- ^ „Maxwellov test, McNemarův test, Kappa test“. Rimarcik.com. Citováno 2012-11-22.
- ^ Sun, Xuezheng; Yang, Zhao (2008). „Zobecněný McNemarův test na homogenitu okrajových distribucí“ (PDF). SAS Globální fórum.
- ^ Stuart, Alan (1955). „Test homogenity okrajových distribucí ve dvousměrné klasifikaci“. Biometrika. 42 (3/4): 412–416. doi:10.1093 / biomet / 42,3-4,412. JSTOR 2333387.
- ^ Maxwell, A.E. (1970). "Porovnání klasifikace subjektů dvěma nezávislými soudci". British Journal of Psychiatry. 116 (535): 651–655. doi:10.1192 / bjp.116.535.651. PMID 5452368.
- ^ „McNemarovy testy marginální homogenity“. John-uebersax.com. 2006-08-30. Citováno 2012-11-22.
- ^ Bhapkar, V.P. (1966). "Poznámka o rovnocennosti dvou testovacích kritérií pro hypotézy v kategorických datech". Journal of the American Statistical Association. 61 (313): 228–235. doi:10.1080/01621459.1966.10502021. JSTOR 2283057.
- ^ Yang, Z .; Sun, X .; Hardin, J.W. (2012). "Testování mezní homogenity v polytomových datech s párovým párem". Terapeutické inovace a regulační věda. 46 (4): 434–438. doi:10.1177/0092861512442021.
- ^ Agresti, Alan (2002). Kategorická analýza dat (PDF). Hooken, New Jersey: John Wiley & Sons, Inc. str. 413. ISBN 978-0-471-36093-3.