Citlivost a specifičnost - Sensitivity and specificity
![]() | tento článek může být pro většinu čtenářů příliš technická na to, aby tomu rozuměli. Prosím pomozte to vylepšit na aby to bylo srozumitelné pro neodborníky, aniž by byly odstraněny technické podrobnosti. (Červenec 2020) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) |

Citlivost a specifičnost jsou statistická měřítka výkonnosti a binární klasifikace test které jsou široce používány v medicíně:
- Citlivost měří podíl pozitiv, které jsou správně identifikovány (např. procento nemocných lidí, kteří jsou správně identifikováni jako nemocní).
- Specifičnost měří podíl negativů, které jsou správně identifikovány (např. procento zdravých lidí, kteří jsou správně identifikováni jako osoby bez nějaké nemoci).
Výrazy „pozitivní“ a „negativní“ se nevztahují na prospěch, ale na přítomnost nebo nepřítomnost stavu; například pokud je onemocněním onemocnění, „pozitivní“ znamená „nemocný“ a „negativní“ znamená „zdravý“.
V mnoha testech, včetně diagnostických lékařské testy, citlivost je míra, do jaké nejsou přehlížena skutečná pozitiva, tedy falešných negativů je málo, a specificita je míra, do jaké jsou pravdivé negativy jako takové klasifikovány, tedy falešných pozitivů je málo. Citlivý test zřídka přehlíží skutečné pozitivum (například nevykazuje nic špatného navzdory existujícímu problému); konkrétní test zřídka registruje pozitivní klasifikaci pro cokoli, co není cílem testování (například nalezení jednoho bakteriálního druhu a jeho záměna s jiným blízce příbuzným, který je skutečným cílem).
Mezi opatřeními obvykle dochází ke kompromisu. Například v letištní ochranka, protože testování cestujících je zaměřeno na potenciální ohrožení bezpečnosti, mohou být nastaveny skenery, které spustí alarmy u položek s nízkým rizikem, jako jsou spony a klíče na opasek (nízká specificita), aby se zvýšila pravděpodobnost identifikace nebezpečných předmětů a minimalizovalo se riziko chybějících předmětů které představují hrozbu (vysoká citlivost). Dokonalý prediktor by byl 100% citlivý, což znamená, že všichni nemocní jedinci jsou správně identifikováni jako nemocní, a 100% specifický, což znamená, že žádní zdraví jedinci nejsou nesprávně identifikováni jako nemocní.
Pojmy „citlivost“ a „specifičnost“ zavedl americký biostatista Jacob Yerushalmy v roce 1947.[1]
Definice
V terminologii true / false positive / negative, skutečný nebo Nepravdivé odkazuje na to, že přiřazená klasifikace je správná nebo nesprávná, zatímco pozitivní nebo záporný odkazuje na přiřazení do pozitivní nebo negativní kategorie.
Zdroje: Fawcett (2006),[2] Powers (2011),[3] Ting (2011),[4], CAWCR[5] D. Chicco & G. Jurman (2020),[6] Tharwat (2018).[7] |
Aplikace na screeningovou studii
Představte si studii hodnotící test, který vyšetřuje lidi na nemoc. Každá osoba, která podstoupí test, má nebo nemá onemocnění. Výsledek testu může být pozitivní (klasifikace osoby jako osoby s onemocněním) nebo negativní (klasifikace osoby jako osoby bez onemocnění). Výsledky testu u každého subjektu se mohou nebo nemusí shodovat se skutečným stavem subjektu. V tomto nastavení:
- Opravdu pozitivní: Nemocní lidé správně označeni jako nemocní
- Falešně pozitivní: Zdraví lidé nesprávně označeni jako nemocní
- Skutečně negativní: Zdraví lidé jsou správně označeni jako zdraví
- Falešně negativní: Nemocní lidé nesprávně označeni jako zdraví
Matice zmatku
Zvažte skupinu s P pozitivní případy a N negativní případy nějakého stavu. Čtyři výsledky lze formulovat jako 2 × 2 pohotovostní tabulka nebo zmatená matice, jak následuje:
Pravdivý stav | ||||||
Celková populace | Podmínka pozitivní | Stav negativní | Prevalence = Σ Podmínka pozitivní/Σ Celkový počet obyvatel | Přesnost (ACC) = Σ True positive + Σ True positive/Σ Celkový počet obyvatel | ||
Předpokládaný stav pozitivní | Opravdu pozitivní | Falešně pozitivní, Chyba typu I. | Pozitivní prediktivní hodnota (PPV), Přesnost = Σ Opravdu pozitivní/Σ Předpokládaný stav pozitivní | Falešná míra objevení (FDR) = Σ Falešně pozitivní/Σ Předpokládaný stav pozitivní | ||
Předpokládaný stav záporný | Falešně negativní, Chyba typu II | Pravda záporná | Míra chybného opomenutí (PRO) = Σ Falešně negativní/Σ Předpovězený stav negativní | Negativní prediktivní hodnota (NPV) = Σ Skutečně negativní/Σ Předpovězený stav negativní | ||
Skutečná kladná sazba (TPR), Odvolání, Citlivost pravděpodobnost detekce, Napájení = Σ Opravdu pozitivní/Σ Stav pozitivní | Falešná kladná sazba (FPR), Vypadnout, pravděpodobnost falešného poplachu = Σ Falešně pozitivní/Σ Stav negativní | Poměr pozitivní pravděpodobnosti (LR +) = TPR/FPR | Poměr diagnostických šancí (DOR) = LR +/LR− | F1 skóre = 2 · Přesnost · Připomeňme/Precision + Recall | ||
Falešně negativní sazba (FNR), míra slečny = Σ Falešně negativní/Σ Podmínka pozitivní | Specifičnost (SPC), selektivita, Skutečná záporná sazba (TNR) = Σ Skutečně negativní/Σ Stav negativní | Poměr záporné pravděpodobnosti (LR−) = FNR/TNR |
Citlivost
Zvažte příklad lékařského testu pro diagnostiku onemocnění. Citlivost označuje schopnost testu správně detekovat nemocné pacienty, kteří tento stav mají.[8] V příkladu lékařského testu používaného k identifikaci nemoci je citlivost (někdy také označovaná jako míra detekce v klinickém prostředí) podílu lidí, kteří mají pozitivní test na onemocnění, z těch, kteří mají onemocnění. Matematicky to lze vyjádřit jako:
Negativní výsledek testu s vysokou citlivostí je užitečný pro vyloučení nemoci.[8] Test s vysokou citlivostí je spolehlivý, pokud je jeho výsledek negativní, protože jen zřídka špatně diagnostikuje ty, kteří mají toto onemocnění. Test se 100% citlivostí rozpozná všechny pacienty s tímto onemocněním pozitivním testem. Negativní výsledek testu by definitivně vyloučit přítomnost onemocnění u pacienta. Pozitivní výsledek testu s vysokou citlivostí však nemusí být nutně užitečný pro rozhodování o nemoci. Předpokládejme, že falešná testovací souprava je navržena tak, aby vždy poskytovala pozitivní hodnoty. Při použití u nemocných pacientů mají všichni pacienti pozitivní test, což dává testu 100% citlivost. Citlivost však nebere v úvahu falešné poplachy. Falešný test se také vrací pozitivně u všech zdravých pacientů, což mu dává falešně pozitivní míru 100%, což znemožňuje jeho detekci nebo „vládnutí“ v nemoci.
Citlivost není stejná jako u přesnost nebo pozitivní prediktivní hodnota (poměr skutečných pozitiv ke kombinovaným pravdivým a falešným pozitivům), což je výrok o podílu skutečných pozitiv v testované populaci, stejně jako o testu.
Výpočet citlivosti nebere v úvahu neurčité výsledky testu. Pokud nelze test opakovat, měly by být z analýzy vyloučeny neurčité vzorky (počet citací by měl být uveden při citování citlivosti) nebo by mohly být považovány za falešné negativy (které dává hodnotu nejhoršího případu pro citlivost a může ji proto podcenit).
Specifičnost
Zvažte příklad lékařského testu pro diagnostiku onemocnění. Specifičnost souvisí se schopností testu správně odmítnout zdravé pacienty bez onemocnění. Specifičnost testu je podíl zdravých pacientů, o nichž je známo, že onemocnění nemají, a kteří na něj budou mít negativní test. Matematicky to lze také napsat jako:
Pozitivní výsledek testu s vysokou specificitou je užitečný při rozhodování o nemoci. Test zřídka poskytuje pozitivní výsledky u zdravých pacientů. Pozitivní výsledek znamená vysokou pravděpodobnost výskytu nemoci.[9]
Test s vyšší specificitou má nižší chybovost typu I.
Grafické znázornění
Vysoká citlivost a nízká specificita
Nízká citlivost a vysoká specificita
Lékařské příklady
v lékařská diagnóza, citlivost testu je schopnost testu správně identifikovat osoby s onemocněním (skutečná míra pozitivity), zatímco specificita testu je schopnost testu správně identifikovat osoby bez onemocnění (skutečná míra negativity). Pokud je známo 100 pacientů onemocnění bylo testováno a 43 pozitivních, pak má test 43% citlivost. Pokud je testováno 100 bez onemocnění a 96 vrátí zcela negativní výsledek, pak má test 96% specificitu. Citlivost a specificita jsou charakteristikami testu nezávislými na prevalenci, protože jejich hodnoty jsou inherentní testu a nezávisí na prevalenci onemocnění v populaci, která je předmětem zájmu.[10] Pozitivní a negativní prediktivní hodnoty, nikoli však citlivost nebo specificita, jsou hodnoty ovlivněné prevalencí onemocnění v testované populaci. Tyto koncepty jsou graficky znázorněny v tomto appletu Bayesovský klinický diagnostický model které ukazují pozitivní a negativní prediktivní hodnoty jako funkci prevalence, citlivosti a specificity.
Prahová hodnota prevalence
Vztah mezi pozitivní prediktivní hodnotou screeningových testů a jeho cílovou prevalencí je proporcionální - i když ne vždy lineární, až na speciální případ. V důsledku toho existuje bod lokálních extrémů a maximálního zakřivení definovaný pouze jako funkce citlivosti a specificity, za kterou rychlost změny pozitivní prediktivní hodnoty testu klesá rozdílným tempem vzhledem k prevalenci onemocnění. Pomocí diferenciálních rovnic byl tento bod poprvé definován Balaylou a kol. [11] a je označován jako prahová hodnota prevalence (). Rovnice pro prahovou hodnotu prevalence je dána následujícím vzorcem, kde a = citlivost ab = specificita:
To, kde tento bod spočívá ve screeningové křivce, má zásadní důsledky pro lékaře a interpretaci pozitivních screeningových testů v reálném čase.
Mylné představy
Často se tvrdí, že vysoce specifický test je účinný při rozhodování o nemoci, pokud je pozitivní, zatímco vysoce citlivý test se považuje za účinný při vyloučení nemoci, když je negativní.[12][13] To vedlo k široce používaným mnemotechnikám SPPIN a SNNOUT, podle nichž velmi specifický test, když positivní, pravidla v onemocnění (SP-P-IN) a vysocesEnpozitivní test, když negativní pravidla ven onemocnění (SN-N-OUT). Obě pravidla jsou však inferenčně zavádějící, protože diagnostická síla jakéhokoli testu je dána jeho citlivostí a jeho specifičnost.[14][15][16]
Je zkoumán kompromis mezi specificitou a citlivostí ROC analýza jako kompromis mezi TPR a FPR (tj. odvolání a spad).[17] Jejich stejná váha se optimalizuje informovanost = specificita + citlivost-1 = TPR-FPR, jehož velikost dává pravděpodobnost informovaného rozhodnutí mezi dvěma třídami (> 0 představuje vhodné použití informací, 0 představuje výkon na úrovni šance, <0 představuje zvrácené použití informací) .[18]
Index citlivosti
The index citlivosti nebo d ' (vyslovuje se „dee-prime“) je a statistický použitý v signálu teorie detekce. Poskytuje oddělení mezi prostředky signálu a distribucemi šumu ve srovnání se standardní odchylkou distribuce šumu. Pro normálně distribuováno signál a šum se střední a standardní odchylkou a , a a , v tomto pořadí, d 'je definován jako:
Odhad d 'lze také zjistit z měření míry úspěšnosti a falešný poplach hodnotit. Vypočítává se jako:
- d ' = Z(počet přístupů) - Z(míra falešného poplachu),[20]
kde funkce Z(p), p ∈ [0,1], je inverzní k kumulativní Gaussova distribuce.
d ' je bezrozměrný statistický. Vyšší d ' označuje, že signál lze snadno detekovat.
Pracoval příklad
- Fungující příklad
- Diagnostický test s citlivostí 67% a specificitou 91% se aplikuje na 2030 lidí, aby vyhledali poruchu s populační prevalencí 1,48%
Pacienti s rakovina střev (jak bylo potvrzeno dne endoskopie ) | ||||||
Podmínka pozitivní | Stav negativní | Prevalence = (TP + FN) / Celková_Populace = (20+10)/2030 ≈1.48% | Přesnost (ACC) = (TP + TN) / Celková_Populace = (20+1820)/2030 ≈90.64% | |||
Fekální okultní krev obrazovka test výsledek | Test výsledek pozitivní | Opravdu pozitivní (TP) = 20 (2030 x 1,48% x 67%) | Falešně pozitivní (FP) = 180 (2030 x (100 - 1,48%) x (100 - 91%)) | Pozitivní prediktivní hodnota (PPV), Přesnost = TP / (TP + FP) = 20 / (20 + 180) = 10% | Falešná míra objevení (FDR) = FP / (TP + FP) = 180/(20+180) = 90.0% | |
Test výsledek záporný | Falešně negativní (FN) = 10 (2030 x 1,48% x (100 - 67%)) | Pravda záporná (TN) = 1820 (2030 x (100 - 1,48%) x 91%) | Míra chybného opomenutí (PRO) = FN / (FN + TN) = 10 / (10 + 1820) ≈ 0.55% | Negativní prediktivní hodnota (NPV) = TN / (FN + TN) = 1820 / (10 + 1820) ≈ 99.45% | ||
TPR, Odvolání, Citlivost = TP / (TP + FN) = 20 / (20 + 10) ≈ 66.7% | Falešná kladná sazba (FPR),Vypadnout, pravděpodobnost falešného poplachu = FP / (FP + TN) = 180/(180+1820) =9.0% | Poměr pozitivní pravděpodobnosti (LR +) = TPR/FPR = (20/30)/(180/2000) ≈7.41 | Poměr diagnostických šancí (DOR) = LR +/LR− ≈20.2 | F1 skóre = 2 · Přesnost · Připomeňme/Precision + Recall ≈0.174 | ||
Falešná záporná sazba (FNR), míra slečny = FN / (TP + FN) = 10/(20+10) ≈ 33.3% | Specifičnost, Selektivita, Skutečná záporná sazba (TNR) = TN / (FP + TN) = 1820 / (180 + 1820) = 91% | Poměr záporné pravděpodobnosti (LR−) = FNR/TNR = (10/30)/(1820/2000) ≈0.366 |
Související výpočty
- Falešná kladná sazba (α) = chyba typu I. = 1 - specificita = FP / (FP + TN) = 180 / (180 + 1820) = 9%
- Falešná záporná sazba (β) = chyba typu II = 1 - citlivost = FN / (TP + FN) = 10 / (20 + 10) = 33%
- Napájení = citlivost = 1 - β
- Míra pravděpodobnosti pozitivní = citlivost / (1 - specificita) = 0,67 / (1 - 0,91) = 7,4
- Míra pravděpodobnosti negativní = (1 - citlivost) / specificita = (1 - 0,67) / 0,91 = 0,37
- Prahová hodnota prevalence = = 0.19 => 19.1%
Tento hypotetický screeningový test (okultní krevní test na stolici) správně identifikoval dvě třetiny (66,7%) pacientů s kolorektálním karcinomem.[A] Faktorování míry prevalence bohužel ukazuje, že tento hypotetický test má vysokou míru falešně pozitivních výsledků a spolehlivě neidentifikuje kolorektální karcinom v celkové populaci asymptomatických osob (PPV = 10%).
Na druhou stranu tento hypotetický test ukazuje velmi přesnou detekci jedinců bez rakoviny (NPV = 99,5%). Proto, když se použije pro rutinní screening kolorektálního karcinomu u asymptomatických dospělých, negativní výsledek poskytuje pacientovi a lékaři důležitá data, jako je vyloučení rakoviny jako příčiny gastrointestinálních symptomů nebo uklidnění pacientů znepokojených vývojem kolorektálního karcinomu.
Odhad chyb v citované citlivosti nebo specificitě
Samotné hodnoty citlivosti a specificity mohou být velmi zavádějící. Citlivost nebo specificita „nejhoršího případu“ musí být vypočítána, aby se zabránilo spoléhání se na experimenty s několika výsledky. Například konkrétní test může snadno ukázat 100% citlivost, pokud je testován proti zlatému standardu čtyřikrát, ale jediný další test proti zlatému standardu, který poskytl špatný výsledek, by znamenal citlivost pouze 80%. Běžným způsobem je uvést binomický poměr intervalu spolehlivosti, často počítané pomocí Wilsonova intervalu skóre.
Intervaly spolehlivosti pro citlivost a specificitu lze vypočítat, což poskytuje rozsah hodnot, ve kterých leží správná hodnota na dané úrovni spolehlivosti (např. 95%).[23]
Terminologie při získávání informací
v vyhledávání informací se nazývá pozitivní prediktivní hodnota přesnosta volá se citlivost odvolání. Na rozdíl od kompromisu Specifičnost vs. Citlivost jsou tato opatření nezávislá na počtu skutečných negativů, který je obecně neznámý a mnohem větší než skutečný počet příslušných a získaných dokumentů. Tento předpoklad velkého počtu skutečných negativů oproti pozitivům je v jiných aplikacích vzácný.[18]
The F-skóre lze použít jako jediné měřítko výkonu testu pro pozitivní třídu. F-skóre je harmonický průměr přesnosti a odvolání:
V tradičním jazyce statistické testování hypotéz, se citlivost testu nazývá statistická síla testu, ačkoli slovo Napájení v tomto kontextu má obecnější použití, které v tomto kontextu není použitelné. Citlivý test bude mít méně Chyby typu II.
Viz také
Poznámky
- ^ Pro všechny lékařské screeningové testy existují výhody a nevýhody. Pokyny pro klinickou praxi, jako jsou ty pro screening kolorektálního karcinomu, popište tato rizika a přínosy.[21][22]
Reference
- ^ Yerushalmy J (1947). „Statistické problémy při hodnocení metod lékařské diagnostiky se zvláštním zřetelem na rentgenové techniky“. Zprávy o veřejném zdraví. 62 (2): 1432–39. doi:10.2307/4586294. JSTOR 4586294. PMID 20340527.
- ^ Fawcett, Tom (2006). „Úvod do analýzy ROC“ (PDF). Písmena pro rozpoznávání vzorů. 27 (8): 861–874. doi:10.1016 / j.patrec.2005.10.010.
- ^ Powers, David M W (2011). „Hodnocení: Od přesnosti, odvolání a měření F k ROC, informovanosti, známosti a korelaci“. Journal of Machine Learning Technologies. 2 (1): 37–63.
- ^ Ting, Kai Ming (2011). Sammut, Claude; Webb, Geoffrey I (eds.). Encyklopedie strojového učení. Springer. doi:10.1007/978-0-387-30164-8. ISBN 978-0-387-30164-8.
- ^ Brooks, Harold; Brown, Barb; Ebert, Beth; Ferro, Chris; Jolliffe, Ian; Koh, Tieh-Yong; Roebber, Paul; Stephenson, David (26.01.2015). „Společná pracovní skupina WWRP / WGNE pro výzkum ověřování prognóz“. Spolupráce pro australský výzkum počasí a klimatu. Světová meteorologická organizace. Citováno 2019-07-17.
- ^ Chicco D, Jurman G (leden 2020). „Výhody Matthewsova korelačního koeficientu (MCC) oproti skóre F1 a přesnosti při hodnocení binární klasifikace“. BMC Genomics. 21 (1): 6-1–6-13. doi:10.1186 / s12864-019-6413-7. PMC 6941312. PMID 31898477.
- ^ Tharwat A (srpen 2018). „Metody hodnocení klasifikace“. Aplikovaná výpočetní technika a informatika. doi:10.1016 / j.aci.2018.08.003.
- ^ A b Altman DG, Bland JM (červen 1994). „Diagnostické testy. 1: Citlivost a specificita“. BMJ. 308 (6943): 1552. doi:10.1136 / bmj.308.6943.1552. PMC 2540489. PMID 8019315.
- ^ „SpPins a SnNouts“. Centrum pro medicínu založenou na důkazech (CEBM). Citováno 26. prosince 2013.
- ^ Mangrulkar R. „Diagnostické uvažování I a II“. Citováno 24. ledna 2012.
- ^ Balayla, Jacques. „Prahová hodnota prevalence a geometrie screeningových křivek.“ arXiv předtisk arXiv: 2006.00398 (2020).
- ^ „Diagnostika založená na důkazech“. Michiganská státní univerzita. Archivovány od originál dne 06.07.2013. Citováno 2013-08-23.
- ^ „Citlivost a specificita“. Kurz medicíny založené na důkazech na Emory University Medical School.
- ^ Baron JA (duben - červen 1994). „Škoda, že to není pravda“. Lékařské rozhodování. 14 (2): 107. doi:10.1177 / 0272989X9401400202. PMID 8028462. S2CID 44505648.
- ^ Bojko EJ (duben - červen 1994). "Vyloučení nebo rozhodnutí v nemoci s nejcitlivějším nebo specifickým diagnostickým testem: zkrat nebo špatná zatáčka?". Lékařské rozhodování. 14 (2): 175–9. doi:10.1177 / 0272989X9401400210. PMID 8028470. S2CID 31400167.
- ^ Pewsner D, Battaglia M, Minder C, Marx A, Bucher HC, Egger M (červenec 2004). „Rozhodování o vstupu a výstupu diagnózy pomocí„ SpPIn “a„ SnNOut “: upozornění. BMJ. 329 (7459): 209–13. doi:10.1136 / bmj.329.7459.209. PMC 487735. PMID 15271832.
- ^ Fawcett, Tom (2006). "Úvod do analýzy ROC". Písmena pro rozpoznávání vzorů. 27 (8): 861–874. doi:10.1016 / j.patrec.2005.10.010.
- ^ A b Powers, David M W (2011). „Hodnocení: Od přesnosti, odvolání a F-měření k ROC, informovanosti, známosti a korelaci“. Journal of Machine Learning Technologies. 2 (1): 37–63. hdl:2328/27165.
- ^ Gale SD, Perkel DJ (leden 2010). „Cesta bazálních ganglií pohání selektivní sluchové odpovědi v dopaminergních neuronech zpěvných ptáků prostřednictvím dezinhibice“. The Journal of Neuroscience. 30 (3): 1027–37. doi:10.1523 / JNEUROSCI.3585-09.2010. PMC 2824341. PMID 20089911.
- ^ Macmillan NA, Creelman CD (15. září 2004). Teorie detekce: Uživatelská příručka. Psychologie Press. p. 7. ISBN 978-1-4106-1114-7.
- ^ Lin, Jennifer S .; Piper, Margaret A .; Perdue, Leslie A .; Rutter, Carolyn M .; Webber, Elizabeth M .; O'Connor, Elizabeth; Smith, Ning; Whitlock, Evelyn P. (21. června 2016). „Screening pro kolorektální karcinom“. JAMA. 315 (23): 2576–2594. doi:10.1001 / jama.2016.3332. ISSN 0098-7484.
- ^ Bénard, Florencie; Barkun, Alan N .; Martel, Myriam; Renteln, Daniel von (7. ledna 2018). „Systematický přehled pokynů pro screening kolorektálního karcinomu u dospělých s průměrným rizikem: shrnutí současných globálních doporučení“. World Journal of Gastroenterology. 24 (1): 124–138. doi:10,3748 / wjg.v24.i1.124. PMC 5757117. PMID 29358889.
- ^ „Diagnostický test online kalkulačka vypočítá citlivost, specificitu, poměry pravděpodobnosti a prediktivní hodnoty z tabulky 2x2 - kalkulačka intervalů spolehlivosti pro prediktivní parametry“. medcalc.org.
Další čtení
- Altman DG, Bland JM (červen 1994). „Diagnostické testy. 1: Citlivost a specificita“. BMJ. 308 (6943): 1552. doi:10.1136 / bmj.308.6943.1552. PMC 2540489. PMID 8019315.
- Loong TW (září 2003). „Porozumění citlivosti a specifičnosti s pravou stranou mozku“. BMJ. 327 (7417): 716–9. doi:10.1136 / bmj.327.7417.716. PMC 200804. PMID 14512479.