Provozní charakteristika přijímače - Receiver operating characteristic
Zdroje: Fawcett (2006),[1] Powers (2011),[2] Ting (2011),[3] CAWCR,[4] D. Chicco & G. Jurman (2020),[5] Tharwat (2018).[6] |
![](http://upload.wikimedia.org/wikipedia/commons/thumb/6/6b/Roccurves.png/220px-Roccurves.png)
A křivka provozní charakteristiky přijímačenebo ROC křivka, je grafický graf který ilustruje diagnostickou schopnost a binární klasifikátor systému, protože jeho prahová hodnota diskriminace se mění. Metoda byla původně vyvinuta pro operátory vojenských radarových přijímačů, a proto je pojmenována.
Křivka ROC se vytvoří vykreslením skutečná kladná sazba (TPR) proti míra falešně pozitivních výsledků (FPR) při různých nastaveních prahových hodnot. Skutečně pozitivní sazba je také známá jako citlivost, odvolání nebo pravděpodobnost detekce[7] v strojové učení. Míra falešně pozitivních výsledků je také známá jako pravděpodobnost falešného poplachu[7] a lze jej vypočítat jako (1 - specifičnost ). Lze jej také považovat za zápletku Napájení jako funkce Chyba typu I. rozhodovacího pravidla (když se výkon počítá pouze ze vzorku populace, lze jej považovat za odhad těchto veličin). Křivka ROC je tedy citlivost nebo vyvolání jako funkce vypadnout. Obecně platí, že pokud je známo rozdělení pravděpodobnosti pro detekci i falešný poplach, lze křivku ROC generovat vykreslením kumulativní distribuční funkce (oblast pod pravděpodobnostním rozdělením od na diskriminační práh) pravděpodobnosti detekce v ose y versus kumulativní distribuční funkce pravděpodobnosti falešného poplachu na ose x.
Analýza ROC poskytuje nástroje k výběru případně optimálních modelů a k vyřazení neoptimálních modelů nezávisle na (a před specifikací) kontextu nákladů nebo distribuci tříd. Analýza ROC souvisí přímým a přirozeným způsobem s diagnostikou nákladů a přínosů rozhodování.
Křivka ROC byla poprvé vyvinuta elektrotechnikem a radarem během druhé světové války pro detekci nepřátelských objektů na bojištích a byla brzy představena psychologie zohlednit percepční detekci stimulů. Od té doby byla v ROC použita analýza ROC lék, radiologie, biometrie, předpovídání z přírodní rizika,[8] meteorologie,[9] hodnocení výkonu modelu,[10] a dalších oblastech po mnoho desetiletí a stále více se používá v strojové učení a dolování dat výzkum.
ROC je také známý jako relativní křivka provozních charakteristik, protože se jedná o srovnání dvou provozních charakteristik (TPR a FPR) při změně kritéria.[11]
Základní koncept
Klasifikační model (klasifikátor nebo diagnóza ) je mapování případů mezi určitými třídami / skupinami. Protože výsledek klasifikátoru nebo diagnózy může být libovolný skutečná hodnota (nepřetržitý výstup), musí být hranice klasifikátoru mezi třídami určena prahovou hodnotou (například k určení, zda má osoba hypertenze na základě a krevní tlak opatření). Nebo to může být oddělený popisek třídy označující jednu ze tříd.
Zvažte problém predikce dvou tříd (binární klasifikace ), ve kterém jsou výsledky označeny buď jako pozitivní (p) nebo negativní (n). Existují čtyři možné výsledky z binárního klasifikátoru. Pokud je výsledek predikce p a skutečná hodnota je také p, pak se nazývá a skutečně pozitivní (TP); pokud je však skutečná hodnota n pak se říká, že je falešně pozitivní (FP). Naopak, a pravda negativní (TN) došlo, když jsou výsledek predikce i skutečná hodnota n, a falešně negativní (FN) je situace, kdy je výsledek predikce n zatímco skutečná hodnota je p.
Chcete-li získat vhodný příklad v reálném problému, zvažte diagnostický test, který se snaží zjistit, zda má člověk určité onemocnění. Falešně pozitivní v tomto případě nastane, když osoba testuje pozitivně, ale ve skutečnosti nemoc nemá. Falešně negativní, na druhé straně, nastane, když osoba testuje negativně, což naznačuje, že je zdravá, když skutečně má nemoc.
Pojďme definovat experiment z P pozitivní případy a N negativní případy pro určitý stav. Čtyři výsledky lze formulovat jako 2 × 2 pohotovostní tabulka nebo zmatená matice, jak následuje:
Pravdivý stav | ||||||
Celková populace | Podmínka pozitivní | Stav negativní | Prevalence = Σ Podmínka pozitivní/Σ Celkový počet obyvatel | Přesnost (ACC) = Σ True positive + Σ True positive/Σ Celkový počet obyvatel | ||
Předpokládaný stav pozitivní | Opravdu pozitivní | Falešně pozitivní, Chyba typu I. | Pozitivní prediktivní hodnota (PPV), Přesnost = Σ Opravdu pozitivní/Σ Předpokládaný stav pozitivní | Falešná míra objevení (FDR) = Σ Falešně pozitivní/Σ Předpokládaný stav pozitivní | ||
Předpokládaný stav negativní | Falešně negativní, Chyba typu II | Pravda záporná | Míra chybného opomenutí (PRO) = Σ Falešně negativní/Σ Předpovězený stav negativní | Negativní prediktivní hodnota (NPV) = Σ Skutečně negativní/Σ Předpovězený stav negativní | ||
Skutečná kladná sazba (TPR), Odvolání, Citlivost pravděpodobnost detekce, Napájení = Σ Opravdu pozitivní/Σ Podmínka pozitivní | Falešná kladná sazba (FPR), Vypadnout, pravděpodobnost falešného poplachu = Σ Falešně pozitivní/Σ Stav negativní | Poměr pozitivní pravděpodobnosti (LR +) = TPR/FPR | Poměr diagnostických šancí (DOR) = LR +/LR− | F1 skóre = 2 · Přesnost · Připomeňme/Precision + Recall | ||
Falešně negativní sazba (FNR), míra slečny = Σ Falešně negativní/Σ Podmínka pozitivní | Specifičnost (SPC), selektivita, Skutečná záporná sazba (TNR) = Σ Skutečně negativní/Σ Stav negativní | Poměr záporné pravděpodobnosti (LR−) = FNR/TNR |
ROC prostor
![](http://upload.wikimedia.org/wikipedia/commons/thumb/3/36/ROC_space-2.png/250px-ROC_space-2.png)
![](http://upload.wikimedia.org/wikipedia/commons/thumb/3/36/Roc-draft-xkcd-style.svg/250px-Roc-draft-xkcd-style.svg.png)
Kontingenční tabulka může odvodit několik hodnotících „metrik“ (viz infobox). K nakreslení ROC křivky jsou zapotřebí pouze skutečná kladná frekvence (TPR) a falešně pozitivní rychlost (FPR) (jako funkce některého parametru klasifikátoru). TPR definuje, kolik správných pozitivních výsledků se vyskytuje mezi všemi pozitivními vzorky dostupnými během testu. FPR na druhé straně definuje, kolik nesprávných pozitivních výsledků se vyskytne mezi všemi negativními vzorky dostupnými během testu.
ROC prostor je definován FPR a TPR jako X a y osy, které zobrazují relativní kompromisy mezi skutečnými pozitivními (výhody) a falešně pozitivními (náklady). Protože TPR je ekvivalentní citlivosti a FPR se rovná 1 - specificitě, graf ROC se někdy nazývá graf citlivosti vs (1 - specificita). Každý výsledek predikce nebo instance a zmatená matice představuje jeden bod v prostoru ROC.
Nejlepší možná metoda predikce by poskytla bod v levém horním rohu nebo souřadnici (0,1) prostoru ROC, což představuje 100% citlivost (bez falešných negativů) a 100% specificitu (bez falešných pozitivů). Bod (0,1) se také nazývá a dokonalá klasifikace. Náhodný odhad by dal bod podél diagonální čáry (tzv řada zákazu diskriminace) z levého dolního rohu do pravého horního rohu (bez ohledu na kladné a záporné) základní sazby ).[12] Intuitivním příkladem náhodného hádání je rozhodnutí házením mincí. Jak se velikost vzorku zvětšuje, má ROC bod náhodného klasifikátoru sklon k diagonální linii. V případě vyvážené mince bude mít tendenci k bodu (0,5, 0,5).
Úhlopříčka rozděluje prostor ROC. Body nad úhlopříčkou představují dobré výsledky klasifikace (lepší než náhodné); body pod čarou představují špatné výsledky (horší než náhodné). Všimněte si, že výstup trvale špatného prediktoru lze jednoduše invertovat, abyste získali dobrý prediktor.
Podívejme se na čtyři výsledky predikce ze 100 pozitivních a 100 negativních případů:
A | B | C | C' | ||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
|
|
| ||||||||||||||||||||||||||||||||||||
TPR = 0,63 | TPR = 0,77 | TPR = 0,24 | TPR = 0,76 | ||||||||||||||||||||||||||||||||||||
FPR = 0,28 | FPR = 0,77 | FPR = 0,88 | FPR = 0,12 | ||||||||||||||||||||||||||||||||||||
PPV = 0,69 | PPV = 0,50 | PPV = 0,21 | PPV = 0,86 | ||||||||||||||||||||||||||||||||||||
F1 = 0,66 | F1 = 0,61 | F1 = 0,23 | F1 = 0,81 | ||||||||||||||||||||||||||||||||||||
ACC = 0,68 | ACC = 0,50 | ACC = 0,18 | ACC = 0,82 |
Na obrázku jsou uvedeny grafy výše uvedených čtyř výsledků v prostoru ROC. Výsledek metody A jasně ukazuje nejlepší prediktivní sílu mezi A, B, a C. Výsledek B leží na náhodném odhadu (diagonální čára) a v tabulce je vidět, že přesnost B je 50%. Kdy však C se zrcadlí přes středový bod (0,5,0,5), výsledná metoda C' je ještě lepší než A. Tato zrcadlená metoda jednoduše obrací předpovědi jakékoli metody nebo testu, který způsobil C pohotovostní tabulka. Ačkoli originál C metoda má negativní prediktivní sílu, pouhé obrácení jejích rozhodnutí vede k nové prediktivní metodě C' který má pozitivní prediktivní sílu. Když C metoda předpovídá p nebo n, C' metoda předpovídá n nebo p, resp. Tímto způsobem C' test by fungoval nejlépe. Čím blíže je výsledek z kontingenční tabulky k levému hornímu rohu, tím lépe předpovídá, ale vzdálenost od náhodného odhadu v obou směrech je nejlepším indikátorem toho, kolik prediktivní síly má metoda. Pokud je výsledek pod řádkem (tj. Metoda je horší než náhodný odhad), musí být všechny předpovědi metody obráceny, aby se využila její síla, čímž se výsledek přesune nad linii náhodného odhadu.
Křivky v prostoru ROC
![ROC křivky.svg](http://upload.wikimedia.org/wikipedia/commons/thumb/4/4f/ROC_curves.svg/300px-ROC_curves.svg.png)
V binární klasifikaci se předpověď třídy pro každou instanci často provádí na základě a spojitá náhodná proměnná , což je „skóre“ vypočítané pro instanci (např. odhadovaná pravděpodobnost logistické regrese). Vzhledem k prahovému parametru , instance je klasifikována jako "pozitivní", pokud , a „negativní“ jinak. sleduje hustotu pravděpodobnosti pokud instance skutečně patří do třídy "pozitivní", a pokud jinak. Proto je skutečná kladná sazba dána vztahem a míra falešně pozitivních výsledků je dána vztahem . Křivka ROC vykresluje parametricky TPR (T) versus FPR (T) s T jako proměnným parametrem.
Představte si například, že hladiny bílkovin v krvi jsou u nemocných a zdravých lidí normálně distribuováno pomocí 2 G /dL a 1 g / dl. Lékařský test může měřit hladinu určitého proteinu ve vzorku krve a klasifikovat jakékoli číslo nad určitou prahovou hodnotu jako indikaci onemocnění. Experimentátor může upravit prahovou hodnotu (černá svislá čára na obrázku), což zase změní míru falešně pozitivních výsledků. Zvýšení prahové hodnoty by mělo za následek méně falešných pozitiv (a více falešných negativů), což odpovídá pohybu doleva na křivce. Skutečný tvar křivky je určen tím, kolik překrytí mají obě rozdělení.
Další interpretace
Někdy se ROC používá ke generování souhrnné statistiky. Běžné verze jsou:
- průsečík ROC křivky s přímkou pod úhlem 45 stupňů kolmým k nediskriminační přímce - bod rovnováhy, kde Citlivost = 1 - Specifičnost
- průsečík ROC křivky s tečnou pod úhlem 45 stupňů rovnoběžnou s nediskriminační čárou, která je nejblíže k bezchybnému bodu (0,1) - také nazýván Statistika Youdenovy J. a zobecnit jako informovanost[Citace je zapotřebí ]
- oblast mezi křivkou ROC a čárou bez diskriminace vynásobenou dvěma se nazývá Giniho koeficient. To by nemělo být zaměňováno s míra statistické disperze nazývaná také Giniho koeficient.
- oblast mezi plnou křivkou ROC a trojúhelníkovou křivkou ROC včetně pouze (0,0), (1,1) a jednoho vybraného pracovního bodu (tpr, fpr) - konzistence[13]
- oblast pod křivkou ROC nebo „AUC“ („Area Under Curve“) nebo A '(vyslovuje se „a-prime“),[14] nebo „c-statistika“ („statistika shody“).[15]
- the index citlivosti d ' (vyslovuje se „d-prime“), vzdálenost mezi průměrem rozložení aktivity v systému za podmínek samotného šumu a jeho distribucí za podmínek samotného signálu, dělená jejich standardní odchylka, za předpokladu, že obě tyto distribuce jsou normální se stejnou směrodatnou odchylkou. Za těchto předpokladů je tvar ROC zcela určen d '.
Jakýkoli pokus o shrnutí ROC křivky do jediného čísla však ztratí informace o vzorci kompromisů konkrétního diskriminačního algoritmu.
Plocha pod křivkou
Při použití normalizovaných jednotek se plocha pod křivkou (často označovaná jednoduše jako AUC) rovná pravděpodobnosti, že klasifikátor bude náhodně vybranou pozitivní instanci hodnotit vyšší než náhodně vybranou negativní (za předpokladu, že „pozitivní“ bude vyšší než „ negativní').[16] To lze vidět následovně: plocha pod křivkou je dána vztahem (integrální hranice jsou obráceny, protože velká T má nižší hodnotu na ose x)
kde je skóre pro pozitivní instanci a je skóre pro negativní instanci a a jsou hustoty pravděpodobnosti definované v předchozí části.
Dále lze ukázat, že AUC úzce souvisí s Mann – Whitney U,[17][18] který testuje, zda jsou pozitiva hodnocena vyšší než negativa. Je to také ekvivalentní s Wilcoxonův test hodností.[18] Pro prediktor , nestranný odhad jeho AUC lze vyjádřit následujícím způsobem Wilcoxon-Mann-Whitney statistický[19]:
kde, označuje funkce indikátoru který vrací 1 iff jinak vrátit 0; je soubor negativních příkladů a je soubor pozitivních příkladů.
AUC souvisí s * Giniho koeficientem * () podle vzorce , kde:
Tímto způsobem je možné vypočítat AUC pomocí průměru z řady lichoběžníkových aproximací. by neměla být zaměňována s míra statistické disperze, která se také nazývá Giniho koeficient.
Je také běžné vypočítat plochu pod konvexním trupem ROC (ROC AUCH = ROCH AUC), protože libovolného bodu na úsečce mezi dvěma výsledky predikce lze dosáhnout náhodným použitím jednoho nebo druhého systému s pravděpodobnostmi úměrnými relativní délce opačná složka segmentu.[21] Je také možné převrátit konkávity - stejně jako na obrázku může být horší řešení promítnuto do lepšího řešení; concavities can be reflect in any line segment, but this more extreme form of fusion is much more likely to overfit the data.[22]
The strojové učení komunita nejčastěji používá pro srovnání modelů statistiku ROC AUC.[23] Tato praxe byla zpochybněna, protože odhady AUC jsou docela hlučné a trpí jinými problémy.[24][25][26] Soudržnost AUC jako měřítka agregované klasifikační výkonnosti byla nicméně obhájena, pokud jde o rovnoměrné rozložení sazeb,[27] a AUC byla spojena s řadou dalších metrik výkonu, jako je Brierovo skóre.[28]
Další problém s ROC AUC spočívá v tom, že snížení křivky ROC na jediné číslo ignoruje skutečnost, že jde o kompromisy mezi různými systémy nebo vynesenými výkonovými body, a nikoli o výkon jednotlivého systému, stejně jako ignorování možnosti opravy konkávnosti , takže související alternativní opatření, jako je informovanost[Citace je zapotřebí ] nebo DeltaP jsou doporučeny.[13][29] Tyto míry jsou v podstatě ekvivalentní Gini pro jeden predikční bod s DeltaP '= Informedness = 2AUC-1, zatímco DeltaP = Markedness představuje dvojí (viz. Predikce predikce ze skutečné třídy) a jejich geometrický průměr je Matthewsův korelační koeficient.[Citace je zapotřebí ]
Zatímco ROC AUC se pohybuje mezi 0 a 1 - s neinformativním klasifikátorem dává 0,5 - alternativní opatření známá jako Informovanost,[Citace je zapotřebí ] Jistota [13] a Giniho koeficient (v případě jedné parametrizace nebo jednoho systému)[Citace je zapotřebí ] všichni mají tu výhodu, že 0 představuje náhodný výkon, zatímco 1 představuje dokonalý výkon a −1 představuje „zvrácený“ případ plné informovanosti, který vždy dává nesprávnou odpověď.[30] Zvýšení náhodného výkonu na 0 umožňuje tyto alternativní stupnice interpretovat jako statistiku Kappa. Ukázalo se, že informovanost má žádoucí vlastnosti pro strojové učení oproti jiným běžným definicím Kappa, jako je Cohen Kappa a Fleiss Kappa.[Citace je zapotřebí ][31]
Někdy může být užitečnější podívat se na konkrétní oblast ROC křivky než na celou křivku. Je možné vypočítat částečnou AUC.[32] Například by se dalo zaměřit na oblast křivky s nízkou mírou falešně pozitivních výsledků, která je často primárně zajímavá pro screeningové testy populace.[33] Dalším běžným přístupem ke klasifikačním problémům, při kterém P ≪ N (běžný v bioinformatických aplikacích), je použití logaritmické stupnice pro osu x.[34]
Rovněž se nazývá oblast ROC pod křivkou c-statistika nebo c statistika.[35]
Další opatření
![](http://upload.wikimedia.org/wikipedia/commons/thumb/9/9b/TOC.png/220px-TOC.png)
The Celková provozní charakteristika (TOC) také charakterizuje diagnostické schopnosti a odhaluje více informací než ROC. Pro každou prahovou hodnotu ROC odhaluje dva poměry, TP / (TP + FN) a FP / (FP + TN). Jinými slovy, ROC odhaluje zásahy / (zásahy + zmeškání) a falešné poplachy / (falešné poplachy + správné odmítnutí). Na druhou stranu TOC zobrazuje celkové informace v kontingenční tabulce pro každou prahovou hodnotu.[36] Metoda TOC odhaluje všechny informace, které metoda ROC poskytuje, plus další důležité informace, které ROC neodhalí, tj. Velikost každé položky v kontingenční tabulce pro každou prahovou hodnotu. TOC také poskytuje populární AUC ROC.[37]
![](http://upload.wikimedia.org/wikipedia/commons/thumb/6/69/ROC.png/220px-ROC.png)
Jedná se o křivky TOC a ROC se stejnými daty a prahovými hodnotami. Zvažte bod, který odpovídá prahové hodnotě 74. Křivka TOC ukazuje počet zásahů, což je 3, a tedy počet zmeškaných, což je 7. Křivka TOC navíc ukazuje, že počet falešných poplachů je 4 a počet správných odmítnutí je 16. V kterémkoli daném bodě v křivce ROC je možné shromáždit hodnoty pro poměry falešných poplachů / (falešné poplachy + správné odmítnutí) a zásahy / (zásahy + neúspěchy). Například na prahu 74 je zřejmé, že souřadnice x je 0,2 a souřadnice y je 0,3. Tyto dvě hodnoty však nejsou dostatečné k vytvoření všech položek podkladové kontingenční tabulky dva po dvou.
Graf detekce chyby kompromisu
![](http://upload.wikimedia.org/wikipedia/commons/thumb/8/8d/Example_of_DET_curves.png/220px-Example_of_DET_curves.png)
Alternativou ke křivce ROC je detekční chyba kompromis (DET) graf, který vykresluje míru falešně negativních výsledků (zmeškané detekce) vs. míru falešně pozitivních výsledků (falešné poplachy) na nelineárně transformovaných osách x a y. Transformační funkce je kvantilová funkce normálního rozdělení, tj. Inverzní funkce kumulativního normálního rozdělení. Je to ve skutečnosti stejná transformace jako zROC níže, s výjimkou toho, že se používá doplněk rychlosti zásahu, rychlosti chybět nebo falešně negativní rychlosti. Tato alternativa utrácí více oblasti grafu v oblasti zájmu. Většina oblasti ROC je málo zajímavá; jeden se primárně stará o oblast těsně přiléhající k ose y a levém horním rohu - což je z důvodu použití chybné rychlosti místo jejího doplňku, rychlosti zásahu, levý dolní roh v grafu DET. Kromě toho mají grafy DET užitečnou vlastnost linearity a lineárního prahového chování pro normální rozdělení.[38] DET plot je široce používán v automatické rozpoznávání reproduktorů komunita, kde byl poprvé použit název DET. Analýzu výkonu ROC v grafech s tímto zkroucením os použili psychologové ve studiích vnímání v polovině 20. století,[Citace je zapotřebí ] kde to bylo nazváno „papír s dvojitou pravděpodobností“.[39]
Z-skóre
Pokud standardní skóre se použije na křivku ROC, křivka se transformuje do přímky.[40] Toto z-skóre je založeno na normálním rozdělení s průměrem nula a standardní odchylkou jedna. V paměti teorie síly, je třeba předpokládat, že zROC není pouze lineární, ale má sklon 1,0. Normální rozdělení cílů (studované objekty, které si subjekty musí vybavit) a návnad (nestudované objekty, které se subjekty pokoušejí vybavit) je faktorem, který způsobuje, že zROC je lineární.
Linearita křivky zROC závisí na směrodatných odchylkách rozdělení cíle a síly nástrahy. Pokud jsou standardní odchylky stejné, bude sklon 1,0. Pokud je směrodatná odchylka rozložení cílové síly větší než směrodatná odchylka rozložení síly návnady, bude sklon menší než 1,0. Ve většině studií bylo zjištěno, že sklony křivky zROC neustále klesají pod 1, obvykle mezi 0,5 a 0,9.[41] Mnoho experimentů poskytlo sklon zROC 0,8. Sklon 0,8 znamená, že variabilita distribuce cílové síly je o 25% větší než variabilita distribuce síly nástrahy.[42]
Další použitá proměnná jed ' (d prime) (popsáno výše v části „Další míry“), kterou lze snadno vyjádřit z-hodnotami. Ačkoli d„je běžně používaný parametr, je třeba si uvědomit, že je relevantní pouze při přísném dodržování výše uvedených velmi silných předpokladů teorie pevnosti.[43]
Z-skóre ROC křivky je vždy lineární, jak se předpokládá, s výjimkou zvláštních situací. Yonelinasův model známosti a vzpomínání je dvourozměrný popis paměti rozpoznávání. Místo toho, aby subjekt jednoduše odpověděl ano nebo ne na konkrétní vstup, dává subjekt vstupu pocit důvěrnosti, který funguje jako původní křivka ROC. Co se však mění, je parametr pro Recollection (R). Vzpomínka je považována za vše-nebo-žádnou a převyšuje známost. Pokud by neexistovala žádná složka vzpomínky, měl by zROC předpovídaný sklon 1. Avšak při přidání složky vzpomínky bude křivka zROC konkávní nahoru se sníženým sklonem. Tento rozdíl ve tvaru a sklonu je výsledkem přidaného prvku variability kvůli tomu, že některé položky jsou znovu vybrány. Pacienti s anterográdní amnézií si nemohou vzpomenout, takže jejich křivka Yonelinas zROC by měla sklon blízký 1,0.[44]
Dějiny
Křivka ROC byla poprvé použita během druhá světová válka pro analýzu radarové signály před jeho zaměstnáním v teorie detekce signálu.[45] V návaznosti na útok na Pearl Harbor v roce 1941 zahájila armáda Spojených států nový výzkum s cílem zvýšit predikci správně detekovaných japonských letadel z jejich radarových signálů. Pro tyto účely měřili schopnost operátora radaru přijímat tyto důležité rozdíly, které se nazývaly provozní charakteristiky přijímače.[46]
V padesátých letech byly v ROC použity křivky psychofyzika posoudit detekci slabých signálů u člověka (a příležitostně u jiných zvířat).[45] v lék, ROC analýza byla široce používána při hodnocení diagnostické testy.[47][48] ROC křivky jsou také hojně používány v epidemiologie a lékařský výzkum a jsou často zmiňovány ve spojení s medicína založená na důkazech. v radiologie „Analýza ROC je běžnou technikou pro hodnocení nových radiologických technik.[49] V sociálních vědách se analýza ROC často nazývá ROC Accuracy Ratio, běžná technika pro posuzování přesnosti výchozích modelů pravděpodobnosti. Křivky ROC se v laboratorní medicíně široce používají k hodnocení diagnostické přesnosti testu, k volbě optimální mimo test a porovnat diagnostickou přesnost několika testů.
ROC křivky se také ukázaly jako užitečné pro hodnocení strojové učení techniky. První aplikací ROC ve strojovém učení byl Spackman, který prokázal hodnotu ROC křivek při porovnávání a hodnocení různých klasifikací algoritmy.[50]
ROC křivky se také používají při ověřování předpovědí v meteorologii.[51]
ROC křivky nad binární klasifikaci
Rozšíření křivek ROC pro problémy klasifikace s více než dvěma třídami bylo vždy těžkopádné, protože stupně volnosti se kvadraticky zvyšovaly s počtem tříd a prostor ROC rozměry, kde je počet tříd.[52] Pro konkrétní případ byly provedeny některé přístupy se třemi třídami (třícestný ROC).[53] Výpočet objemu pod povrchem ROC (VUS) byl analyzován a studován jako metrika výkonu pro problémy s více třídami.[54] Kvůli složitosti aproximace skutečné VUS však existují některé další přístupy [55] založené na rozšíření AUC jsou populárnější jako hodnotící metrika.
Vzhledem k úspěchu ROC křivek pro hodnocení klasifikačních modelů bylo zkoumáno také rozšíření ROC křivek pro další supervizované úkoly. Pozoruhodné návrhy na regresní problémy jsou takzvané křivky charakteristiky regrese (REC) [56] a křivky regrese ROC (RROC).[57] Ve druhém případě se křivky RROC stávají extrémně podobnými křivkám ROC pro klasifikaci s pojmy asymetrie, dominance a konvexního trupu. Rovněž oblast pod RROC křivkami je úměrná odchylce chyb regresního modelu.
Viz také
![]() | Wikimedia Commons má média související s Provozní charakteristika přijímače. |
- Brierovo skóre
- Koeficient stanovení
- Konstantní míra falešného poplachu
- Chyba detekce kompromisu
- Teorie detekce
- Skóre F1
- Falešný poplach
- Přesnost a odvolání
- ROCCET
- Celková provozní charakteristika
Reference
- ^ Fawcett, Tom (2006). „Úvod do analýzy ROC“ (PDF). Písmena pro rozpoznávání vzorů. 27 (8): 861–874. doi:10.1016 / j.patrec.2005.10.010.
- ^ Powers, David M W (2011). „Hodnocení: Od přesnosti, odvolání a měření F k ROC, informovanosti, známosti a korelaci“. Journal of Machine Learning Technologies. 2 (1): 37–63.
- ^ Ting, Kai Ming (2011). Sammut, Claude; Webb, Geoffrey I (eds.). Encyklopedie strojového učení. Springer. doi:10.1007/978-0-387-30164-8. ISBN 978-0-387-30164-8.
- ^ Brooks, Harold; Brown, Barb; Ebert, Beth; Ferro, Chris; Jolliffe, Ian; Koh, Tieh-Yong; Roebber, Paul; Stephenson, David (26.01.2015). „Společná pracovní skupina WWRP / WGNE pro výzkum ověřování prognóz“. Spolupráce pro australský výzkum počasí a klimatu. Světová meteorologická organizace. Citováno 2019-07-17.
- ^ Chicco D, Jurman G (leden 2020). „Výhody Matthewsova korelačního koeficientu (MCC) oproti skóre F1 a přesnosti při hodnocení binární klasifikace“. BMC Genomics. 21 (1): 6-1–6-13. doi:10.1186 / s12864-019-6413-7. PMC 6941312. PMID 31898477.
- ^ Tharwat A (srpen 2018). „Metody hodnocení klasifikace“. Aplikovaná výpočetní technika a informatika. doi:10.1016 / j.aci.2018.08.003.
- ^ A b „Analýza výkonu detektoru pomocí ROC křivek - příklad MATLAB & Simulink“. www.mathworks.com. Citováno 11. srpna 2016.
- ^ Peres, D. J .; Cancelliere, A. (8. 12. 2014). „Odvození a vyhodnocení prahů způsobujících sesuv půdy přístupem Monte Carlo“. Hydrol. Earth Syst. Sci. 18 (12): 4913–4931. Bibcode:2014HESS ... 18.4913P. doi:10.5194 / hess-18-4913-2014. ISSN 1607-7938.
- ^ Murphy, Allan H. (01.03.1996). „The Finley Affair: a Signal Event in the History of Forecast Verification“. Počasí a předpovědi. 11 (1): 3–20. Bibcode:1996 WtFor..11 .... 3M. doi:10.1175 / 1520-0434 (1996) 011 <0003: tfaase> 2.0.co; 2. ISSN 0882-8156.
- ^ Peres, D. J .; Iuppa, C .; Cavallaro, L .; Cancelliere, A .; Foti, E. (01.10.2015). Msgstr "Významné rozšíření záznamu výšky vlny o neuronové sítě a údaje o reanalyzačním větru". Oceánské modelování. 94: 128–140. Bibcode:2015OcMod..94..128P. doi:10.1016 / j.ocemod.2015.08.002.
- ^ Swets, John A .; Teorie detekce signálu a analýza ROC v psychologii a diagnostice: shromážděné práce Lawrence Erlbaum Associates, Mahwah, NJ, 1996
- ^ "klasifikace - AUC-ROC náhodného klasifikátoru". Výměna datových věd. Citováno 2020-11-30.
- ^ A b C Powers, David MW (2012). „ROC-ConCert: Měření konzistence a jistoty na základě ROC“ (PDF). Jarní kongres o strojírenství a technologii (SCET). 2. IEEE. 238–241.
- ^ Fogarty, James; Baker, Ryan S .; Hudson, Scott E. (2005). „Případové studie s využitím analýzy křivky ROC pro odhady založené na senzorech v interakci člověka s počítačem“. ACM International Conference Proceeding Series, Proceedings of Graphics Interface 2005. Waterloo, ON: Kanadská společnost pro komunikaci mezi člověkem a počítačem.
- ^ Hastie, Trevor; Tibshirani, Robert; Friedman, Jerome H. (2009). Prvky statistického učení: dolování dat, inference a predikce (2. vyd.).
- ^ Fawcett, Tom (2006); Úvod do analýzy ROC „Dopisy pro rozpoznávání vzorů, 27, 861–874.
- ^ Hanley, James A .; McNeil, Barbara J. (1982). "Význam a využití oblasti pod křivkou provozních charakteristik přijímače (ROC)". Radiologie. 143 (1): 29–36. doi:10.1148 / radiology.143.1.7063747. PMID 7063747. S2CID 10511727.
- ^ A b Mason, Simon J .; Graham, Nicholas E. (2002). „Oblasti pod křivkami relativních provozních charakteristik (ROC) a relativních provozních úrovní (ROL): Statistická významnost a interpretace“ (PDF). Quarterly Journal of the Royal Meteorological Society. 128 (584): 2145–2166. Bibcode:2002QJRMS.128.2145M. CiteSeerX 10.1.1.458.8392. doi:10.1256/003590002320603584. Archivovány od originál (PDF) dne 2008-11-20.
- ^ Calders, Toon; Jaroszewicz, Szymon (2007). Kok, Joost N .; Koronacki, Jacek; Lopez de Mantaras, Ramon; Matwin, Stan; Mladenič, Dunja; Skowron, Andrzej (eds.). „Efektivní optimalizace AUC pro klasifikaci“. Zjištění znalostí v databázích: PKDD 2007. Přednášky z informatiky. Berlín, Heidelberg: Springer. 4702: 42–53. doi:10.1007/978-3-540-74976-9_8. ISBN 978-3-540-74976-9.
- ^ Hand, David J .; a Till, Robert J. (2001); Jednoduché zobecnění oblasti pod křivkou ROC pro problémy klasifikace více tříd, Machine Learning, 45, 171–186.
- ^ Provost, F .; Fawcett, T. (2001). "Robustní klasifikace pro nepřesná prostředí". Strojové učení. 42 (3): 203–231. arXiv:cs / 0009007. doi:10.1023 / a: 1007601015854. S2CID 5415722.
- ^ Flach, P.A .; Wu, S. (2005). "Oprava konkávností v ROC křivkách." (PDF). 19. mezinárodní společná konference o umělé inteligenci (IJCAI'05). 702–707.
- ^ Hanley, James A .; McNeil, Barbara J. (01.09.1983). „Metoda porovnání ploch pod křivkami provozních charakteristik přijímače odvozených ze stejných případů“. Radiologie. 148 (3): 839–843. doi:10.1148 / radiology.148.3.6878708. PMID 6878708.
- ^ Hanczar, Blaise; Hua, Jianping; Sima, Chao; Weinstein, John; Bittner, Michael; Dougherty, Edward R (2010). „Přesnost malých odhadů odhadů souvisejících s ROC“. Bioinformatika. 26 (6): 822–830. doi:10.1093 / bioinformatika / btq037. PMID 20130029.
- ^ Lobo, Jorge M .; Jiménez-Valverde, Alberto; Real, Raimundo (2008). „AUC: zavádějící měřítko výkonnosti prediktivních distribučních modelů“. Globální ekologie a biogeografie. 17 (2): 145–151. doi:10.1111 / j.1466-8238.2007.00358.x. S2CID 15206363.
- ^ Hand, David J (2009). „Měření výkonu klasifikátoru: Koherentní alternativa k oblasti pod křivkou ROC“. Strojové učení. 77: 103–123. doi:10.1007 / s10994-009-5119-5.
- ^ Flach, P.A .; Hernandez-Orallo, J .; Ferri, C. (2011). „Koherentní interpretace AUC jako měřítka agregovaného výkonu klasifikace.“ (PDF). Sborník z 28. mezinárodní konference o strojovém učení (ICML-11). 657–664.
- ^ Hernandez-Orallo, J .; Flach, P.A .; Ferri, C. (2012). "A unified view of performance metrics: translating threshold choice into expected classification loss" (PDF). Journal of Machine Learning Research. 13: 2813–2869.
- ^ Powers, David M.W. (2012). "The Problem of Area Under the Curve". International Conference on Information Science and Technology.
- ^ Powers, David M. W. (2003). "Recall and Precision versus the Bookmaker" (PDF). Proceedings of the International Conference on Cognitive Science (ICSC-2003), Sydney Australia, 2003, pp. 529–534.
- ^ Powers, David M. W. (2012). "The Problem with Kappa" (PDF). Conference of the European Chapter of the Association for Computational Linguistics (EACL2012) Joint ROBUS-UNSUP Workshop. Archivovány od originál (PDF) dne 2016-05-18. Citováno 2012-07-20.
- ^ McClish, Donna Katzman (1989-08-01). "Analyzing a Portion of the ROC Curve". Medical Decision Making. 9 (3): 190–195. doi:10.1177/0272989X8900900307. PMID 2668680. S2CID 24442201.
- ^ Dodd, Lori E.; Pepe, Margaret S. (2003). "Partial AUC Estimation and Regression". Biometrie. 59 (3): 614–623. doi:10.1111/1541-0420.00071. PMID 14601762.
- ^ Karplus, Kevin (2011); Better than Chance: the importance of null models, University of California, Santa Cruz, in Proceedings of the First International Workshop on Pattern Recognition in Proteomics, Structural Biology and Bioinformatics (PR PS BB 2011)
- ^ "C-Statistic: Definition, Examples, Weighting and Significance". Statistics How To. 28. srpna 2016.
- ^ Pontius, Robert Gilmore; Parmentier, Benoit (2014). "Recommendations for using the Relative Operating Characteristic (ROC)". Landscape Ecology. 29 (3): 367–382. doi:10.1007/s10980-013-9984-8. S2CID 15924380.
- ^ Pontius, Robert Gilmore; Si, Kangping (2014). "The total operating characteristic to measure diagnostic ability for multiple thresholds". International Journal of Geographical Information Science. 28 (3): 570–583. doi:10.1080/13658816.2013.862623. S2CID 29204880.
- ^ Navratil, J.; Klusacek, D. (2007-04-01). On Linear DETs. 2007 IEEE International Conference on Acoustics, Speech and Signal Processing - ICASSP '07. 4. pp. IV–229–IV–232. doi:10.1109/ICASSP.2007.367205. ISBN 978-1-4244-0727-9. S2CID 18173315.
- ^ Dev P. Chakraborty (December 14, 2017). "double+probability+paper"&pg=PT214 Observer Performance Methods for Diagnostic Imaging: Foundations, Modeling, and Applications with R-Based Examples. CRC Press. p. 214. ISBN 9781351230711. Citováno 11. července 2019.
- ^ MacMillan, Neil A.; Creelman, C. Douglas (2005). Detection Theory: A User's Guide (2. vyd.). Mahwah, NJ: Lawrence Erlbaum Associates. ISBN 978-1-4106-1114-7.
- ^ Glanzer, Murray; Kisok, Kim; Hilford, Andy; Adams, John K. (1999). "Slope of the receiver-operating characteristic in recognition memory". Journal of Experimental Psychology: Learning, Memory, and Cognition. 25 (2): 500–513. doi:10.1037/0278-7393.25.2.500.
- ^ Ratcliff, Roger; McCoon, Gail; Tindall, Michael (1994). "Empirical generality of data from recognition memory ROC functions and implications for GMMs". Journal of Experimental Psychology: Learning, Memory, and Cognition. 20 (4): 763–785. CiteSeerX 10.1.1.410.2114. doi:10.1037/0278-7393.20.4.763.
- ^ Zhang, červen; Mueller, Shane T. (2005). "A note on ROC analysis and non-parametric estimate of sensitivity". Psychometrika. 70: 203–212. CiteSeerX 10.1.1.162.1515. doi:10.1007/s11336-003-1119-8. S2CID 122355230.
- ^ Yonelinas, Andrew P.; Kroll, Neal E. A.; Dobbins, Ian G.; Lazzara, Michele; Knight, Robert T. (1998). "Recollection and familiarity deficits in amnesia: Convergence of remember-know, process dissociation, and receiver operating characteristic data". Neuropsychologie. 12 (3): 323–339. doi:10.1037/0894-4105.12.3.323. PMID 9673991.
- ^ A b Green, David M.; Swets, John A. (1966). Signal detection theory and psychophysics. New York, NY: John Wiley and Sons Inc. ISBN 978-0-471-32420-1.
- ^ "Using the Receiver Operating Characteristic (ROC) curve to analyze a classification model: A final note of historical interest" (PDF). Katedra matematiky, University of Utah. Katedra matematiky, University of Utah. Citováno 25. května 2017.
- ^ Zweig, Mark H.; Campbell, Gregory (1993). "Receiver-operating characteristic (ROC) plots: a fundamental evaluation tool in clinical medicine" (PDF). Klinická chemie. 39 (8): 561–577. doi:10.1093/clinchem/39.4.561. PMID 8472349.
- ^ Pepe, Margaret S. (2003). The statistical evaluation of medical tests for classification and prediction. New York, NY: Oxford. ISBN 978-0-19-856582-6.
- ^ Obuchowski, Nancy A. (2003). "Receiver operating characteristic curves and their use in radiology". Radiologie. 229 (1): 3–8. doi:10.1148/radiol.2291010898. PMID 14519861.
- ^ Spackman, Kent A. (1989). "Signal detection theory: Valuable tools for evaluating inductive learning". Proceedings of the Sixth International Workshop on Machine Learning. San Mateo, CA: Morgan Kaufmann. pp. 160–163.
- ^ Kharin, Viatcheslav (2003). "On the ROC score of probability forecasts". Journal of Climate. 16 (24): 4145–4150. Bibcode:2003JCli...16.4145K. doi:10.1175/1520-0442(2003)016<4145:OTRSOP>2.0.CO;2.
- ^ Srinivasan, A. (1999). "Note on the Location of Optimal Classifiers in N-dimensional ROC Space". Technical Report PRG-TR-2-99, Oxford University Computing Laboratory, Wolfson Building, Parks Road, Oxford. CiteSeerX 10.1.1.35.703.
- ^ Mossman, D. (1999). "Three-way ROCs". Medical Decision Making. 19 (1): 78–89. doi:10.1177/0272989x9901900110. PMID 9917023. S2CID 24623127.
- ^ Ferri, C.; Hernandez-Orallo, J.; Salido, M.A. (2003). "Volume under the ROC Surface for Multi-class Problems". Machine Learning: ECML 2003. pp. 108–120.
- ^ Till, D.J.; Hand, R.J. (2001). "A Simple Generalisation of the Area Under the ROC Curve for Multiple Class Classification Problems". Machine Learning. 45 (2): 171–186. doi:10.1023/A:1010920819831.
- ^ Bi, J.; Bennett, K.P. (2003). "Regression error characteristic curves" (PDF). Twentieth International Conference on Machine Learning (ICML-2003). Washington DC.
- ^ Hernandez-Orallo, J. (2013). "ROC curves for regression". Rozpoznávání vzorů. 46 (12): 3395–3411. doi:10.1016/j.patcog.2013.06.014. hdl:10251/40252.
externí odkazy
- ROC demo
- another ROC demo
- ROC video explanation
- An Introduction to the Total Operating Characteristic: Utility in Land Change Model Evaluation
- How to run the TOC Package in R
- TOC R package on Github
- Excel Workbook for generating TOC curves
Další čtení
- Balakrishnan, Narayanaswamy (1991); Handbook of the Logistic Distribution, Marcel Dekker, Inc., ISBN 978-0-8247-8587-1
- Brown, Christopher D.; Davis, Herbert T. (2006). "Receiver operating characteristic curves and related decision measures: a tutorial". Chemometrie a inteligentní laboratorní systémy. 80: 24–38. doi:10.1016/j.chemolab.2005.05.004.
- Rotello, Caren M.; Heit, Evan; Dubé, Chad (2014). "When more data steer us wrong: replications with the wrong dependent measure perpetuate erroneous conclusions" (PDF). Psychonomic Bulletin & Review. 22 (4): 944–954. doi:10.3758/s13423-014-0759-2. PMID 25384892. S2CID 6046065.
- Fawcett, Tom (2004). "ROC Graphs: Notes and Practical Considerations for Researchers" (PDF). Písmena pro rozpoznávání vzorů. 27 (8): 882–891. CiteSeerX 10.1.1.145.4649. doi:10.1016/j.patrec.2005.10.012.
- Gonen, Mithat (2007); Analyzing Receiver Operating Characteristic Curves Using SAS, SAS Press, ISBN 978-1-59994-298-8
- Green, William H., (2003) Econometric Analysis, fifth edition, Prentice Hall, ISBN 0-13-066189-9
- Heagerty, Patrick J.; Lumley, Thomas; Pepe, Margaret S. (2000). "Time-dependent ROC Curves for Censored Survival Data and a Diagnostic Marker". Biometrie. 56 (2): 337–344. doi:10.1111/j.0006-341x.2000.00337.x. PMID 10877287. S2CID 8822160.
- Hosmer, David W.; and Lemeshow, Stanley (2000); Applied Logistic Regression, 2nd ed., New York, NY: Wiley, ISBN 0-471-35632-8
- Lasko, Thomas A.; Bhagwat, Jui G.; Zou, Kelly H.; Ohno-Machado, Lucila (2005). "The use of receiver operating characteristic curves in biomedical informatics". Časopis biomedicínské informatiky. 38 (5): 404–415. CiteSeerX 10.1.1.97.9674. doi:10.1016/j.jbi.2005.02.008. PMID 16198999.
- Mas, Jean-François; Filho, Britaldo Soares; Pontius, Jr, Robert Gilmore; Gutiérrez, Michelle Farfán; Rodrigues, Hermann (2013). "A suite of tools for ROC analysis of spatial models". ISPRS International Journal of Geo-Information. 2 (3): 869–887. Bibcode:2013IJGI....2..869M. doi:10.3390/ijgi2030869.
- Pontius, Jr, Robert Gilmore; Parmentier, Benoit (2014). "Recommendations for using the Relative Operating Characteristic (ROC)". Landscape Ecology. 29 (3): 367–382. doi:10.1007/s10980-013-9984-8. S2CID 15924380.
- Pontius, Jr, Robert Gilmore; Pacheco, Pablo (2004). "Calibration and validation of a model of forest disturbance in the Western Ghats, India 1920–1990". GeoJournal. 61 (4): 325–334. doi:10.1007/s10708-004-5049-5. S2CID 155073463.
- Pontius, Jr, Robert Gilmore; Batchu, Kiran (2003). "Using the relative operating characteristic to quantify certainty in prediction of location of land cover change in India". Transakce v GIS. 7 (4): 467–484. doi:10.1111/1467-9671.00159. S2CID 14452746.
- Pontius, Jr, Robert Gilmore; Schneider, Laura (2001). "Land-use change model validation by a ROC method for the Ipswich watershed, Massachusetts, USA". Zemědělství, ekosystémy a životní prostředí. 85 (1–3): 239–248. doi:10.1016/S0167-8809(01)00187-6.
- Stephan, Carsten; Wesseling, Sebastian; Schink, Tania; Jung, Klaus (2003). "Comparison of Eight Computer Programs for Receiver-Operating Characteristic Analysis". Klinická chemie. 49 (3): 433–439. doi:10.1373/49.3.433. PMID 12600955.
- Swets, John A.; Dawes, Robyn M.; and Monahan, John (2000); Better Decisions through Science, Scientific American, October, pp. 82–87
- Zou, Kelly H.; O'Malley, A. James; Mauri, Laura (2007). "Receiver-operating characteristic analysis for evaluating diagnostic tests and predictive models". Oběh. 115 (5): 654–7. doi:10.1161/circulationaha.105.594929. PMID 17283280.
- Zhou, Xiao-Hua; Obuchowski, Nancy A.; McClish, Donna K. (2002). Statistical Methods in Diagnostic Medicine. New York, NY: Wiley & Sons. ISBN 978-0-471-34772-9.