Přesnost a preciznost - Accuracy and precision

Při měření sady přesnost je blízkost měření k určité hodnotě, zatímco přesnost je vzájemná blízkost měření.

Přesnost má dvě definice:

  1. Běžněji se jedná o popis systematické chyby, míra statistické zkreslení; nízká přesnost způsobí rozdíl mezi výsledkem a „skutečnou“ hodnotou. ISO volá to pravdivost.
  2. Alternativně definuje ISO[1] přesnost popisu kombinace obou typů pozorovací chyba výše (náhodné a systematické), takže vysoká přesnost vyžaduje vysokou přesnost i vysokou pravdivost.

Přesnost je popis náhodné chyby, míra statistická variabilita.

Jednoduše řečeno, vzhledem k sadě datových bodů z opakovaných měření stejné veličiny lze o sadě říci, že je přesný pokud se jejich průměr blíží k skutečná hodnota měřené veličiny, přičemž lze o soupravě říci, že je přesný pokud jsou hodnoty blízko u sebe. V první, běžnější definici „přesnosti“ výše jsou tyto dva pojmy nezávislé na sobě, takže o konkrétní sadě dat lze říci, že jsou buď přesné, nebo přesné, nebo obojí, nebo ani jedno.

Společná technická definice

Přesnost je blízkost výsledků měření ke skutečné hodnotě; přesnost je míra, do jaké opakoval (nebo reprodukovatelné ) měření za nezměněných podmínek ukazují stejné výsledky.

V polích Věda a inženýrství, přesnost a měření systém je míra blízkosti měření a Množství to množství je pravda hodnota.[2] Přesnost měřicího systému související s reprodukovatelnost a opakovatelnost, je míra, do jaké opakovaná měření za nezměněných podmínek ukazují to samé Výsledek.[2][3] Ačkoli dvě slova přesnost a přesnost mohou být synonymní v hovorový použití, jsou záměrně kontrastovány v kontextu vědecká metoda.

Pole statistika, kde interpretace měření hraje ústřední roli, dává přednost použití termínů zaujatost a variabilita místo přesnosti a přesnosti: zkreslení je míra nepřesnosti a variabilita je míra nepřesnosti.

Měřicí systém může být přesný, ale ne přesný, přesný, ale nepřesný, ani obojí. Například pokud experiment obsahuje a systematická chyba, pak zvyšuje velikost vzorku obecně zvyšuje přesnost, ale nezlepšuje přesnost. Výsledkem by byl konzistentní, ale nepřesný řetězec výsledků chybného experimentu. Odstranění systematické chyby zlepšuje přesnost, ale nemění přesnost.

Uvažuje se systém měření platný pokud je to obojí přesný a přesný. Související pojmy zahrnují zaujatost (ne-náhodný nebo směrované účinky způsobené faktorem nebo faktory nesouvisejícími s nezávislé proměnné ) a chyba (náhodná variabilita).

Terminologie se aplikuje také na nepřímá měření - tj. Na hodnoty získané výpočtovým postupem z pozorovaných dat.

Kromě přesnosti a přesnosti mohou mít měření také a rozlišení měření, což je nejmenší změna základní fyzikální veličiny, která vytváří odezvu na měření.

v numerická analýza, přesnost je také blízkost výpočtu ke skutečné hodnotě; zatímco přesnost je rozlišení reprezentace, obvykle definované počtem desetinných nebo binárních číslic.

Z vojenského hlediska se přesnost týká především přesnosti střelby (justesse de tir), přesnost střelby vyjádřená blízkostí seskupení střel do středu cíle a kolem něj.[4]

Kvantifikace

V průmyslových přístrojích je přesnost tolerancí měření nebo přenosem přístroje a definuje limity chyb, ke kterým dochází při používání přístroje za normálních provozních podmínek.[5]

V ideálním případě je měřicí zařízení přesné a přesné, přičemž měření jsou téměř stejná a těsně seskupená kolem skutečné hodnoty. Přesnost a přesnost procesu měření se obvykle stanoví opakovaným měřením některých sledovatelné odkaz Standard. Tyto standardy jsou definovány v Mezinárodní systém jednotek (zkráceně SI z francouzštiny: Système international d'unités) a udržováno národními normalizační organizace tak jako Národní institut pro standardy a technologie ve Spojených státech.

To platí také při opakování a zprůměrování měření. V takovém případě termín standardní chyba je správně aplikováno: přesnost průměru se rovná známé standardní odchylce procesu dělené druhou odmocninou počtu průměrovaných měření. Dále teorém centrálního limitu ukazuje, že rozdělení pravděpodobnosti průměrovaných měření bude blíže normálnímu rozdělení než u jednotlivých měření.

Pokud jde o přesnost, můžeme rozlišit:

  • rozdíl mezi znamenat z měření a referenční hodnoty, zaujatost. Stanovení a náprava zkreslení je nezbytná pro kalibrace.
  • kombinovaný účinek toho a přesnosti.

Běžnou konvencí ve vědě a inženýrství je vyjádření přesnosti a / nebo přesnosti implicitně pomocí významné postavy. Pokud to není výslovně uvedeno, rozumí se mírou chyby poloviční hodnota posledního významného místa. Například záznam 843,6 m nebo 843,0 m nebo 800,0 m by znamenal rozpětí 0,05 m (poslední významné místo je desáté místo), zatímco záznam 843 m by znamenal odchylku 0,5 m ( poslední významné číslice jsou jednotky).

Čtení 8 000 m, s koncovými nulami a bez desetinné čárky, je nejednoznačné; koncové nuly mohou nebo nemusí být zamýšleny jako významné číslice. Aby se předešlo této nejednoznačnosti, mohl by být počet reprezentován vědeckou notací: 8,0 × 103 m označuje, že první nula je významná (tudíž okraj 50 m), zatímco 8 000 × 103 m označuje, že všechny tři nuly jsou významné, s rozpětím 0,5 m. Podobně lze použít násobek základní měrné jednotky: 8,0 km odpovídá 8,0 × 103 m. Znamená to rozpětí 0,05 km (50 m). Spoléhání se na tuto konvenci však může vést k falešná přesnost chyby při přijímání dat ze zdrojů, které se jimi neřídí. Například zdroj vykazující číslo jako 153 753 s přesností +/- 5 000 vypadá, že má přesnost +/- 0,5. Podle úmluvy by to bylo zaokrouhleno na 154 000.

Alternativně, ve vědeckém kontextu, je-li žádoucí určit míru chyby s větší přesností, lze použít notaci, například 7.54398 (23) × 10-10 m, což znamená rozsah mezi 7,54375 a 7,54421 × 10-10 m.

Přesnost zahrnuje:

  • opakovatelnost - variace vznikající při vynaložení veškerého úsilí k udržení stálých podmínek pomocí stejného nástroje a operátora a opakování během krátké doby; a
  • reprodukovatelnost - odchylky vznikající za použití stejného procesu měření mezi různými nástroji a operátory a po delší časové období.

Definice ISO (ISO 5725)

Podle ISO 5725-1 se přesnost skládá z pravdivosti (blízkost výsledků měření ke skutečné hodnotě) a přesnosti (opakovatelnost nebo reprodukovatelnost měření)

Posun ve smyslu těchto pojmů nastal vydáním řady norem ISO 5725 v roce 1994, což se odráží také v čísle „BIPM International Vocabulary of Metrology“ (VIM) z roku 2008, položky 2.13 a 2.14.[2]

Podle ISO 5725-1,[1] obecný termín „přesnost“ se používá k popisu blízkosti měření ke skutečné hodnotě. Když je termín aplikován na sady měření stejných měřená veličina, zahrnuje komponentu náhodné chyby a komponentu systematické chyby. V tomto případě pravdivost je blízkost průměru souboru výsledků měření ke skutečné (skutečné) hodnotě a přesnost je blízkost shody mezi souborem výsledků.

ISO 5725-1 a VIM se rovněž vyhýbají použití výrazu „zaujatost ", dříve uvedeno v BS 5497-1,[6] protože má jiné konotace mimo oblasti vědy a techniky, jako v medicíně a právu.

V binární klasifikaci

Přesnost se také používá jako statistické měřítko toho, jak dobře a binární klasifikace test správně identifikuje nebo vylučuje podmínku. To znamená, že přesnost je podíl správných předpovědí (obojí skutečná pozitiva a skutečné negativy ) z celkového počtu zkoumaných případů.[7] Aby byl kontext sémantikou jasný, často se označuje jako „přesnost Rand“ nebo „Randův index ".[8][9][10] Jedná se o parametr testu. Vzorec pro kvantifikaci binární přesnosti je:

Přesnost = (TP + TN) / (TP + TN + FP + FN)

kde: TP = True positive; FP = Falešně pozitivní; TN = True negativní; FN = Falešně negativní

Všimněte si, že v této souvislosti nelze použít pojmy pravdivosti a přesnosti definované v ISO 5725-1. Jedním z důvodů je, že neexistuje jediná „skutečná hodnota“ veličiny, ale spíše dvě možné skutečné hodnoty pro každý případ, zatímco přesnost je průměrem ve všech případech, a proto zohledňuje obě hodnoty. Nicméně termín přesnost v tomto kontextu znamená jinou metriku pocházející z oblasti vyhledávání informací (viz. níže ).

V psychometrii a psychofyzice

v psychometrie a psychofyzika, termín přesnost je zaměnitelně používán s platnost a konstantní chyba. Přesnost je synonymem pro spolehlivost a variabilní chyba. Platnost měřicího nástroje nebo psychologického testu se stanoví pomocí experimentu nebo korelace s chováním. Spolehlivost je zajištěna řadou statistických technik, klasicky prostřednictvím interního testu konzistence Cronbachova alfa zajistit, aby soubory souvisejících otázek měly související odpovědi, a poté srovnání těchto souvisejících otázek mezi referenční a cílovou populací.[Citace je zapotřebí ]

V logické simulaci

v logická simulace, běžnou chybou při hodnocení přesných modelů je porovnání a logický simulační model do a tranzistor simulační model obvodu. Jedná se o srovnání rozdílů v přesnosti, nikoli v přesnosti. Přesnost se měří s ohledem na detail a přesnost se měří s ohledem na realitu.[11][12]

V informačních systémech

Systémy pro vyhledávání informací, jako např databáze a webové vyhledávače, jsou hodnoceny mnoho různých metrik, z nichž některé jsou odvozeny z zmatená matice, který rozděluje výsledky na skutečné pozitivy (dokumenty správně načtené), skutečné negativy (dokumenty správně načtené), falešné pozitivy (dokumenty nesprávně načtené) a falešné negativy (dokumenty nesprávně načtené). Mezi běžně používané metriky patří pojmy přesnost a odvolání. V této souvislosti je přesnost definována jako podíl načtených dokumentů, které jsou relevantní pro dotaz (true pozitiva děleno true + false pozitivy), pomocí sady základní pravda relevantní výsledky vybrané lidmi. Vyvolání je definováno jako zlomek příslušných dokumentů získaných ve srovnání s celkovým počtem příslušných dokumentů (skutečné pozitivy dělené skutečnými pozitivy + falešné negativy). Méně často se používá metrika přesnosti, která je definována jako celkový počet správných klasifikací (skutečné pozitivy plus skutečné negativy) dělený celkovým počtem dokumentů.

Žádná z těchto metrik nebere v úvahu pořadí výsledků. Hodnocení je pro webové vyhledávače velmi důležité, protože čtenáři málokdy procházejí kolem první stránky výsledků a na webu je příliš mnoho dokumentů na to, aby je všechny ručně klasifikoval podle toho, zda by měly být zahrnuty nebo vyloučeny z daného vyhledávání. Přidání mezní hodnoty pro určitý počet výsledků do určité míry zohlední hodnocení. Měření přesnost při k je například mírou přesnosti při pohledu pouze na prvních deset (k = 10) výsledků vyhledávání. Sofistikovanější metriky, jako je diskontovaný kumulativní zisk, vezměte v úvahu každé jednotlivé hodnocení a jsou častěji používány tam, kde je to důležité.

Viz také

Reference

  1. ^ A b BS ISO 5725-1: „Přesnost (správnost a přesnost) metod a výsledků měření - Část 1: Obecné zásady a definice.“, S. 1 (1994)
  2. ^ A b C JCGM 200: 2008 Mezinárodní slovník metrologie - Základní a obecné pojmy a související pojmy (VIM)
  3. ^ Taylor, John Robert (1999). Úvod do analýzy chyb: Studie nejistot ve fyzikálních měřeních. University Science Books. str. 128–129. ISBN  0-935702-75-X.
  4. ^ Organizace Severoatlantické smlouvy, Agentura pro normalizaci NATO AAP-6 - Glosář pojmů a definic, s. 43.
  5. ^ Creus, Antonio. Instrumentación Industrial[Citace je zapotřebí ]
  6. ^ BS 5497-1: "Přesnost zkušebních metod. Návod pro stanovení opakovatelnosti a reprodukovatelnosti pro standardní zkušební metodu." (1979)
  7. ^ Metz, CE (říjen 1978). „Základní principy analýzy ROC“ (PDF). Semin Nucl Med. 8 (4): 283–98. PMID  112681.
  8. ^ „Archivovaná kopie“ (PDF). Archivovány od originál (PDF) dne 11.03.2015. Citováno 2015-08-09.CS1 maint: archivovaná kopie jako titul (odkaz)
  9. ^ Powers, David M. W (2015). „Co měří F-míra“. arXiv:1503.06410 [cs.IR ].
  10. ^ David M. W. Powers. „Problém s Kappou“ (PDF). Anthology.aclweb.org. Citováno 11. prosince 2017.
  11. ^ Acken, John M. (1997). "žádný". Encyclopedia of Computer Science and Technology. 36: 281–306.
  12. ^ Glasser, Mark; Mathews, Rob; Acken, John M. (červen 1990). „Workshop o modelování logické úrovně pro ASICS z roku 1990“. SIGDA Zpravodaj. 20 (1).

externí odkazy