Klam základní sazby - Base rate fallacy

The klam základní sazby, také zvaný zanedbání základní sazby nebo zkreslení základní sazby, je klam. Pokud se zobrazí související základní sazba informace (tj. obecné informace o prevalenci) a specifické informace (tj. informace týkající se pouze konkrétního případu), lidé mají tendenci ignorovat základní sazbu ve prospěch individualizujících informací, spíše než správně je integrovat.[1]

Zanedbání základní sazby je specifickou formou obecnější zanedbání rozšíření.

Falešně pozitivní paradox

Příkladem klamu základní sazby je falešně pozitivní paradox. Tento paradox popisuje situace, kdy jich je více falešně pozitivní výsledky testu než skutečná pozitiva. Například 50 z 1 000 lidí má pozitivní test na infekci, ale pouze 10 z nich má infekci, což znamená, že 40 testů bylo falešně pozitivních. Pravděpodobnost pozitivního výsledku testu je určena nejen přesností testu, ale také charakteristikami vzorkované populace.[2] Když je prevalence, podíl těch, kteří mají daný stav, nižší než test falešně pozitivní míra, dokonce i testy, u nichž je velmi nízká pravděpodobnost falešně pozitivního výsledku v individuálním případě dá více falešných než pravdivých pozitiv celkově.[3] Paradox většinu lidí překvapuje.[4]

Obzvláště je to protiintuitivní při interpretaci pozitivního výsledku testu s nízkou prevalencí populace poté, co se zabýval pozitivními výsledky získanými z populace s vysokou prevalencí.[3] Pokud falešně pozitivní rychlost testu je vyšší než podíl Nový populace s tímto onemocněním, pak může administrátor testu, jehož zkušenosti byly získány z testování v populaci s vysokou prevalencí vyvodit ze zkušenosti že pozitivní výsledek testu obvykle naznačuje pozitivní subjekt, i když ve skutečnosti je mnohem pravděpodobnější výskyt falešně pozitivního.

Příklady

Příklad 1: Nemoc

Populace s vysokou incidencí

Číslo
lidí
InfikovanýNeinfikovanýCelkový
Test
pozitivní
400
(skutečně pozitivní)
30
(falešně pozitivní)
430
Test
negativní
0
(falešně negativní)
570
(skutečný zápor)
570
Celkový4006001000

Představte si, že provedete test na infekční onemocnění u populace A 1 000 osob, z nichž je 40% infikováno. Test má míru falešně pozitivních výsledků 5% (0,05) a nemá míru falešně negativních výsledků. The očekávaný výsledek z 1 000 testů na populaci A bylo by:

Infikovaný a test indikuje onemocnění (skutečně pozitivní )
1000 × 40/100 = 400 lidí by dostalo skutečné pozitivum
Neinfikovaný a test indikuje onemocnění (falešně pozitivní)
1000 × 100 – 40/100 × 0,05 = 30 lidí by dostalo falešně pozitivní výsledek
Zbývajících 570 testů je správně negativních.

Takže v populaci A, osoba přijímající pozitivní test si může být více než 93% jistá (400/30 + 400), že správně označuje infekci.

Populace s nízkým výskytem

Číslo
lidí
InfikovanýNeinfikovanýCelkový
Test
pozitivní
20
(skutečně pozitivní)
49
(falešně pozitivní)
69
Test
negativní
0
(falešně negativní)
931
(skutečný zápor)
931
Celkový209801000

Nyní zvažte stejný test aplikovaný na populaci B, ve kterém jsou infikována pouze 2%. The očekávaný výsledek 1000 testů na populaci B bylo by:

Infikovaný a test indikuje onemocnění (skutečně pozitivní )
1000 × 2/100 = 20 lidí by dostalo skutečné pozitivum
Neinfikovaný a test indikuje onemocnění (falešně pozitivní)
1000 × 100 – 2/100 × 0,05 = 49 lidí by dostalo falešně pozitivní výsledek
Zbývajících 931 (= 1000 - (49 + 20)) testů je správně negativních.

V populaci B, pouze 20 z celkového počtu 69 lidí s pozitivním výsledkem testu je skutečně infikováno. Pravděpodobnost, že bude člověk nakažen, jakmile mu někdo řekne, že je infikován, je tedy pouze 29% (20/20 + 49) pro test, který se jinak jeví jako „95% přesný“.

Tester se zkušenostmi ze skupiny A může to považovat za paradox ve skupině B, výsledek, který obvykle správně indikoval infekci, je nyní obvykle a falešně pozitivní. Zmatek zadní pravděpodobnost infekce předchozí pravděpodobnost obdržení falešně pozitivního výsledku je přirozené chyba po obdržení výsledku testu ohrožujícího zdraví.

Příklad 2: Opilí řidiči

Skupina policistů ano dechové analyzátory vykazování falešné opilosti v 5% případů, kdy je řidič střízlivý. Alkohol testery však nikdy nezjistí skutečně opilého člověka. Jeden z tisíce řidičů řídí opilý. Předpokládejme, že policisté poté náhodně zastaví řidiče, aby provedli test na alkohol. Znamená to, že řidič je opilý. Předpokládáme, že o nich nic jiného nevíte. Jak vysoká je pravděpodobnost, že jsou skutečně opilí?

Mnozí by odpověděli až na 95%, ale správná pravděpodobnost je asi 2%.

Vysvětlení je následující: v průměru na každých 1 000 testovaných ovladačů

  • 1 řidič je opilý a je 100% jisté, že pro tohoto řidiče existuje skutečný pozitivní výsledek testu, takže je 1 skutečný pozitivní výsledek testu
  • 999 řidičů není opilých a mezi těmito řidiči je 5% Nepravdivé pozitivní výsledky testů, takže jich je 49,95 Nepravdivé pozitivní výsledky testu

Proto je pravděpodobnost, že jeden z řidičů mezi pozitivními výsledky testu 1 + 49,95 = 50,95 skutečně opilý, je .

Platnost tohoto výsledku však závisí na platnosti počátečního předpokladu, že policista zastavil řidiče skutečně náhodně, a ne kvůli špatné jízdě. Pokud byl přítomen tento nebo jiný nesvobodný důvod pro zastavení řidiče, pak výpočet zahrnuje také pravděpodobnost, že opilý řidič bude řídit kompetentně a neopilý řidič bude řídit (ne) kompetentně.

Formálně lze pomocí použití stanovit stejnou pravděpodobnost zhruba 0,02 Bayesova věta. Cílem je zjistit pravděpodobnost, že je řidič opilý, protože dechový analyzátor naznačil, že jsou opilí, což lze vyjádřit jako

kde D znamená, že dechový analyzátor naznačuje, že řidič je opilý. Bayesova věta nám to říká

V prvním odstavci nám bylo řečeno toto:

a

Jak můžete vidět ze vzorce, člověk potřebuje p(D) pro Bayesovu větu, kterou lze vypočítat z předchozích hodnot pomocí zákon celkové pravděpodobnosti:

který dává

Zapojením těchto čísel do Bayesovy věty to člověk zjistí

Příklad 3: Teroristická identifikace

Ve městě s 1 milionem obyvatel může být 100 teroristů a 999 900 neteroristů. Pro zjednodušení příkladu se předpokládá, že všichni lidé přítomní ve městě jsou obyvatelé. Pravděpodobnost základní sazby náhodně vybraného obyvatele města jako teroristy je tedy 0,0001 a pravděpodobnost základní sazby toho samého obyvatele, který není teroristou, je 0,9999. Ve snaze chytit teroristy město instaluje poplašný systém s kamerou a automatickým software pro rozpoznávání obličeje.

Tento software má dvě míry selhání 1%:

  • Míra falešně negativních výsledků: Pokud kamera skenuje teroristy, zazvoní zvonek 99% času a nepodaří se mu zvonit 1% času.
  • Míra falešně pozitivních výsledků: Pokud kamera skenuje neteroristy, zvonek nezvoní 99% času, ale zvoní 1% času.

Předpokládejme nyní, že obyvatel spustí poplach. Jaká je šance, že je člověk terorista? Jinými slovy, co je P (T | B), pravděpodobnost, že byl detekován terorista vzhledem k zazvonění zvonu? Někdo, kdo dělá „klam základní sazby“, by odvodil, že existuje 99% šance, že detekovaná osoba je terorista. Ačkoli se zdá, že závěr dává smysl, je to ve skutečnosti špatné uvažování a níže uvedený výpočet ukáže, že šance, že budou teroristy, jsou ve skutečnosti téměř 1%, ne téměř 99%.

Klam vzniká zmatením podstaty dvou různých poruch. „Počet lidí, kteří nejsou zvony na 100 teroristů“ a „počet lidí, kteří nejsou teroristé na 100 zvonečků“, nesouvisí s množstvím. Jedno se nemusí nutně rovnat druhému a nemusí být ani téměř stejné. Chcete-li to ukázat, zvažte, co se stane, pokud by byl ve druhém městě zřízen identický výstražný systém bez teroristů. Stejně jako v prvním městě zazní poplach u 1 ze 100 detekovaných neteroristických obyvatel, ale na rozdíl od prvního města poplach u teroristy nikdy nezazní. Proto je 100% všech případů, kdy zazní poplach, pro ne-teroristy, ale falešně negativní sazbu nelze ani vypočítat. „Počet neteroristů na 100 zvonů“ v tomto městě je 100, přesto P (T | B) = 0%. Vzhledem k zazvonění zvonku je nulová šance, že byl detekován terorista.

Představte si, že před kamerou projde celá populace prvního města s milionem lidí. Asi 99 ze 100 teroristů spustí poplach - a stejně tak asi 9 999 z 999 900 neteroristů. Proto asi 10 098 lidí spustí poplach, z nichž asi 99 bude teroristů. Pravděpodobnost, že osoba, která spustí poplach, je ve skutečnosti teroristou, je tedy jen asi 99 z 10 098, což je méně než 1% a velmi, velmi hluboko pod naším původním odhadem 99%.

Klam základní sazby je v tomto příkladu tak zavádějící, protože niteroristů je mnohem více než teroristů a počet falešných poplachů (ne-teroristé skenovaní jako teroristé) je mnohem větší než skutečných pozitivů (skutečný počet teroristů) .

Nálezy v psychologii

V experimentech bylo zjištěno, že lidé upřednostňují informace o individualizaci před obecnými informacemi, pokud jsou k dispozici.[5][6][7]

V některých experimentech byli studenti požádáni, aby odhadli průměry známek (GPA) hypotetických studentů. Když dostali relevantní statistiky o distribuci GPA, měli studenti tendenci je ignorovat, pokud dostali popisné informace o konkrétním studentovi, i když nové popisné informace byly zjevně málo nebo vůbec relevantní pro výkon školy.[6] Toto zjištění bylo použito k argumentaci, že rozhovory jsou zbytečnou součástí přijetí na vysokou školu procesu, protože tazatelé nejsou schopni vybrat úspěšné kandidáty lépe než základní statistiky.

Psychologové Daniel Kahneman a Amos Tversky se pokusil vysvětlit toto zjištění pojmem a jednoduché pravidlo nebo „heuristika“ volala reprezentativnost. Tvrdili, že mnoho rozsudků týkajících se pravděpodobnosti nebo příčin a následků vychází z toho, jak reprezentativní je jedna věc druhé nebo kategorie.[6] Kahneman považuje zanedbání základní sazby za specifickou formu zanedbání rozšíření.[8] Richard Nisbett tvrdí, že někteří atribuční předsudky jako základní chyba atribuce jsou případy klamu základní sazby: lidé nepoužívají „konsensuální informace“ („základní sazba“) o tom, jak se ostatní chovali v podobných situacích, a místo toho upřednostňují jednodušší dispoziční přiřazení.[9]

V psychologii probíhá značná debata o podmínkách, za kterých lidé dělají nebo neoceňují informace o základní sazbě.[10][11] Vědci v programu heuristiky a předsudků zdůraznili empirická zjištění, která ukazují, že lidé mají tendenci ignorovat základní sazby a dělat závěry, které porušují určité normy pravděpodobnostního uvažování, jako je například Bayesova věta. Z této linie výzkumu vyvodil závěr, že pravděpodobnostní myšlení člověka je zásadně chybné a náchylné k chybám.[12] Jiní vědci zdůraznili souvislost mezi kognitivními procesy a informačními formáty a tvrdí, že tyto závěry nejsou obecně opodstatněné.[13][14]

Znovu zvažte příklad 2 shora. Požadovaným závěrem je odhad (zadní) pravděpodobnosti, že je (náhodně vybraný) řidič opilý, vzhledem k tomu, že test dechového analyzátoru je pozitivní. Formálně lze tuto pravděpodobnost vypočítat pomocí Bayesova věta, jak je uvedeno výše. Existují však různé způsoby prezentace příslušných informací. Zvažte následující, formálně ekvivalentní variantu problému:

1 z 1000 řidičů řídí opilý. Alkohol testery nikdy nezjistí skutečně opilého člověka. U 50 z 999 řidičů, kteří nejsou opilí, alkoholtester falešně zobrazuje opilost. Předpokládejme, že policisté poté náhodně zastaví řidiče a přinutí je podrobit se testu na alkohol. Znamená to, že jsou opilí. Předpokládáme, že o nich nic jiného nevíte. Jak vysoká je pravděpodobnost, že jsou skutečně opilí?

V tomto případě jsou příslušné číselné informace—p(opilý), p(D | opilý), p(D | střízlivý) - je prezentován z hlediska přirozených frekvencí s ohledem na určitou referenční třídu (viz problém referenční třídy ). Empirické studie ukazují, že závěry lidí více odpovídají Bayesově pravidlu, když jsou informace prezentovány tímto způsobem, což pomáhá překonat zanedbávání základní rychlosti u laiků[14] a odborníci.[15] V důsledku toho organizace jako Cochrane Collaboration doporučujeme použít tento druh formátu pro komunikaci statistik o zdraví.[16] Naučit lidi překládat tyto druhy problémů Bayesianova uvažování do přirozených frekvenčních formátů je účinnější než poučné naučit je zapojovat pravděpodobnosti (nebo procenta) do Bayesovy věty.[17] Ukázalo se také, že grafická znázornění přirozených frekvencí (např. Pole ikon) pomáhají lidem dělat lepší závěry.[17][18][19]

Proč jsou užitečné formáty přirozené frekvence? Jedním z důležitých důvodů je, že tento informační formát usnadňuje požadovanou inference, protože zjednodušuje nezbytné výpočty. To lze vidět při použití alternativního způsobu výpočtu požadované pravděpodobnosti p(opilý |D):

kde N(opilý ∩ D) označuje počet řidičů, kteří jsou pod vlivem alkoholu a mají pozitivní výsledek alkoholtesteru, a N(D) označuje celkový počet případů s pozitivním výsledkem alkoholtesteru. Ekvivalence této rovnice s výše uvedenou vyplývá z axiomů teorie pravděpodobnosti, podle nichž N(opilý ∩ D) = N × p (D | opilý) × p (opilý). Důležité je, že i když je tato rovnice formálně ekvivalentní Bayesovu pravidlu, není psychologicky ekvivalentní. Použití přirozených frekvencí zjednodušuje odvození, protože požadovanou matematickou operaci lze provést na přirozených číslech namísto normalizovaných zlomků (tj. Pravděpodobností), protože zvyšuje transparentnost vysokého počtu falešných pozitivů a protože přirozené frekvence vykazují „vnořenou množinu“ struktura".[20][21]

Ne každý frekvenční formát umožňuje Bayesovské uvažování.[21][22] Přirozené frekvence se vztahují k informacím o frekvencích, které jsou výsledkem přirozený odběr vzorků,[23] který zachovává informace o základní sazbě (např. počet opilých řidičů při náhodném výběru řidičů). To se liší od systematické vzorkování, ve kterém jsou základní sazby stanoveny a priori (např. ve vědeckých experimentech). V druhém případě není možné odvodit zadní pravděpodobnost p (opilý | pozitivní test) z porovnání počtu řidičů, kteří jsou opilí, a mají pozitivní test ve srovnání s celkovým počtem lidí, kteří získají pozitivní výsledek z dechového analyzátoru, protože informace o základní sazbě nejsou zachovány a musí být výslovně znovu zavedeny pomocí Bayesovy věty .

Viz také

Reference

  1. ^ „Logický klam: Klam se základní sazbou“. Fallacyfiles.org. Citováno 2013-06-15.
  2. ^ Rheinfurth, M. H .; Howell, L. W. (březen 1998). Pravděpodobnost a statistika v leteckém inženýrství (PDF). NASA. str. 16. ZPRÁVA: Falešně pozitivní testy jsou pravděpodobnější než skutečně pozitivní testy, pokud má celková populace nízkou prevalenci onemocnění. Tomu se říká falešně pozitivní paradox.
  3. ^ A b Vacher, H. L. (květen 2003). „Kvantitativní gramotnost - testování na drogy, screening rakoviny a identifikace vyvřelých hornin“. Journal of Geoscience Education: 2. Na první pohled to vypadá zvráceně: čím méně to studenti jako celek používají steroidy, tím je pravděpodobnější, že student označený jako uživatel nebude uživatelem. Tomu se říká falešně pozitivní paradox - Cituji: Gonick, L .; Smith, W. (1993). Kreslený průvodce statistikami. New York: Harper Collins. str. 49.
  4. ^ Madison, B.L. (srpen 2007). „Matematické znalosti pro občanství“. V Schoenfeld, A. H. (ed.). Hodnocení matematické způsobilosti. Publikace Výzkumného ústavu matematických věd (nové vydání). Cambridge University Press. str. 122. ISBN  978-0-521-69766-8. Správný [odhad pravděpodobnosti ...] je pro mnohé překvapivý; proto, termín paradox.
  5. ^ Bar-Hillel, Maya (1980). „Klam základní sazby v úsudcích o pravděpodobnosti“ (PDF). Acta Psychologica. 44 (3): 211–233. doi:10.1016/0001-6918(80)90046-3.
  6. ^ A b C Kahneman, Daniel; Amos Tversky (1973). „O psychologii predikce“. Psychologický přehled. 80 (4): 237–251. doi:10.1037 / h0034747. S2CID  17786757.
  7. ^ Kahneman, Daniel; Amos Tversky (1985). "Evidentní dopad základních sazeb". Daniel Kahneman, Paul Slovic & Amos Tversky (ed.). Rozsudek s nejistotou: Heuristika a předsudky. Věda. 185. str. 153–160. doi:10.1126 / science.185.4157.1124. PMID  17835457. S2CID  143452957.
  8. ^ Kahneman, Daniel (2000). "Hodnocení podle okamžiků, minulosti a budoucnosti". In Daniel Kahneman and Amos Tversky (ed.). Volby, hodnoty a rámce.
  9. ^ Nisbett, Richard E .; E. Borgida; R. Crandall; H. Reed (1976). "Populární indukce: Informace nejsou vždy informativní". In J. S. Carroll & J. W. Payne (ed.). Poznání a sociální chování. 2. str. 227–236.
  10. ^ Koehler, J. J. (2010). „Klam základní sazby znovu zvážen: Popisné, normativní a metodologické výzvy“. Behaviorální a mozkové vědy. 19: 1–17. doi:10.1017 / S0140525X00041157. S2CID  53343238.
  11. ^ Barbey, A. K .; Sloman, S.A. (2007). „Respektování základní sazby: Od ekologické racionality k duálním procesům“. Behaviorální a mozkové vědy. 30 (3): 241–254, diskuse 255–297. doi:10.1017 / S0140525X07001653. PMID  17963533. S2CID  31741077.
  12. ^ Tversky, A .; Kahneman, D. (1974). „Rozsudek pod nejistotou: Heuristika a předsudky“. Věda. 185 (4157): 1124–1131. Bibcode:1974Sci ... 185.1124T. doi:10.1126 / science.185.4157.1124. PMID  17835457. S2CID  143452957.
  13. ^ Cosmides, Leda; John Tooby (1996). „Jsou lidé koneckonců dobří intuitivní statistici? Přehodnocení některých závěrů literatury o úsudku za nejistoty“. Poznání. 58: 1–73. CiteSeerX  10.1.1.131.8290. doi:10.1016/0010-0277(95)00664-8. S2CID  18631755.
  14. ^ A b Gigerenzer, G .; Hoffrage, U. (1995). Msgstr "Jak vylepšit Bayesovské uvažování bez instrukcí: Frekvenční formáty". Psychologický přehled. 102 (4): 684. CiteSeerX  10.1.1.128.3201. doi:10.1037 / 0033-295X.102.4.684.
  15. ^ Hoffrage, U .; Lindsey, S .; Hertwig, R .; Gigerenzer, G. (2000). „Medicína: sdělování statistických informací“. Věda. 290 (5500): 2261–2262. doi:10.1126 / science.290.5500.2261. PMID  11188724. S2CID  33050943.
  16. ^ Akl, E. A .; Oxman, A.D .; Herrin, J .; Vist, G. E .; Terrenato, I .; Sperati, F .; Costiniuk, C .; Blank, D .; Schünemann, H. (2011). Schünemann, Holger (ed.). „Používání alternativních statistických formátů pro prezentaci rizik a snižování rizik“. Cochrane Database of Systematic Reviews (3): CD006776. doi:10.1002 / 14651858.CD006776.pub2. PMC  6464912. PMID  21412897.
  17. ^ A b Sedlmeier, P .; Gigerenzer, G. (2001). „Výuka Bayesiánského uvažování za méně než dvě hodiny“. Journal of Experimental Psychology: General. 130 (3): 380. doi:10.1037/0096-3445.130.3.380. hdl:11858 / 00-001M-0000-0025-9504-E.
  18. ^ Brase, G.L. (2009). Msgstr "Obrázkové reprezentace ve statistickém uvažování". Aplikovaná kognitivní psychologie. 23 (3): 369–381. doi:10,1002 / acp.1460. S2CID  18817707.
  19. ^ Edwards, A .; Elwyn, G .; Mulley, A. (2002). „Vysvětlení rizik: Převádění číselných dat na smysluplné obrázky“. BMJ. 324 (7341): 827–830. doi:10.1136 / bmj.324.7341.827. PMC  1122766. PMID  11934777.
  20. ^ Girotto, V .; Gonzalez, M. (2001). "Řešení pravděpodobnostních a statistických problémů: otázka informační struktury a formy otázky". Poznání. 78 (3): 247–276. doi:10.1016 / S0010-0277 (00) 00133-5. PMID  11124351. S2CID  8588451.
  21. ^ A b Hoffrage, U .; Gigerenzer, G .; Krauss, S .; Martignon, L. (2002). „Reprezentace usnadňuje uvažování: Co jsou to přirozené frekvence a jaké nejsou“. Poznání. 84 (3): 343–352. doi:10.1016 / S0010-0277 (02) 00050-1. PMID  12044739. S2CID  9595672.
  22. ^ Gigerenzer, G .; Hoffrage, U. (1999). „Překonávání obtíží v Bayesianově uvažování: Odpověď Lewisovi a Kerenovi (1999) a Mellersovi a McGrawovi (1999)“. Psychologický přehled. 106 (2): 425. doi:10.1037 / 0033-295X.106.2.425. hdl:11858 / 00-001M-0000-0025-9CB4-8.
  23. ^ Kleiter, G. D. (1994). "Přirozené vzorkování: Racionalita bez základních sazeb". Příspěvky do matematické psychologie, psychometrie a metodologie. Nedávný výzkum v psychologii. 375–388. doi:10.1007/978-1-4612-4308-3_27. ISBN  978-0-387-94169-1.

externí odkazy