Proč jsou většina zveřejněných zjištění výzkumu nepravdivá - Why Most Published Research Findings Are False

"Proč jsou většina zveřejněných zjištění výzkumu nepravdivá"[1] je esej z roku 2005, kterou napsal John Ioannidis, profesor na Stanfordská lékařská fakulta a publikováno v PLOS Medicine. Považuje se za základní v oboru metascience.

V článku Ioannidis tvrdil, že velký počet, ne-li většina, publikovaných lékařský výzkum příspěvky obsahují výsledky, které nemohou být replikováno. Jednoduše řečeno, esej uvádí, že vědci používají testování hypotéz určit, zda jsou vědecké objevy významné. "Význam" je formalizován z hlediska pravděpodobnosti a jednoho formálního výpočtu ("Hodnota P. „) je ve vědecké literatuře uváděn jako screeningový mechanismus. Ioannidis předpokládal předpoklady o způsobu, jakým lidé provádějí a vykazují tyto testy, a poté zkonstruoval statistický model, který naznačuje, že většina publikovaných zjištění je falešně pozitivní výsledky.

Argument

Předpokládejme, že v daném vědeckém oboru existuje známá základní pravděpodobnost, že výsledek je pravdivý, označený . Je-li provedena studie, je pravděpodobnost, že bude dosaženo pozitivního výsledku . Vzhledem k těmto dvěma faktorům chceme vypočítat podmíněná pravděpodobnost , který je známý jako pozitivní prediktivní hodnota (PPV). Bayesova věta umožňuje nám vypočítat PPV jako:

kde je chybovost typu I. a je chybovost typu II; the statistická síla je . Ve většině vědeckých výzkumů je obvyklé toužit a . Pokud předpokládáme pro daný vědecký obor můžeme vypočítat PPV pro různé hodnoty a :

0.10.20.30.40.50.60.70.80.9
0.010.910.900.890.870.850.820.770.690.53
0.020.830.820.800.770.740.690.630.530.36
0.030.770.750.720.690.650.600.530.430.27
0.040.710.690.660.630.580.530.450.360.22
0.050.670.640.610.570.530.470.400.310.18

Jednoduchý vzorec pro PPV odvozený z Bayesovy věty však nebere v úvahu zaujatost v designu studie nebo reportingu. V přítomnosti zaujatosti , PPV je dáno obecnějším výrazem:

Zavedení předpětí bude mít tendenci snižovat PPV; v krajním případě, kdy je zkreslení studie maximalizováno, . I když studie splňuje referenční požadavky pro a „a je bez předpojatosti, stále existuje 36% pravděpodobnost, že práce s pozitivním výsledkem bude nesprávná; pokud je základní pravděpodobnost skutečného výsledku nižší, pak to také sníží PPV. Kromě toho existují přesvědčivé důkazy o tom, že průměrná statistická síla studie v mnoha vědeckých oborech je hluboko pod referenční úrovní 0,8.[2][3][4]

Vzhledem k realitě zkreslení, nízké statistické síle a malému počtu pravdivých hypotéz Ioannidis dochází k závěru, že většina studií v různých vědeckých oborech pravděpodobně uvádí nepravdivé výsledky.

Dodatky

Kromě hlavního výsledku uvádí Ioannidis šest důsledků faktorů, které mohou ovlivnit spolehlivost publikovaného výzkumu:

  1. Čím menší jsou studie prováděné ve vědeckém oboru, tím menší je pravděpodobnost, že výsledky výzkumu budou pravdivé.
  2. Čím menší je velikosti efektů ve vědecké oblasti, tím méně je pravděpodobné, že výsledky výzkumu budou pravdivé.
  3. Čím větší je počet a tím menší je výběr testované vztahy ve vědecké oblasti, tím méně je pravděpodobné, že výsledky výzkumu budou pravdivé.
  4. Čím větší flexibilitu vzory, definice, výsledky a analytické režimy ve vědecké oblasti, tím méně je pravděpodobné, že výsledky výzkumu budou pravdivé.
  5. Čím větší finanční a jiné zájmy a předsudky ve vědecké oblasti, tím méně je pravděpodobné, že výsledky výzkumu budou pravdivé.
  6. Čím teplejší je vědecký obor (s více vědeckými týmy), tím méně je pravděpodobné, že výsledky výzkumu budou pravdivé.

Příjem a vliv

Navzdory skepticismu ohledně extrémních výroků uvedených v příspěvku byla Ioannidisova širší argumentace a varování přijata velkým počtem výzkumníků.[5] Růst metascience a uznání vědeckého krize replikace posílily důvěryhodnost příspěvku a vedly k výzvám k metodickým reformám ve vědeckém výzkumu.[6][7]

V komentářích a technických odpovědích statistici Goodman a Grónsko identifikovali několik klamů v Ioannidisově modelu.[8][9] Ioannidis používal dramatický a přehnaný jazyk, který „dokázal“, že většina výzkumných zjištění tvrdí, že jsou nepravdivá a že „většina výzkumných zjištění je nepravdivá většina výzkumných návrhů a pro většina polí„[kurzíva přidána] byla zamítnuta, a přesto souhlasili se závěry a doporučeními jeho příspěvku. Biostatisti Jager a Leek kritizovali model jako založený na ospravedlnitelných, ale svévolných předpokladech spíše než na empirických datech a provedli vlastní vyšetřování, které vypočítalo, že falešné pozitivní míra v biomedicínských studiích byla odhadnuta na přibližně 14%, ne více než 50%, jak tvrdil Ionnidis.[10] Jejich práce byla zveřejněna ve zvláštním vydání časopisu z roku 2014 Biostatistika spolu s rozšířenými podpůrnými kritikami od jiných statistiků. Pór shrnul klíčové body dohody takto: když hovoříme o vědecky věrohodné míře falešných objevů, musíme přinést data; existují různé rámce pro odhad míry vědy falešných objevů; a „je dost nepravděpodobné, že většina publikovaných výzkumů je nepravdivá,“ ale to se pravděpodobně liší podle definice „většiny“ a „nepravdivosti“.[11] Statistik Ullrich Schimmick zdůraznil význam empirického základu pro modely tím, že si všiml, že uváděná míra falešných objevů v některých vědeckých oborech není skutečná míra objevů, protože nevýznamné výsledky jsou hlášeny jen zřídka. Ioannidisův teoretický model to nezohledňuje, ale když se na dva příklady použije statistická metoda („křivka z“) pro odhad počtu nepublikovaných nevýznamných výsledků, míra falešně pozitivních výsledků se pohybuje mezi 8% a 17%, ne více než 50%.[12] Navzdory těmto slabostem existuje obecný souhlas s problémem a doporučeními, o nichž Ioannidis diskutuje, přesto byl jeho tón popsán jako „dramatický“ a „znepokojivě zavádějící“, což riskuje, že lidé budou ve vědě zbytečně skeptičtí nebo cyničtí.[8][13]

Trvalým dopadem této práce bylo povědomí o základních faktorech vysoké míry falešně pozitivních výsledků v klinické medicíně a biomedicínském výzkumu a úsilí časopisů a vědců o jejich zmírnění. Ioannidis přepracoval tyto ovladače v roce 2016 jako:[14]

  • Sólo, hloupý vyšetřovatel omezený na malé velikosti vzorků
  • Žádná předběžná registrace testovaných hypotéz
  • Post-hoc výběr třešní hypotéz s nejlepšími hodnotami P.
  • Vyžaduje pouze P <0,05
  • Žádná replikace
  • Žádné sdílení dat

Viz také

Reference

  1. ^ Ioannidis, John P. A. (2005). „Proč jsou většina zveřejněných zjištění výzkumu nepravdivá“. PLOS Medicine. 2 (8): e124. doi:10.1371 / journal.pmed.0020124. ISSN  1549-1277. PMC  1182327. PMID  16060722.
  2. ^ Button, Katherine S .; Ioannidis, John P. A .; Mokrysz, Claire; Nosek, Brian A .; Flint, Jonathan; Robinson, Emma S. J .; Munafò, Marcus R. (2013). „Výpadek napájení: proč malá velikost vzorku podkopává spolehlivost neurovědy“. Recenze přírody Neurovědy. 14 (5): 365–376. doi:10.1038 / nrn3475. ISSN  1471-0048. PMID  23571845.
  3. ^ Szucs, Denes; Ioannidis, John P. A. (03.03.2017). „Empirické hodnocení publikovaných velikostí účinků a síly v nedávné literatuře kognitivních neurovědy a psychologie“. PLOS Biology. 15 (3): e2000797. doi:10.1371 / journal.pbio.2000797. ISSN  1545-7885. PMC  5333800. PMID  28253258.
  4. ^ Ioannidis, John P. A .; Stanley, T. D .; Doucouliagos, Hristos (2017). „The Power of Bias in Economics Research“. Ekonomický deník. 127 (605): F236 – F265. doi:10.1111 / ecoj.12461. ISSN  1468-0297.
  5. ^ Belluz, Julia (2015-02-16). „John Ioannidis zasvětil svůj život kvantifikaci toho, jak je narušena věda“. Vox. Citováno 2020-03-28.
  6. ^ „Nízká spotřeba a krize replikace: Co jsme se naučili od roku 2004 (nebo 1984 nebo 1964)?« Statistické modelování, kauzální inference a sociální vědy “. statmodeling.stat.columbia.edu. Citováno 2020-03-28.
  7. ^ Wasserstein, Ronald L .; Lazar, Nicole A. (2016-04-02). „ASA Statement on p-Values: Context, Process, and Purpose“. Americký statistik. 70 (2): 129–133. doi:10.1080/00031305.2016.1154108. ISSN  0003-1305.
  8. ^ A b Goodman, Steven; Grónsko, Sander (24. dubna 2007). „Proč jsou většina zveřejněných zjištění výzkumu nepravdivá: problémy v analýze“. PLOS Medicine. str. e168. doi:10.1371 / journal.pmed.0040168. Archivovány od originál dne 16. května 2020.
  9. ^ Goodman, Steven; Grónsko, Sander. „HODNOCENÍ NEVĚŘENOSTI LÉKAŘSKÉ LITERATURY: ODPOVĚĎ NA“ PROČ NEJVĚTŠÍ ZVEŘEJNĚNÉ VÝZKUMY VÝZKUMU JSOU NEPRAVDIVÉ"". Sbírka archivu výzkumu biostatistiky. Working Paper 135: Johns Hopkins University, Dept. of Biostatistics Working Papers. Archivovány od originál dne 2. listopadu 2018.CS1 maint: umístění (odkaz)
  10. ^ Jager, Leah R .; Pór, Jeffrey T. (1. ledna 2014). „Odhad míry vědecky falešných objevů a aplikace na špičkovou lékařskou literaturu“. Biostatistika. Oxford Academic. s. 1–12. doi:10.1093 / biostatistics / kxt007. Archivovány od originál dne 11. června 2020.
  11. ^ Pór, Jeff. „Je většina vědy falešná? Titáni váží“. simplystatistics.org. Archivovány od originál dne 31. ledna 2017.
  12. ^ Schimmick, Ullrich (16. ledna 2019). „Ioannidis (2005) se mýlil: většina zveřejněných výsledků výzkumu není falešná“. Index replikovatelnosti. Archivovány od originál dne 19. září 2020.
  13. ^ Ingraham, Paul (15. září 2016). „Ioannidis: Making Science Look Bad Bad since 2005“. www.PainScience.com. Archivovány od originál dne 21. června 2020.
  14. ^ Minikel, Eric V. (17. března 2016). „John Ioannidis: Stav výzkumu výzkumu“. www.cureffi.org. Archivovány od originál dne 17. ledna 2020.

Další čtení

externí odkazy