Bonferroniho korekce - Bonferroni correction - Wikipedia
v statistika, Bonferroniho korekce je jednou z několika metod používaných k řešení problému více srovnání.
Pozadí
italština matematik Carlo Emilio Bonferroni vyvinul korekci pro více srovnání pro své použití na Bonferroniho nerovnosti.[1]Rozšíření metody na intervaly spolehlivosti byl navržen uživatelem Olive Jean Dunn.[2]
Statistické testování hypotéz je založen na odmítnutí nulová hypotéza pokud je pravděpodobnost pozorovaných údajů podle nulových hypotéz nízká. Pokud je testováno více hypotéz, zvyšuje se šance na pozorování vzácné události, a proto je pravděpodobnost nesprávného odmítnutí nulové hypotézy (tj. Vytvoření Chyba typu I. ) se zvyšuje.[3]
Bonferroniho korekce kompenzuje toto zvýšení testováním každé jednotlivé hypotézy na hladině významnosti , kde je požadovaná celková hladina alfa a je počet hypotéz.[4] Například pokud testujete hypotézy s požadovaným , pak by Bonferroniho korekce otestovala každou hypotézu u . Podobně se při konstrukci více intervalů spolehlivosti objeví stejný jev.
Definice
Nechat být rodinou hypotéz a jejich odpovídající p-hodnoty. Nechat být celkový počet nulových hypotéz a počet skutečných nulových hypotéz. The rodinná chybovost (FWER) je pravděpodobnost odmítnutí alespoň jedné pravdivé , tj. Výroba alespoň jednoho chyba typu I.. Bonferroniho korekce odmítá nulovou hypotézu pro každou z nich , čímž ovládá FWER na . Důkaz o této kontrole vyplývá z Booleova nerovnost, jak následuje:
Tato kontrola nevyžaduje žádné předpoklady o závislosti mezi hodnotami p nebo o tom, kolik z nulových hypotéz je pravdivých.[5]
Rozšíření
Zobecnění
Spíše než testování každé hypotézy na úrovni, hypotézy mohou být testovány na jakékoli jiné kombinaci úrovní, které dohromady tvoří , za předpokladu, že je úroveň každého testu stanovena před prohlížením dat.[6] Například pro dva testy hypotéz, celkově 0,05 by mohlo být udržováno provedením jednoho testu na 0,04 a druhého na 0,01.
Intervaly spolehlivosti
Postup navrhovaný Dunnem[2] (nezaměňovat s Dunnův postup pro hodnocení rozptylu na základě hodnocení) lze použít k úpravě intervaly spolehlivosti. Pokud se zjistí intervaly spolehlivosti a přeje si mít celkovou úroveň spolehlivosti , každý jednotlivý interval spolehlivosti lze upravit na úroveň .[2]
Trvalé problémy
Při hledání signálu v spojitém parametrickém prostoru může také nastat problém s vícenásobným srovnáním nebo efektem hledat jinde. Fyzik by například mohl hledat částici neznámé hmoty uvažováním o velkém rozsahu hmot; to byl případ během detekce nositele Nobelovy ceny Higgsův boson. V takových případech lze použít průběžné zobecnění Bonferroniho korekce zaměstnáním Bayesian logika týkající se efektivního počtu pokusů, , k poměru objemu před a k zadnímu objemu.[7]
Alternativy
Existují alternativní způsoby ovládání rodinná chybovost Například Holm – Bonferroniho metoda a Šidákova korekce jsou obecně výkonnější postupy než Bonferroniho korekce, což znamená, že jsou vždy přinejmenším stejně silné. Na rozdíl od Bonferroniho postupu tyto metody nekontrolují očekávané číslo chyb typu I na rodinu (míra chyb typu I na rodinu).[8]
Kritika
S ohledem na FWER kontroly, může být Bonferroniho korekce konzervativní, pokud existuje velký počet testů a / nebo jsou statistiky testů pozitivně korelované.[9]
Oprava se odehrává za cenu zvýšení pravděpodobnosti výroby falešné negativy tj. redukce statistická síla.[10][9] Neexistuje definitivní shoda ohledně toho, jak definovat rodinu ve všech případech, a upravené výsledky testů se mohou lišit v závislosti na počtu testů zahrnutých v rodina hypotéz.[Citace je zapotřebí ] Taková kritika se týká FWER obecně a nejsou specifické pro Bonferroniho korekci.
Reference
- ^ Bonferroni, C. E., Teoria statistica delle classi e calcolo delle probabilità, Pubblicazioni del R Istituto Superiore di Scienze Economiche e Commerciali di Firenze 1936
- ^ A b C Dunn, Olive Jean (1961). „Vícenásobné srovnání mezi prostředky“ (PDF). Journal of the American Statistical Association. 56 (293): 52–64. CiteSeerX 10.1.1.309.1277. doi:10.1080/01621459.1961.10482090.
- ^ Mittelhammer, Ron C .; Soudce, George G .; Miller, Douglas J. (2000). Ekonometrické základy. Cambridge University Press. str. 73–74. ISBN 978-0-521-62394-0.
- ^ Miller, Rupert G. (1966). Simultánní statistická inference. Springer. ISBN 9781461381228.
- ^ Goeman, Jelle J .; Solari, Aldo (2014). "Vícenásobné testování hypotéz v genomice". Statistika v medicíně. 33 (11): 1946–1978. doi:10.1002 / sim.6082. PMID 24399688.
- ^ Neuwald, AF; Green, P (1994). Msgstr "Detekce vzorců v proteinových sekvencích". J. Mol. Biol. 239 (5): 698–712. doi:10.1006 / jmbi.1994.1407. PMID 8014990.
- ^ Bayer, Adrian E .; Seljak, Uroš (2020). „Efekt„ pohled jinam “ze sjednocené bayesovské a frekventované perspektivy“. Journal of Cosmology and Astroparticle Physics. 2020 (10): 009–009. arXiv:2007.13821. doi:10.1088/1475-7516/2020/10/009.
- ^ Frane, Andrew (2015). „Jsou míry chyb typu I na rodinu relevantní ve společenské a behaviorální vědě?“. Journal of Modern Applied Statistical Methods. 14 (1): 12–23. doi:10.22237 / jmasm / 1430453040.
- ^ A b Moran, Matthew (2003). „Argumenty pro odmítnutí sekvenčních Bonferroni v ekologických studiích“. Oikosi. 100 (2): 403–405. doi:10.1034 / j.1600-0706.2003.12010.x.
- ^ Nakagawa, Shinichi (2004). „Rozloučení s Bonferroni: problémy nízké statistické síly a zkreslení publikací“. Ekologie chování. 15 (6): 1044–1045. doi:10.1093 / beheco / arh107.
Další čtení
- Dunnett, C. W. (1955). "Postup vícenásobného srovnání pro porovnání několika ošetření s kontrolou". Journal of the American Statistical Association. 50 (272): 1096–1121. doi:10.1080/01621459.1955.10501294.
- Dunnett, C. W. (1964). "Nové tabulky pro více srovnání s ovládacím prvkem". Biometrie. 20 (3): 482–491. doi:10.2307/2528490. JSTOR 2528490. S2CID 64020124.
- Shaffer, J. P. (1995). "Testování více hypotéz". Roční přehled psychologie. 46: 561–584. doi:10.1146 / annurev.ps.46.020195.003021. hdl:10338.dmlcz / 142950.
- Strassburger, K .; Bretz, Frank (2008). „Kompatibilní současné nižší hranice spolehlivosti pro Holmův postup a další uzavřené testy založené na Bonferroni“. Statistika v medicíně. 27 (24): 4914–4927. doi:10,1002 / sim. 3338. PMID 18618415.
- Šidák, Z. (1967). "Obdélníkové oblasti spolehlivosti pro prostředky vícerozměrného normálního rozdělení". Journal of the American Statistical Association. 62 (318): 626–633. doi:10.1080/01621459.1967.10482935.
- Hochberg, Yosef (1988). „Ostřejší postup Bonferroni pro více testů důležitosti“ (PDF). Biometrika. 75 (4): 800–802. doi:10.1093 / biomet / 75.4.800.