Míra falešného pokrytí - False coverage rate
v statistika, a míra falešného pokrytí (FCR) je průměrná míra nepravdivosti Dosah tj. nepokrývající skutečné parametry mezi vybranými intervaly.
FCR poskytuje současné pokrytí na (1 -α) × 100% úroveň pro všechny parametry uvažované v problému. FCR má silné spojení s míra falešných objevů (FDR). Obě metody řeší problém vícenásobného srovnání, FCR z intervaly spolehlivosti (CIs) a FDR z pohledu hodnoty P.
FCR bylo zapotřebí z důvodu nebezpečí způsobeného selektivním odvozením. Vědci a vědci mají tendenci hlásit nebo zvýrazňovat pouze část údajů, která je považována za významnou, aniž by jasně naznačovali různé uvažované hypotézy. Je proto nutné pochopit, jak jsou údaje falešně pokryty. Existuje mnoho postupů FCR, které lze použít v závislosti na délce CI - Bonferroni - vybrané - Bonferroni - upravené,[Citace je zapotřebí ] Upravené CI vybrané pro BH (Benjamini a Yekutieli 2005[1]). Motivací volby jednoho postupu před druhým je zajistit, aby byla CI co nejužší a dodržovat FCR. Pro microarray experimentů a dalších moderních aplikací, existuje obrovské množství parametry, často desítky tisíc a více, a je velmi důležité zvolit nejsilnější postup.
FCR byl poprvé představen Daniel Yekutieli ve své disertační práci v roce 2001.[2]
Definice
Nedodržení FCR znamená když , kde je počet skutečných nulových hypotéz, je počet zamítnutých hypotéz, je počet falešných poplachů a je úroveň významnosti. Intervaly se současnou pravděpodobností pokrytí může ovládat FCR, aby byl omezen .
Klasifikace více testů hypotéz
Následující tabulka definuje možné výsledky při testování více nulových hypotéz. Předpokládejme, že máme číslo m nulových hypotéz, označených: H1, H2, ..., Hm.Používat statistický test, odmítneme nulovou hypotézu, pokud je test prohlášen za významný. Pokud test není nevýznamný, nezavrhujeme nulovou hypotézu. Shrnutí všech typů výsledků přes všechny Hi získá následující náhodné proměnné:
Nulová hypotéza je pravdivá (H0) | Alternativní hypotéza je pravdivá (HA) | Celkový | |
---|---|---|---|
Test je prohlášen za významný | PROTI | S | R |
Test je prohlášen za nevýznamný | U | T | |
Celkový | m |
- m je celkový počet testovaných hypotéz
- je počet pravdivých nulové hypotézy, neznámý parametr
- je počet pravdivých alternativní hypotézy
- PROTI je počet falešné poplachy (chyba typu I) (nazývané také „falešné objevy“)
- S je počet skutečná pozitiva (nazývané také „skutečné objevy“)
- T je počet falešné negativy (chyba typu II)
- U je počet skutečné negativy
- je počet odmítnutých nulových hypotéz (nazývaných také „objevy“, buď pravdivé, nebo nepravdivé)
v m testy hypotéz, z nichž jsou pravdivé nulové hypotézy, R je pozorovatelná náhodná proměnná a S, T, U, a PROTI jsou nepozorovatelné náhodné proměnné.
Problémy řešené FCR
Výběr
Výběr způsobuje snížené průměrné pokrytí. Výběr lze prezentovat jako podmínku pro událost definovanou daty a může ovlivnit pravděpodobnost pokrytí CI pro jednotlivce parametr. Rovněž problém výběru mění základní smysl pro P-hodnoty. Postupy FCR se domnívají, že není možné dosáhnout cíle podmíněného pokrytí podle jakéhokoli pravidla výběru pro libovolnou sadu (neznámých) hodnot parametrů. Je možné slabší vlastnost, pokud jde o selektivní CI, a vyhnete se falešným prohlášením o pokrytí. FCR je měřítkem pokrytí intervalu po výběru. Proto, i když 1 -α CI nenabízí selektivní (podmiňovací způsob ) pokrytí, je pravděpodobnost, že vytvoříte nepokrývající CI, maximálně α, kde
Výběr a mnohost
Když čelíme multiplicitě (odvození více parametrů) a výběr, nejenže očekávaný podíl pokrytí nad vybranými parametry na 1 − α není ekvivalentní očekávanému podílu žádného pokrytí na α, ale druhý již nelze zajistit vytvořením mezních CI pro každý vybraný parametr. Postupy FCR to řeší tak, že mezi vybranými parametry vezmou očekávaný podíl parametrů nepokrytých jejich CI, kde je poměr 0, pokud není vybrán žádný parametr. Tato míra falešného pokrytí-prohlášení (FCR) je vlastnost jakékoli procedury, která je definována způsobem, kterým jsou vybrané parametry, a způsobem, jakým jsou konstruovány více intervaly.
Kontrolní postupy
Bonferroniho postup (vybraný Bonferroni – Bonferroni upravený) pro simultánní CI
Simultánní CI s Bonferroniho postupem, když máme m parametrů, každá okrajová CI byla konstruována na úrovni 1 - α / m. Bez výběru tyto CI nabízejí simultánní pokrytí v tom smyslu, že pravděpodobnost, že všechny CI pokrývají jejich příslušné parametry, je alespoň 1 - α. bohužel ani tak silná vlastnost nezaručuje vlastnost podmíněné důvěryhodnosti po výběru.
FCR pro Bonferroni-vybraný – Bonferroni-upravený simultánní CI
Procedura Bonferroni – Bonferroni nemůže nabídnout podmíněné pokrytí, ale řídí FCR při <α. Ve skutečnosti to dělá příliš dobře, v tom smyslu, že FCR je příliš velká na 0 pro velké hodnoty θ. Výběr intervalů je založen na testování Bonferroni a poté jsou konstruovány CI Bonferroni. FCR se odhaduje jako, vypočítá se podíl intervalů, které nepokrývají jejich příslušné parametry mezi vytvořenými CI (nastavení poměru na 0, pokud nejsou vybrány žádné). Kde je výběr založen na neupraveném individuálním testování a jsou vytvořeny neupravené CI.
FCR upravené BH-vybrané CI
V BH postupu pro FDR po roztřídění p hodnoty P(1) ≤ • • • ≤ P(m) a výpočet R = max { j : P( j) ≤ j • q/m} R nulové hypotézy, pro které P(i) ≤ R • q/m jsou odmítnuty. Pokud se testování provádí pomocí Bonferroniho postupu, pak dolní mez FCR může klesnout hluboko pod požadovanou úroveň q, což znamená, že intervaly jsou příliš dlouhé. Naproti tomu použití následujícího postupu, který kombinuje obecný postup s kontrolním testováním FDR v postupu BH, také poskytuje dolní mez pro FCR, q/ 2 ≤ FCR. Tento postup je ostrý v tom smyslu, že pro některé konfigurace se FCR blíží q.
1. Seřaďte hodnoty p použité k testování m hypotéz týkajících se parametrů, P(1) ≤ • • • ≤P(m).
2. Vypočítat R = max {i : P(i) ≤ i • q/m}.
3. Vyberte ikonu R parametry, pro které P(i) ≤ R • q/m, což odpovídá odmítnutým hypotézám.
4. Postavte 1 -R • q/m CI pro každý vybraný parametr.
Viz také
Reference
Poznámky pod čarou
- ^ Benjamini, Yoav; Yekutieli, Daniel (březen 2005). „Míra falešného zjišťování - upraveno několik intervalů spolehlivosti pro vybrané parametry“ (pdf). Journal of the American Statistical Association. 100 (469): 71–93. doi:10.1198/016214504000001907.
- ^ Teoretické výsledky potřebné pro použití míry falešného objevu ve statistických problémech. Duben 2001 (část 3.2, strana 51)
Další zdroje
- Zhao, Zhigen; Hwang, J. T. Gene (2012). „Empirická Bayesova míra falešného pokrytí kontrolující intervaly spolehlivosti“ (pdf). Journal of the Royal Statistical Society, Series B. doi:10.1111 / j.1467-9868.2012.01033.x.[trvalý mrtvý odkaz ]