Pseudoreplikace - Pseudoreplication

Pseudoreplikace je proces umělého nafukování počtu vzorků nebo replikátů^[1]. Výsledkem je, že statistické testy prováděné na datech jsou neplatné.

Pseudoreplikace byla původně definována v roce 1984 autorem Stuart H. Hurlbert^[2] jako speciální případ nedostatečné specifikace náhodných faktorů, kde jsou přítomny jak náhodné, tak pevné faktory.^[3]Problém nedostatečné specifikace nastává, když jsou ošetření přiřazena jednotkám, které jsou podvzorkovány, a poměr F ošetření v analýze rozptylu (ANOVA ) Tabulka je vytvořena s ohledem na zbytkový střední čtverec, nikoli s ohledem na střední střední čtverec. Poměr F vzhledem k střední jednotce střední čtverce je citlivý na matoucí účinků ošetření a jednotek, zejména když je počet experimentálních jednotek malý (např. čtyři jednotky nádrže, dvě nádrže ošetřené, dvě neošetřené, několik podvzorků na nádrž). Problém je odstraněn vytvořením poměru F ve vztahu ke správnému střednímu čtverci v tabulce ANOVA (ve výše uvedeném příkladu s úpravou MS), kde je to možné. Problém je vyřešen použitím smíšených modelů.^[3]

Hurlbert hlásil „pseudoreplikaci“ ve 48% studií, které zkoumal, a které využívaly inferenční statistiky.^[2] Několik studií zkoumajících vědecké práce publikované do roku 2016 podobně zjistilo, že přibližně polovina příspěvků byla podezřelá z pseudoreplikace.^[1] Když čas a zdroje omezují počet experimentální jednotky a jednotkové efekty nelze statisticky eliminovat testováním přes jednotkovou odchylku, je důležité použít jiné zdroje informací k vyhodnocení míry, do jaké je poměr F zaměněn jednotkovými efekty.

Replikace

Replikace zvyšuje přesnost odhadu, zatímco randomizace řeší širší použitelnost vzorku na populaci. Replikace musí být vhodná: kromě replikace v jednotkách je třeba vzít v úvahu replikaci na úrovni experimentální jednotky.

Testování hypotéz

Statistické testy (např. t-test a související rodina testů ANOVA) se při odhadu spoléhají na odpovídající replikaci statistická významnost. Testy založené na rozdělení t a F předpokládají homogenní, normální a nezávislé chyby. Korelované chyby mohou vést k falešné přesnosti a p-hodnotám, které jsou příliš malé.^[4]

Typy

Hurlbert (1984) definoval čtyři typy pseudoreplikace.

Jednoduchá pseudoreplikace (obrázek 5a v Hurlbert 1984) nastává, když na jednu léčbu existuje jedna experimentální jednotka. Inferenční statistiky nemohou oddělit variabilitu kvůli léčbě od variability kvůli experimentálním jednotkám, pokud je na jednotku pouze jedno měření.
Časová pseudoreplikace (obrázek 5c v Hurlbert 1984) nastává, když se experimentální jednotky časově liší natolik, že jsou pravděpodobné časové efekty mezi jednotkami, a účinky léčby korelují s časovými efekty. Inferenční statistiky nemohou oddělit variabilitu kvůli léčbě od variability kvůli experimentálním jednotkám, pokud je na jednotku pouze jedno měření.
Obětní pseudoreplikace (obrázek 5b v Hurlbert 1984) nastává, když jsou v analýze použity prostředky v rámci léčby a tyto prostředky jsou testovány v rámci rozptylu jednotek. Na obrázku 5b bude chybný poměr F mít 1 df v čitateli (ošetření) střední kvadrát a 4 df ve jmenovateli střední čtverec (2-1 = 1 df pro každou experimentální jednotku). Správný poměr F bude mít 1 df v čitateli (ošetření) a 2 df ve jmenovateli (2-1 = 1 df pro každé ošetření). Správné kontroly poměru F pro účinky experimentálních jednotek, ale s 2 df ve jmenovateli bude mít malou schopnost detekovat rozdíly v léčbě.
K implicitní pseudoreplikaci dochází, když jsou v experimentálních jednotkách odhadovány standardní chyby (nebo limity spolehlivosti). Stejně jako u jiných zdrojů pseudoreplikace nelze účinky léčby statisticky oddělit od účinků kvůli rozdílům mezi experimentálními jednotkami.

Reference

^ ^A ^b Gholipour, Bahar (2018-03-15). „Statistické chyby mohou poskvrnit až polovinu studií na myších“. Spektrum | Novinky z výzkumu autismu. Citováno 2018-03-24.
^ ^A ^b Hurlbert, Stuart H. (1984). „Pseudoreplikace a návrh experimentů v ekologickém poli“ (PDF). Ekologické monografie. Ekologická společnost Ameriky. 54 (2): 187–211. doi:10.2307/1942661. JSTOR 1942661.
^ ^A ^b Millar, R.B .; Anderson, M.R. (2004). "Opravné prostředky pro pseudoreplikaci". Výzkum v oblasti rybolovu. 70 (2–3): 397–407. doi:10.1016 / j.fishres.2004.08.016.
^ Lazic, SE (2010). „Problém pseudoreplikace v neurovědeckých studiích: ovlivňuje to vaši analýzu?“. BMC Neuroscience. 11:5: 5. doi:10.1186/1471-2202-11-5. PMC 2817684. PMID 20074371.

[:0-1] A ^b Gholipour, Bahar (2018-03-15). „Statistické chyby mohou poskvrnit až polovinu studií na myších“. Spektrum | Novinky z výzkumu autismu. Citováno 2018-03-24.

[Hurlbert-2] A ^b Hurlbert, Stuart H. (1984). „Pseudoreplikace a návrh experimentů v ekologickém poli“ (PDF). Ekologické monografie. Ekologická společnost Ameriky. 54 (2): 187–211. doi:10.2307/1942661. JSTOR 1942661.

[MillarAnderson-3] A ^b Millar, R.B .; Anderson, M.R. (2004). "Opravné prostředky pro pseudoreplikaci". Výzkum v oblasti rybolovu. 70 (2–3): 397–407. doi:10.1016 / j.fishres.2004.08.016.

[Lazic-4] Lazic, SE (2010). „Problém pseudoreplikace v neurovědeckých studiích: ovlivňuje to vaši analýzu?“. BMC Neuroscience. 11:5: 5. doi:10.1186/1471-2202-11-5. PMC 2817684. PMID 20074371.

[1]

[2]

[3]

[4]