Dávkový efekt - Batch effect
v molekulární biologie, a dávkový efekt nastane, když nebiologické faktory v experimentu způsobí změny v datech produkovaných experimentem. Takové účinky mohou vést k nepřesným závěrům, pokud jsou jejich příčiny korelovány s jedním nebo více výsledky zájmu v experimentu. Jsou běžné u mnoha typů vysoce výkonné sekvenování experimenty, včetně těch, které používají mikročipy, hmotnostní spektrometry,[1] a jednobuněčné sekvenování RNA data.[2] Nejčastěji se o nich diskutuje v kontextu genomika a vysoce výkonný sekvenční výzkum, ale existují i v jiných vědních oblastech.[1]
Definice
V literatuře bylo navrženo několik definic pojmu „dávkový efekt“. Lazar a kol. (2013) poznamenali: „Poskytnout úplnou a jednoznačnou definici takzvaného dávkového efektu je náročný úkol, zejména proto, že jeho původ a způsob, jakým se projevuje v datech, nejsou zcela známy nebo nejsou zaznamenány.“ Se zaměřením na experimenty s mikročipy navrhují novou definici založenou na několika předchozích: „[batch effect“ představuje systematické technické rozdíly, když jsou vzorky zpracovávány a měřeny v různých šaržích a které nesouvisí s žádnou biologickou variací zaznamenanou během MAGE [ microarray genová exprese] experiment. "[3]
Příčiny
Bylo identifikováno mnoho potenciálně proměnných faktorů jako potenciální příčiny dávkových účinků, včetně následujících:
- Laboratorní podmínky[1]
- Výběr šarže činidla nebo šarže[1][4]
- Personální rozdíly[1]
- Denní doba, kdy byl experiment proveden[4]
- Atmosférický ozón úrovně[4]
- Nástroje používané k provedení experimentu
Oprava
Byly vyvinuty různé statistické techniky, které se pokoušejí korigovat dávkové efekty ve vysoce výkonných experimentech. Tyto techniky jsou určeny k použití během fází experimentálního návrhu a analýzy dat. Historicky se většinou zaměřují na genomické experimenty a teprve nedávno se začaly rozšiřovat do dalších vědeckých oborů, jako např proteomika.[5] Jedním z problémů spojených s takovými technikami je, že mohou neúmyslně odstranit skutečnou biologickou variabilitu.[6] Některé techniky, které byly použity k detekci a / nebo opravě dávkových efektů, zahrnují následující:
- Pro data microarray, lineární smíšené modely byly použity, přičemž matoucí faktory byly zahrnuty jako náhodné zachycení.[7]
- V roce 2007 Johnson a kol. navrhl empirický Bayesian technika pro korekci dávkových efektů. Tento přístup představoval vylepšení oproti předchozím metodám v tom, že jej bylo možné efektivně použít s malými velikostmi dávek.[4]
- V roce 2012 se sva softwarový balíček byl představen. Zahrnuje několik funkcí pro úpravu dávkových efektů, včetně použití náhradní proměnná odhad, u kterého bylo dříve prokázáno, že zlepšuje reprodukovatelnost a snižuje závislost ve vysoce výkonných experimentech.
- Haghverdi et al. (2018) navrhli techniku určenou pro jednobuněčná data RNA-seq na základě detekce vzájemní nejbližší sousedé v datech.[2]
- Papiez a kol. (2019) navrhla a dynamické programování algoritmus k identifikaci dávkových efektů neznámé hodnoty ve vysoce výkonných datech.[8]
Reference
- ^ A b C d E Pór, Jeffrey T.; Scharpf, Robert B .; Bravo, Héctor Corrada; Simcha, David; Langmead, Benjamin; Johnson, W. Evan; Geman, Donald; Pytlově, Keith; Irizarry, Rafael A. (Říjen 2010). „Řešení širokého a kritického dopadu dávkových efektů na vysoce výkonná data“. Genetika hodnocení přírody. 11 (10): 733–739. doi:10.1038 / nrg2825. ISSN 1471-0056. PMC 3880143. PMID 20838408.
- ^ A b Haghverdi, Laleh; Lun, Aaron TL; Morgan, Michael D; Marioni, John C (květen 2018). „Dávkové efekty v jednobuněčných datech sekvenování RNA jsou opraveny porovnáním vzájemných nejbližších sousedů“. Přírodní biotechnologie. 36 (5): 421–427. doi:10,1038 / nbt.4091. ISSN 1087-0156. PMC 6152897. PMID 29608177.
- ^ Pór, Jeffrey T .; Johnson, W. Evan; Parker, Hilary S .; Jaffe, Andrew E .; Storey, John D. (2012-03-15). „Svalový balíček pro odstraňování dávkových efektů a jiných nežádoucích variací ve vysoce výkonných experimentech“. Bioinformatika. 28 (6): 882–883. doi:10.1093 / bioinformatika / bts034. ISSN 1460-2059. PMC 3307112. PMID 22257669.
- ^ A b C d Johnson, W. Evan; Li, Cheng; Rabinovic, Ariel (01.01.2007). "Úprava dávkových efektů v datech výrazu microarray pomocí empirických Bayesových metod". Biostatistika. 8 (1): 118–127. doi:10.1093 / biostatistics / kxj037. ISSN 1468-4357. PMID 16632515.
- ^ Čuklina, Jelena; Pedrioli, Patrick G. A .; Aebersold, Ruedi (2020). Přehled přístupů k prevenci, diagnostice a korekci dávkových efektů. Metody v molekulární biologii. 2051. 373–387. doi:10.1007/978-1-4939-9744-2_16. ISBN 978-1-4939-9743-5. ISSN 1940-6029. PMID 31552638.
- ^ Goh, Wilson Wen Bin; Wang, Wei; Wong, Limsoon (červen 2017). „Proč dávkové efekty na datech Omics záleží a jak se jim vyhnout“. Trendy v biotechnologii. 35 (6): 498–507. doi:10.1016 / j.tibtech.2017.02.012. PMID 28351613.
- ^ Espín-Pérez, Almudena; Portier, Chris; Chadeau-Hyam, Marc; van Veldhoven, Karin; Kleinjans, Jos C. S .; de Kok, Theo M. C. M. (2018-08-30). Krishnan, Viswanathan V. (ed.). „Srovnání statistických metod a použití vzorků kontroly kvality pro korekci dávkového efektu v lidských transkriptomových datech“. PLOS ONE. 13 (8): e0202947. Bibcode:2018PLoSO..1302947E. doi:10.1371 / journal.pone.0202947. ISSN 1932-6203. PMC 6117018. PMID 30161168.
- ^ Papiez, Anna; Marczyk, Michal; Polanska, Joanna; Polanski, Andrzej (01.06.2019). Berger, Bonnie (ed.). „BatchI: Batch effect Identification in high-throughput screening data using a dynamic programming algorithm“. Bioinformatika. 35 (11): 1885–1892. doi:10.1093 / bioinformatika / bty900. ISSN 1367-4803. PMC 6546123. PMID 30357412.