Výběr zásahu - Hit selection

v vysoce výkonný screening (HTS), jedním z hlavních cílů je výběr sloučenin (včetně malé molekuly, siRNA, shRNA, geny, et al.) s požadovanou velikostí účinků inhibice nebo aktivace. Sloučenina s požadovanou velikostí efektů na obrazovce HTS se nazývá hit. Proces výběru zásahů se nazývá výběr zásahu.

Metody pro výběr zásahů obecně

Experimenty HTS mají schopnost rychle prověřovat desítky tisíc (nebo dokonce miliony) sloučenin. Proto je výzvou shromáždit chemický / biochemický význam z hromad dat v procesu výběru zásahů. K řešení této výzvy byly pro výběr zásahů přijaty vhodné analytické metody. Existují dvě hlavní strategie výběru zásahů s velkými efekty.[1] Jedním z nich je použití určitých metrik k zařazení a / nebo klasifikaci sloučeniny podle jejich účinků a poté vybrat největší počet silných sloučenin, který je praktický pro validaci testy.[2][3] Druhou strategií je otestovat, zda má sloučenina dostatečně silné účinky, aby dosáhla předem stanovené úrovně. V této strategii musí být kontrolovány míry falešně negativních (FNR) a / nebo falešně pozitivních (FPR).[4][5][6][7][8][9][10][11]

Existují dva hlavní typy experimentů HTS, jeden bez replikátů (obvykle na primárních obrazovkách) a jeden s replikáty (obvykle na potvrzovacích obrazovkách). Analytické metody pro výběr zásahů se liší v těchto dvou typech HTS experimentů. Například metoda z-skóre je vhodná pro obrazovky bez replikátů, zatímco t-statistika je vhodná pro obrazovky s replikacemi. Výpočet SSMD pro obrazovky bez replikátů se také liší od obrazovek bez replikátů.[1]

Obrazovky bez replikátů

Existuje mnoho metrik používaných pro výběr požadavků na primárních obrazovkách bez replikátů. Snadno interpretovatelné jsou změna záhybů, střední rozdíl, procentní inhibice a procentní aktivita. Společnou nevýhodou všech těchto metrik je však to, že efektivně nezachycují variabilitu dat. K řešení tohoto problému se vědci poté obrátili na metodu z-skóre nebo SSMD, který dokáže zachytit variabilitu dat v negativních referencích.[12][13]

Metoda z-skóre je založena na předpokladu, že naměřené hodnoty (obvykle intenzita fluorescence v logaritmickém měřítku) všech zkoumaných sloučenin na destičce mají normální rozdělení. SSMD také funguje nejlépe za předpokladu normality. Skutečné zásahy s velkými efekty by se však měly chovat velmi odlišně od většiny sloučenin, a proto by měly být odlehlé. Artefakty silného testu se také mohou chovat jako odlehlé hodnoty. Odlehlé hodnoty tedy nejsou v experimentech HTS neobvyklé. Pravidelné verze z-skóre a SSMD jsou citlivé na odlehlé hodnoty a mohou být problematické. V důsledku toho robustní metody, jako je metoda z * -score, SSMD *, Metoda B-skóre a metoda založená na kvantilech byla navržena a přijata pro výběr zásahů na primárních obrazovkách bez replikátů.[14][15]

Na primární obrazovce bez replikátů se každá sloučenina měří pouze jednou. V důsledku toho nemůžeme přímo odhadnout variabilitu dat pro každou sloučeninu. Místo toho nepřímo odhadujeme variabilitu dat vytvořením silného předpokladu, že každá sloučenina má stejnou variabilitu jako negativní reference na destičce na obrazovce. Z-skóre, z * -skóre a B-skóre závisí na tomto silném předpokladu; tak jsou SSMD a SSMD * pro případy bez replikátů.

Obrazovky s replikáty

Na obrazovce s replikáty můžeme přímo odhadnout variabilitu dat pro každou sloučeninu, a tak můžeme použít výkonnější metody, jako je SSMD pro případy s replikáty a t-statistikou, která se nespoléhá na silný předpoklad, že z-skóre a z * -skóre spoléhat na. Jedním problémem s použitím t-statistiky a souvisejících p-hodnot je, že jsou ovlivněny velikostí vzorku i velikostí efektu.[16] Pocházejí z testování bez průměrného rozdílu, proto nejsou určeny k měření velikosti účinků malých molekul nebo siRNA. Pro výběr zásahů je hlavním zájmem velikost účinku u testovaného malá molekula nebo siRNA. SSMD přímo hodnotí velikost účinků.[17] SSMD také se ukázalo, že je lepší než jiné běžně používané velikosti efektů.[18] Hodnota populace SSMD je srovnatelný napříč experimenty, a proto můžeme použít stejný mez pro hodnotu populace SSMD měřit velikost účinků siRNA.[19]

SSMD může překonat nevýhodu průměrné změny záhybu, když nedokáže zachytit variabilitu dat. Na druhou stranu, protože SSMD je poměr střední hodnoty ke standardní odchylce, můžeme získat velkou hodnotu SSMD, když je standardní odchylka velmi malá, i když je střední hodnota malá. V některých případech nemusí mít příliš malá střední hodnota biologický dopad. Jako takové nemusí být zajímavé sloučeniny s velkými hodnotami SSMD (nebo diferenciacemi), ale s příliš malými středními hodnotami. Koncept zápletka se dvěma baterkami bylo navrženo k řešení tohoto problému. V zápletka se dvěma baterkami zakreslíme SSMD versus průměrná log-násobná změna (nebo průměrné procento inhibice / aktivace) na ose y respektive x pro všechny sloučeniny zkoumané v experimentu.[19] Díky grafu se dvěma baterkami vidíme, jak jsou geny nebo sloučeniny distribuovány do každé kategorie ve velikostech efektů, jak je znázorněno na obrázku. Mezitím můžeme také vidět průměrnou změnu složení pro každou sloučeninu.[19][20]

Viz také

Další čtení

Reference

  1. ^ A b Zhang XHD (2011). Optimální vysokovýkonný screening: Praktický experimentální design a analýza dat pro výzkum RNAi v genomovém měřítku. Cambridge University Press. ISBN  978-0-521-73444-8.
  2. ^ Birmingham A, Selfors LM, Forster T, Wrobel D, Kennedy CJ, Shanks E, Santoyo-Lopez J, Dunican DJ, Long A, Kelleher D, Smith Q, Beijersbergen RL, Ghazal P, Shamu CE (2009). „Statistické metody pro analýzu vysoce výkonných interferenčních obrazovek RNA“. Přírodní metody. 6 (8): 569–75. doi:10.1038 / nmeth.1351. PMC  2789971. PMID  19644458.
  3. ^ Zhang XHD (2010). „Screening v celém genomu pro efektivní siRNA prostřednictvím hodnocení velikosti účinků siRNA“. Poznámky k výzkumu BMC. 1: 33. doi:10.1186/1756-0500-1-33. PMC  2526086. PMID  18710486.
  4. ^ Malo N, Hanley JA, Cerquozzi S, Pelletier J, Nadon R (2006). "Statistická praxe ve vysoce výkonné analýze dat skríningu". Přírodní biotechnologie. 24 (2): 167–75. doi:10.1038 / nbt1186. PMID  16465162.
  5. ^ Zhang XH, Kuan PF, Ferrer M, Shu X, Liu YC, Gates AT, Kunapuli P, Stec EM, Xu M, Marine SD, Holder DJ, Stulovici B, Heyse JF, Espeseth AS (2009). „Výběr výběru s falešnou kontrolou rychlosti objevu na obrazovkách RNAi v genomovém měřítku“. Výzkum nukleových kyselin. 36 (14): 4667–79. doi:10.1093 / nar / gkn435. PMC  2504311. PMID  18628291.
  6. ^ Klinghoffer RA, Frazier J, Annis J, Berndt JD, Roberts BS, Arthur WT, Lacson R, Zhang XH, Ferrer M, Moon RT, Cleary MA (2010). „Genetický screening zprostředkovaný lentivirem identifikuje dihydrofolátreduktázu (DHFR) jako modulátor signalizace beta-katenin / GSK3“. PLOS ONE. 4 (9): e6892. doi:10.1371 / journal.pone.0006892. PMC  2731218. PMID  19727391.
  7. ^ Zhang XHD (2010). „Efektivní metoda kontroly falešných objevů a falešných neobjevení na obrazovkách RNAi v měřítku genomu“. Journal of Biomolecular Screening. 15 (9): 1116–22. doi:10.1177/1087057110381783. PMID  20855561.
  8. ^ Malo N, Hanley JA, Carlile G, Liu J, Pelletier J, Thomas D, Nadon R (2010). "Experimentální návrh a statistické metody pro lepší detekci zásahů při vysoce výkonném screeningu". Journal of Biomolecular Screening. 15 (8): 990–1000. doi:10.1177/1087057110377497. PMID  20817887.
  9. ^ Zhang XH, Lacson R, Yang R, Marine SD, McCampbell, Toolan DM, Hare TR, Kajdas J, Berger JP, Holder DJ, Heyse JF, Ferrer M (2010). „Využití falešných objevů založených na SSMD a falešných neobjevení na obrazovkách RNAi v měřítku genomu“. Journal of Biomolecular Screening. 15 (9): 1123–31. doi:10.1177/1087057110381919. PMID  20852024.
  10. ^ Quon K, Kassner PD (2009). "RNA interferenční screening pro objev onkologických cílů". Znalecký posudek na terapeutické cíle. 13 (9): 1027–35. doi:10.1517/14728220903179338. PMID  19650760.
  11. ^ Zhang XH, Marine SD, Ferrer M (2009). „Míra chyb a síla na obrazovkách RNAi v měřítku genomu“. Journal of Biomolecular Screening. 14 (3): 230–38. doi:10.1177/1087057109331475. PMID  19211781.
  12. ^ Zhang XHD (2007). „Nová metoda s flexibilní a vyváženou kontrolou falešných negativů a falešných poplachů pro výběr zásahů ve vysoce výkonných screeningových testech interference RNA“. Journal of Biomolecular Screening. 12 (5): 645–55. doi:10.1177/1087057107300645. PMID  17517904.
  13. ^ Zhang XH, Ferrer M, Espeseth AS, Marine SD, Stec EM, Crackower MA, Holder DJ, Heyse JF, Strulovici B (2007). „Použití přísně standardizovaného průměrného rozdílu pro výběr zásahu v vysoce výkonných screeningových experimentech s interferencí primární RNA“. Journal of Biomolecular Screening. 12 (4): 645–55. doi:10.1177/1087057107300646. PMID  17435171.
  14. ^ Zhang XH, Yang XC, Chung N, Gates A, Stec E, Kunapuli P, Holder DJ, Ferrer M, Espeseth AS (2006). "Robustní statistické metody pro výběr zásahů ve vysokoprůchodových screeningových experimentech s interferencí RNA". Farmakogenomika. 7 (3): 299–09. doi:10.2217/14622416.7.3.299. PMID  16610941.
  15. ^ Brideau C, Gunter G, Pikounis B, Liaw A (2003). „Vylepšené statistické metody pro výběr zásahů při vysoce výkonném screeningu“. Journal of Biomolecular Screening. 8 (6): 634–47. doi:10.1177/1087057103258285. PMID  14711389.
  16. ^ Cohen J (1994). „Země je kulatá (P-Less-Than.05)“. Americký psycholog. 49 (12): 997–1003. doi:10.1037 / 0003-066X.49.12.997. ISSN  0003-066X.
  17. ^ Zhang XHD (2009). „Metoda pro efektivní srovnání genových účinků ve více podmínkách v RNAi a výzkumu profilování exprese“. Farmakogenomika. 10 (3): 345–58. doi:10.2217/14622416.10.3.345. PMID  20397965.
  18. ^ Zhang XHD (2010). "Přísně standardizovaný průměrný rozdíl, standardizovaný průměrný rozdíl a klasický t-test pro srovnání dvou skupin". Statistiky v biofarmaceutickém výzkumu. 2 (2): 292–99. doi:10.1198 / sbr.2009.0074.
  19. ^ A b C Zhang XHD (2010). „Posouzení velikosti účinků genu nebo RNAi v multifaktorových vysoce výkonných experimentech“. Farmakogenomika. 11 (2): 199–213. doi:10.2217 / PGS.09.136. PMID  20136359.
  20. ^ Zhao WQ, Santini F, Breese R, Ross D, Zhang XD, Stone DJ, Ferrer M, Townsend M, Wolfe AL, Seager MA, Kinney GG, Shughrue PJ, Ray WJ (2010). „Inhibice kalcineurinem zprostředkované endocytózy a receptorů alfa-amino-3-hydroxy-5-methyl-4-isoxazolepropionové kyseliny (AMPA) brání synaptickému narušení vyvolanému amyloidem beta oligomerem“. Journal of Biological Chemistry. 285 (10): 7619–32. doi:10.1074 / jbc.M109.057182. PMC  2844209. PMID  20032460.