Odvod biologické sítě - Biological network inference - Wikipedia
Odvod biologické sítě je proces výroby závěry a předpovědi o biologické sítě.[1]
Biologické sítě
Síť je sada uzlů a sada směrovaných nebo neorientovaných hran mezi uzly. Existuje mnoho typů biologických sítí, včetně transkripčních, signálních a metabolických. Několik takových sítí je známo v čemkoli, co se blíží jejich úplné struktuře, dokonce i v nejjednodušším bakterie. Stále méně je známo o parametrech, které řídí chování těchto sítí v průběhu času, o tom, jak sítě na různých úrovních v buňce interagují a jak předpovědět úplný popis stavu eukaryotický buněčný nebo bakteriální organismus v daném bodě v budoucnosti. Systémová biologie je v tomto smyslu stále ještě v plenkách.
Je o ně velký zájem síťová medicína pro modelování biologických systémů. Tento článek se zaměřuje na nezbytný předpoklad pro dynamické modelování sítě: odvození topologie, tj. predikce „schématu zapojení“ sítě. Přesněji se zde zaměříme na odvození struktury biologické sítě pomocí rostoucí sady dat s vysokou propustností výrazu pro geny, bílkoviny, a metabolity.[2] Stručně řečeno, metody využívající data s vysokou propustností pro odvození regulačních sítí se spoléhají na hledání vzorů částečné korelace nebo podmíněných pravděpodobností, které naznačují kauzální vliv.[3][4] Takové vzorce parciálních korelací nalezené ve vysoce výkonných datech, případně kombinované s dalšími doplňujícími údaji o genech nebo proteinech v navrhovaných sítích, nebo kombinované s dalšími informacemi o organismu, tvoří základ, na kterém tyto algoritmy práce. Takové algoritmy lze použít k odvození topologie jakékoli sítě, kde dochází ke změně stavu jedné uzel může ovlivnit stav ostatních uzlů.
Transkripční regulační sítě
Geny jsou uzly a hrany jsou směrovány. Gen slouží jako zdroj přímé regulační hranice cílového genu produkcí RNA nebo molekula proteinu, která funguje jako transkripční aktivátor nebo inhibitor cílového genu. Pokud je gen aktivátor, pak je zdrojem pozitivního regulačního spojení; pokud je to inhibitor, pak je to zdroj negativního regulačního spojení. Výpočtové algoritmy berou jako primární měření vstupních dat z mRNA úrovně exprese uvažovaných genů pro zařazení do sítě, vrací odhad sítě topologie. Takové algoritmy jsou obvykle založeny na předpokladech linearity, nezávislosti nebo normality, které je třeba ověřovat případ od případu.[5] Shlukování nebo nějaká forma statistické klasifikace se obvykle používá k provedení počáteční organizace vysoce výkonných hodnot exprese mRNA odvozených z experimentů s microarray, zejména k výběru sad genů jako kandidátů na síťové uzly.[6] Poté vyvstává otázka: jak mohou být výsledky shlukování nebo klasifikace spojeny se základní biologií? Takové výsledky mohou být užitečné pro klasifikaci vzorů - například pro klasifikaci podtypů rakovina nebo předpovídat diferenciální odezvy na a lék (farmakogenomika). Abychom však pochopili vztahy mezi geny, tedy přesněji definovali vliv každého genu na ostatní, vědec se obvykle pokouší rekonstruovat transkripční regulační síť. To lze provést integrací dat v dynamických modelech podporovaných podkladovou literaturou nebo informacemi na veřejnosti databáze v kombinaci s výsledky shlukování.[7] Modelování lze provést pomocí a Booleovská síť tím, že Obyčejné diferenciální rovnice nebo Lineární regrese modely, např. Regrese nejméně úhlu tím, že Bayesovská síť nebo na základě Informační teorie přístupy.[8][9] Například to lze provést aplikací korelačního algoritmu odvození, jak bude popsáno níže, přístup, který má větší úspěch, protože velikost dostupných sad microarray se stále zvyšuje [3][10][11]
Transdukce signálu
Transdukce signálu sítě (velmi důležité v biologii rakoviny). Proteiny jsou uzly a směrované hrany představují interakci, při které je biochemická konformace dítěte modifikována působením rodiče (např. Zprostředkovaná fosforylace, ubikvitylace, methylace atd.). Primárním vstupem do inferenčního algoritmu by byla data ze sady experimentů měřících aktivaci / inaktivaci proteinů (např. Fosforylace / defosforylace) napříč sadou proteinů. Odvození těchto signálních sítí je komplikováno skutečností, že celkové koncentrace signálních proteinů budou v průběhu času kolísat v důsledku transkripční a translační regulace. Taková variace může vést ke statistice matoucí. Proto je nutné k analýze těchto datových souborů použít sofistikovanější statistické techniky.[12]
Metabolické
Metabolit sítí. Metabolity jsou uzly a hrany jsou směrovány. Primárním vstupem do algoritmu by byla data ze sady experimentů měřících hladiny metabolitů.
Interakce protein-protein
Sítě interakce proteinů a proteinů jsou také velmi aktivně studovány. Rekonstrukce těchto sítí však nepoužívá korelační odvození ve smyslu diskutovaném pro sítě již popsané (interakce nemusí nutně znamenat změnu stavu proteinu) a popis takové rekonstrukce interakční sítě je ponechán na další články.
Viz také
Reference
- ^ Mercatelli, Daniele; Scalambra, Laura; Triboli, Luca; Ray, Forest; Giorgi, Federico M. (2020). "Zdroje odvození regulačních sítí genů: Praktický přehled". Biochimica et Biophysica Acta (BBA) - regulační mechanismy genů. 1863 (6): 194430. doi:10.1016 / j.bbagrm.2019.194430. ISSN 1874-9399. PMID 31678629.
- ^ Tieri P, Farina L, Petti M, Astolfi L, Paci P, Castiglione F (2018). "Síťová inference a rekonstrukce v bioinformatice". Encyklopedie bioinformatiky a výpočetní biologie. 2: 805–813. doi:10.1016 / B978-0-12-809633-8.20290-2. ISBN 9780128114322.
- ^ A b Marbach D, Costello JC, Küffner R, Vega NM, Prill RJ, Camacho DM, Allison KR, Kellis M, Collins JJ, Stolovitzky G (srpen 2012). „Moudrost davů pro robustní odvození genové sítě“. Přírodní metody. 9 (8): 796–804. doi:10.1038 / nmeth.2016. PMC 3512113. PMID 22796662.
- ^ Sprites P, Glamour C, Scheines R (2000). Příčina, predikce a vyhledávání: Adaptivní výpočet a strojové učení (2. vyd.). MIT Stiskněte.
- ^ Oates CJ, Mukherjee S (září 2012). „Inference sítě a biologická dynamika“. Annals of Applied Statistics. 6 (3): 1209–1235. arXiv:1112.1047. doi:10.1214 / 11-AOAS532. PMC 3533376. PMID 23284600.
- ^ Guthke R, Möller U, Hoffmann M, Thies F, Töpfer S (duben 2005). „Dynamická rekonstrukce sítě z údajů o genové expresi aplikovaných na imunitní odpověď během bakteriální infekce“. Bioinformatika. 21 (8): 1626–34. doi:10.1093 / bioinformatika / bti226. PMID 15613398.
- ^ Hecker M, Lambeck S, Toepfer S, van Someren E, Guthke R (duben 2009). "Gene regulační síťový závěr: integrace dat v dynamických modelech - recenze". Bio systémy. 96 (1): 86–103. doi:10.1016 / j.biosystems.2008.12.004. PMID 19150482.
- ^ van Someren EP, Wessels LF, Backer E, Reinders MJ (červenec 2002). "Genetické modelování sítě". Farmakogenomika. 3 (4): 507–25. doi:10.1517/14622416.3.4.507. PMID 12164774.
- ^ Banf, Michael; Rhee, Seung Y. (leden 2017). „Výpočetní odvození genových regulačních sítí: přístupy, omezení a příležitosti“. Biochimica et Biophysica Acta (BBA) - regulační mechanismy genů. 1860 (1): 41–52. doi:10.1016 / j.bbagrm.2016.09.003. ISSN 1874-9399. PMID 27641093.
- ^ Faith JJ, Hayete B, Thaden JT, Mogno I, Wierzbowski J, Cottarel G, Kasif S, Collins JJ, Gardner TS (leden 2007). „Mapování a validace transkripční regulace Escherichia coli z kompendia expresních profilů ve velkém měřítku“. PLOS Biology. 5 (1): e8. doi:10.1371 / journal.pbio.0050008. PMC 1764438. PMID 17214507.
- ^ Hayete B, Gardner TS, Collins JJ (2007). „Na velikosti záleží: odvození sítě řeší měřítko genomu“. Molekulární systémy biologie. 3 (1): 77. doi:10.1038 / msb4100118. PMC 1828748. PMID 17299414.
- ^ Oates CJ, Mukherjee S (2012). Msgstr "Strukturní inference pomocí nelineární dynamiky". Pracovní dokument CRiSM. 12 (7).