DNA vazebné místo - DNA binding site
DNA vazebná místa jsou typem vazebné místo nalezen v DNA kde se mohou vázat jiné molekuly. Vazebná místa pro DNA se liší od jiných vazebných míst v tom, že (1) jsou součástí sekvence DNA (např. Genomu) a (2) jsou vázána Proteiny vázající DNA. DNA vazebná místa jsou často spojována se specializovanými proteiny známými jako transkripční faktory, a jsou tedy spojeny s transkripční regulace. Součet vazebných míst pro DNA konkrétního transkripčního faktoru se označuje jako jeho cistrom. DNA vazebná místa také zahrnují cíle jiných proteinů restrikční enzymy, místně specifické rekombinázy (viz site-specific rekombinace ) a methyltransferázy.[1]
DNA vazebná místa lze tedy definovat jako krátké sekvence DNA (obvykle 4 až 30 párů bází dlouhé, ale až 200 bp pro rekombinační místa), které jsou specificky vázány jedním nebo více Proteiny vázající DNA nebo proteinové komplexy. Bylo hlášeno, že některá vazebná místa mají potenciál podstoupit rychlou evoluční změnu.[2]
Typy vazebných míst pro DNA
Vazebná místa pro DNA lze kategorizovat podle jejich biologické funkce. Můžeme tedy rozlišovat mezi místy vázajícími transkripční faktor, restrikčními místy a rekombinačními místy. Někteří autoři navrhli, že vazebná místa lze klasifikovat také podle jejich nejvhodnějšího způsobu reprezentace.[3] Na jedné straně mohou být restrikční místa obecně reprezentována konsensuálními sekvencemi. Důvodem je, že se zaměřují většinou na identické sekvence a restrikční účinnost u méně podobných sekvencí náhle klesá. Na druhou stranu jsou vazebná místa DNA pro daný transkripční faktor obvykle různá, s různým stupněm afinity transkripčního faktoru pro různá vazebná místa. To ztěžuje přesnou reprezentaci vazebných míst transkripčního faktoru pomocí konsensuální sekvence, a jsou obvykle reprezentovány pomocí polohových frekvenčních matic (PSFM), které jsou často graficky znázorněny pomocí sekvenční loga. Tento argument je však částečně libovolný. Restrikční enzymy, stejně jako transkripční faktory, poskytují postupnou, i když ostrou řadu afinit pro různá místa [4] a jsou proto také nejlépe zastoupeny PSFM. Podobně místně specifické rekombinázy také vykazují pestrou škálu afinit k různým cílovým místům.[5][6]
Historie a hlavní experimentální techniky
Existence něčeho podobného vazebným místům pro DNA byla podezřelá z experimentů na biologii DNA bakteriofág lambda [7] a regulace Escherichia coli lac operon.[8] Vazebná místa pro DNA byla nakonec potvrzena v obou systémech [9][10][11] s příchodem Sekvenování DNA techniky. Od té doby byla pomocí hojnosti experimentálních metod objevena DNA vazebná místa pro mnoho transkripčních faktorů, restrikční enzymy a místně specifické rekombinázy. Historicky byly experimentálními technikami volby pro objevování a analýzu DNA vazebných míst DNAse footprinting test a Test posunu elektroforetické mobility (EMSA). Nicméně, vývoj DNA mikročipy a techniky rychlého sekvenování vedly k novým, masivně paralelním metodám in-vivo identifikace vazebných míst, jako je např Čip ChIP a ChIP-sekv.[12] Kvantifikovat vazebnou afinitu[13] proteinů a dalších molekul na specifická vazebná místa DNA biofyzikální metodou Mikroskopická termoforéza[14] se používá.
Databáze
Vzhledem k různorodé povaze experimentálních technik používaných při určování vazebných míst a nerovnoměrnému pokrytí většiny organismů a transkripčních faktorů neexistuje žádná centrální databáze (podobná GenBank na Národní centrum pro biotechnologické informace ) pro vazebná místa pro DNA. Přestože NCBI ve svých referenčních sekvencích uvažuje o anotaci vazebného místa pro DNA (RefSeq ), většina příspěvků tyto informace vynechává. Navíc kvůli omezenému úspěchu bioinformatiky při výrobě účinných nástrojů pro predikci vazebných míst pro DNA (velké falešně pozitivní sazby jsou často spojovány s metodami objevování in-silico motivů / metodami prohledávání stránek), nebylo zde žádné systematické úsilí o výpočetní anotaci těchto funkcí v sekvenovaných genomech.
Existuje však několik soukromých a veřejných databází věnovaných kompilaci experimentálně hlášených a někdy výpočetně předpovězených vazebných míst pro různé transkripční faktory v různých organismech. Níže je uvedena neúplná tabulka dostupných databází:
název | Organismy | Zdroj | Přístup | URL |
---|---|---|---|---|
PlantRegMap | 165 druhů rostlin (např. Arabidopsis thaliana, Oryza sativa, Zea mays atd.) | Odborné kurátorství a projekce | Veřejnost | [1] |
JASPAR | Obratlovci, rostliny, houby, mouchy a červi | Odborná kurátorství s podporou literatury | Veřejnost | [2] |
CIS-BP | Všechny eukaryoty | Experimentálně odvozené motivy a předpovědi | Veřejnost | [3] |
CollecTF | Prokaryotes | Kurátorství literatury | Veřejnost | [4] |
RegPrecise | Prokaryotes | Odborná kurátorství | Veřejnost | [5] |
RegTransBase | Prokaryotes | Odborník / kurátor literatury | Veřejnost | [6] |
RegulonDB | Escherichia coli | Odborná kurátorství | Veřejnost | [7] |
PRODORIC | Prokaryotes | Odborná kurátorství | Veřejnost | [8] |
TRANSFAC | Savci | Odborník / kurátor literatury | Veřejné / soukromé | [9] |
TRED | Člověk, myš, krysa | Počítačové předpovědi, ruční kurátorství | Veřejnost | [10] |
DBSD | Druhy Drosophila | Literatura / Odborná kurátorství | Veřejnost | [11] |
HOCOMOCO | Člověk, myš | Literatura / Odborná kurátorství | Veřejnost | [12],[13] |
MethMotif | Člověk, myš | Odborná kurátorství | Veřejnost | [14] |
Zastoupení vazebných míst pro DNA
Soubor vazebných míst pro DNA, obvykle označovaný jako motiv vázající DNA, může být reprezentován a konsensuální sekvence. Výhodou tohoto zobrazení je, že je kompaktní, ale na úkor nerespektování podstatného množství informací.[15] Přesnější způsob reprezentace vazebných míst je prostřednictvím pozičně specifických frekvenčních matic (PSFM). Tyto matice poskytují informace o frekvenci každé báze v každé poloze motivu vázajícího DNA.[3] PSFM jsou obvykle koncipovány s implicitním předpokladem polohové nezávislosti (různé polohy na vazebném místě DNA přispívají nezávisle na funkci místa), ačkoli tento předpoklad byl u některých vazebných míst DNA zpochybněn.[16] Informace o frekvenci v PSFM lze formálně interpretovat v rámci Teorie informací,[17] což vede k jeho grafickému znázornění jako a logo sekvence.
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | |
A | 1 | 0 | 1 | 5 | 32 | 5 | 35 | 23 | 34 | 14 | 43 | 13 | 34 | 4 | 52 | 3 |
C | 50 | 1 | 0 | 1 | 5 | 6 | 0 | 4 | 4 | 13 | 3 | 8 | 17 | 51 | 2 | 0 |
G | 0 | 0 | 54 | 15 | 5 | 5 | 12 | 2 | 7 | 1 | 1 | 3 | 1 | 0 | 1 | 52 |
T | 5 | 55 | 1 | 35 | 14 | 40 | 9 | 27 | 11 | 28 | 9 | 32 | 4 | 1 | 1 | 1 |
Součet | 56 | 56 | 56 | 56 | 56 | 56 | 56 | 56 | 56 | 56 | 56 | 56 | 56 | 56 | 56 | 56 |
PSFM pro transkripční represor LexA jak je odvozeno z 56 vazebných míst pro LexA uložených v Prodoric. Relativní frekvence se získají dělením počtu v každé buňce celkovým počtem (56)
Výpočetní vyhledávání a objevování vazebných míst
v bioinformatika lze rozlišit dva samostatné problémy týkající se DNA vazebných míst: hledání dalších členů známého DNA vazebného motivu (problém hledání místa) a objevování nových DNA vazebných motivů ve sbírkách funkčně souvisejících sekvencí ( sekvenční motiv problém s objevem).[18] Pro hledání vazebných míst bylo navrženo mnoho různých metod. Většina z nich se spoléhá na principy teorie informací a má k dispozici webové servery (Yellaboina) (Munch), zatímco jiní autoři se uchýlili k strojové učení metody, jako je umělé neuronové sítě.[3][19][20] K dispozici je také nepřeberné množství algoritmů sekvenční motiv objev. Tyto metody se opírají o hypotézu, že sada sekvencí sdílí z funkčních důvodů vazebný motiv. Metody objevování závazných motivů lze zhruba rozdělit na enumerativní, deterministické a stochastické.[21] MEME [22] a shoda [23] jsou klasickými příklady deterministické optimalizace, zatímco Gibbsův vzorkovač [24] je konvenční implementace čistě stochastické metody pro objevování motivů vázajících DNA. Další instancí této třídy metod je SeSiMCMC[25] který je zaměřen na slabá místa TFBS se symetrií. Zatímco výčtové metody se často uchylují regulární výraz reprezentace vazebných míst, PSFM a jejich formální zpracování v rámci metod teorie informací jsou reprezentací volby pro deterministické i stochastické metody. Hybridní metody, např. ChIPMunk[26] který kombinuje chamtivou optimalizaci s podvzorkováním, použijte také PSFM. Nedávné pokroky v sekvenování vedly k zavedení komparativních genomických přístupů k objevování motivů vázajících DNA, jak dokládá PhyloGibbs.[27][28]
Složitější metody pro vyhledávání vazebných míst a objevování motivů se spoléhají na stohování bází a další interakce mezi bázemi DNA, ale vzhledem k malým velikostem vzorků, které jsou obvykle k dispozici pro vazebná místa v DNA, jejich účinnost stále není zcela využita. Příkladem takového nástroje je ULPB[29]
Viz také
Reference
- ^ Halford E.S; Marko J.F (2004). „Jak mohou site-specific proteiny vázající DNA najít své cíle?“. Výzkum nukleových kyselin. 32 (10): 3040–3052. doi:10.1093 / nar / gkh624. PMC 434431. PMID 15178741.
- ^ Borneman, A.R .; Gianoulis, T. A.; Zhang, Z.D .; Yu, H .; Rozowsky, J .; Seringhaus, M.R .; Wang, L.Y .; Gerstein, M. & Snyder, M. (2007). "Divergence vazebných míst transkripčního faktoru napříč příbuznými druhy kvasinek". Věda. 317 (5839): 815–819. Bibcode:2007Sci ... 317..815B. doi:10.1126 / science.1140748. PMID 17690298. S2CID 21535866.
- ^ A b C Stormo GD (2000). „DNA vázací místa: reprezentace a objev“. Bioinformatika. 16 (1): 16–23. doi:10.1093 / bioinformatika / 16.1.16. PMID 10812473.
- ^ Pingoud A, Jeltsch A (1997). „Rozpoznávání a štěpení DNA restrikčními endonukleázami typu II“. European Journal of Biochemistry. 246 (1): 1–22. doi:10.1111 / j.1432-1033.1997.t01-6-00001.x. PMID 9210460.
- ^ Gyohda A, Komano T (2000). "Čištění a charakterizace rekombinázy specifické pro shufflon R64". Journal of Bacteriology. 182 (10): 2787–2792. doi:10.1128 / JB.182.10.2787-2792.2000. PMC 101987. PMID 10781547.
- ^ Birge, E.A. (2006). „15: Site specific recombination“. Genetika bakterií a bakteriofágů (5. vydání). Springer. 463–478. ISBN 978-0-387-23919-4.
- ^ Campbell A (1963). "Genetika jemné struktury a její vztah k funkci". Výroční přehled mikrobiologie. 17 (1): 2787–2792. doi:10.1146 / annurev.mi.17.100163.000405. PMID 14145311.
- ^ Jacob F, Monod J (1961). "Genetické regulační mechanismy při syntéze proteinů". Journal of Molecular Biology. 3 (3): 318–356. doi:10.1016 / S0022-2836 (61) 80072-7. PMID 13718526.
- ^ Gilbert W, Maxam A (1973). "Nukleotidová sekvence lac operátoru". Sborník Národní akademie věd Spojených států amerických. 70 (12): 3581–3584. Bibcode:1973PNAS ... 70,3581G. doi:10.1073 / pnas.70.12.3581. PMC 427284. PMID 4587255.
- ^ Maniatis T, Ptashne M, Barrell BG, Donelson J (1974). "Pořadí vazebného místa represoru v DNA bakteriofága lambda". Příroda. 250 (465): 394–397. Bibcode:1974Natur.250..394M. doi:10.1038 / 250394a0. PMID 4854243. S2CID 4204720.
- ^ Nash H. A (1975). „Integrativní rekombinace bakteriofágové DNA lambda in vitro“. Sborník Národní akademie věd Spojených států amerických. 72 (3): 1072–1076. Bibcode:1975PNAS ... 72.1072N. doi:10.1073 / pnas.72.3.1072. PMC 432468. PMID 1055366.
- ^ Elnitski L, Jin VX, Farnham PJ, Jones SJ (2006). „Lokalizace vazebných míst pro transkripční faktory savců: průzkum výpočetních a experimentálních technik“. Výzkum genomu. 16 (12): 1455–1464. doi:10,1101 / gr. 4140006. PMID 17053094.
- ^ Baaske P, Wienken CJ, Reineck P, Duhr S, Braun D (únor 2010). "Optická termoforéza kvantifikuje závislost Aptamer Binding na pufru". Angew. Chem. Int. Vyd. 49 (12): 2238–41. doi:10.1002 / anie.200903998. PMID 20186894. S2CID 42489892. Shrnutí ležel – Phsyorg.com.
- ^ Wienken CJ; et al. (2010). „Proteinové vazebné testy v biologických kapalinách pomocí termoforézy v mikroskopickém měřítku“. Příroda komunikace. 1 (7): 100. Bibcode:2010NatCo ... 1..100W. doi:10.1038 / ncomms1093. PMID 20981028.
- ^ Schneider T.D (2002). „Consensus sequence Zen“. Aplikovaná bioinformatika. 1 (3): 111–119. PMC 1852464. PMID 15130839.
- ^ Bulyk M.L; Johnson P.L; Church G.M (2002). „Nukleotidy vazebných míst transkripčního faktoru mají vzájemně závislé účinky na vazebné afinity transkripčních faktorů“. Výzkum nukleových kyselin. 30 (5): 1255–1261. doi:10.1093 / nar / 30.5.1255. PMC 101241. PMID 11861919.
- ^ Schneider TD, Stormo GD, Gold L, Ehrenfeucht A (1986). "Informační obsah vazebných míst na nukleotidových sekvencích". Journal of Molecular Biology. 188 (3): 415–431X. doi:10.1016/0022-2836(86)90165-8. PMID 3525846.
- ^ Erill I; O'Neill M.C (2009). „Reexamination of information theory-based methods for DNA-binding site identification“. BMC bioinformatika. 10 (1): 57. doi:10.1186/1471-2105-10-57. PMC 2680408. PMID 19210776.
- ^ Bisant D, Maizel J. (1995). „Identifikace vazebných míst ribozomu v Escherichia coli pomocí modelů neuronových sítí“. Výzkum nukleových kyselin. 23 (9): 1632–1639. doi:10.1093 / nar / 23.9.1632. PMC 306908. PMID 7784221.
- ^ O'Neill M.C (1991). „Školení neuronových sítí zpětného šíření k definování a detekci vazebných míst pro DNA“. Výzkum nukleových kyselin. 19 (2): 133–318. doi:10.1093 / nar / 19.2.313. PMC 333596. PMID 2014171.
- ^ Bailey T.L (2008). Msgstr "Objevování sekvenčních motivů". Bioinformatika (PDF). Metody v molekulární biologii. Metody v molekulární biologii ™. 452. 231–251. doi:10.1007/978-1-60327-159-2_12. ISBN 978-1-58829-707-5. PMID 18566768.
- ^ Bailey T.L (2002). Msgstr "Objevování nových sekvenčních motivů s MEME". Současné protokoly v bioinformatice. 2 (4): 2.4.1–2.4.35. doi:10.1002 / 0471250953.bi0204s00. PMID 18792935. S2CID 205157795.
- ^ Stormo GD, Hartzell GW 3. (1989). „Identifikace vazebných míst na proteiny z nezarovnaných fragmentů DNA“. Sborník Národní akademie věd Spojených států amerických. 86 (4): 1183–1187. Bibcode:1989PNAS ... 86.1183S. doi:10.1073 / pnas.86.4.1183. PMC 286650. PMID 2919167.
- ^ Lawrence CE, Altschul SF, Boguski MS, Liu JS, Neuwald AF, Wootton JC (1993). Msgstr "Detekce jemných sekvenčních signálů: Gibbsova strategie vzorkování pro vícenásobné zarovnání". Věda. 262 (5131): 208–214. Bibcode:1993Sci ... 262..208L. doi:10.1126 / science.8211139. PMID 8211139. S2CID 3040614.
- ^ Favorov, A V; MS Gelfand; V Gerasimova; D A Ravcheev; A A Mironov; V J Makeev (2005-05-15). „Gibbsův vzorkovač pro identifikaci symetricky strukturovaných, rozmístěných DNA motivů se zlepšeným odhadem délky signálu“. Bioinformatika. 21 (10): 2240–2245. doi:10.1093 / bioinformatika / bti336. ISSN 1367-4803. PMID 15728117.
- ^ Kulakovskij, I V; V A Boeva; A V Favorov; V J Makeev (2010-08-24). "Hluboké a široké kopání pro vázání motivů v datech ChIP-Seq". Bioinformatika. 26 (20): 2622–3. doi:10.1093 / bioinformatika / btq488. ISSN 1367-4811. PMID 20736340.
- ^ Das MK, Dai HK (2007). „Průzkum algoritmů pro hledání motivů DNA“. BMC bioinformatika. 8 (Suppl 7): S21. doi:10.1186 / 1471-2105-8-S7-S21. PMC 2099490. PMID 18047721.
- ^ Siddharthan R, Siggia ED, van Nimwegen E (2005). „PhyloGibbs: Gibbsův vyhledávač motivů, který obsahuje fylogenezi“. PLOS Comput Biol. 1 (7): e67. Bibcode:2005PLSCB ... 1 ... 67S. doi:10.1371 / journal.pcbi.0010067. PMC 1309704. PMID 16477324.
- ^ Salama RA, Stekel DJ (2010). „Zahrnutí vzájemných závislostí sousedních bází podstatně zlepšuje predikci vazebného místa prokaryotického transkripčního faktoru v celém genomu.“. Výzkum nukleových kyselin. 38 (12): e135. doi:10.1093 / nar / gkq274. PMC 2896541. PMID 20439311.
externí odkazy
- ENCODE vlákna Explorer Motivy transkripčních faktorů v Příroda
- Ručně vybrané kurátorské motivy TF pro 157 druhů rostlin