TRANSFAC - TRANSFAC
![]() | |
---|---|
Obsah | |
Popis | Databáze transkripčních faktorů |
Typy dat zajat | Eukaryotický transkripční faktory, jejich vazebná místa a profily vazeb |
Organismy | eukaryoty |
Kontakt | |
Výzkumné centrum | Helmholtzovo centrum pro výzkum infekcí; BIOBASE GmbH; geneXplain GmbH |
Primární citace | Wingender (2008)[1] |
Datum vydání | 1988 |
Přístup | |
webová stránka | TRANSFAC 7.0 Public 2005 |
TRANSFAC (TRANScription FACtor database) je ručně spravovaná databáze eukaryotů transkripční faktory, jejich genomová vazebná místa a DNA vázací profily. Obsah databáze lze použít k předpovědi potenciálu vazebná místa transkripčního faktoru.
Úvod
Původem databáze byl raný sběr dat publikovaný v roce 1988.[2] První verze, která byla vydána pod názvem TRANSFAC, byla vyvinuta v bývalém německém Národním výzkumném středisku pro biotechnologie a byla navržena pro místní instalaci (nyní: Helmholtzovo centrum pro výzkum infekcí ).[3] V jednom z prvních veřejně financovaných bioinformatických projektů, zahájeném v roce 1993, se z TRANSFACu vyvinul zdroj, který byl k dispozici na internetu.[4]
V roce 1997 byl TRANSFAC převeden do nově založené společnosti, BIOBASE, aby bylo zajištěno dlouhodobé financování databáze. Od té doby musí být nejnovější verze licencována, zatímco starší verze jsou pro nekomerční uživatele zdarma.[5][6] Od července 2016 je TRANSFAC udržován a distribuován společností genXplain GmbH, Wolfenbüttel, Německo.[7]
Obsah a funkce
Obsah databáze je organizován tak, že je soustředěn kolem interakce mezi transkripčními faktory (TF) a jejich vazebnými místy pro DNA (TFBS). TF jsou popsány s ohledem na jejich strukturální a funkční vlastnosti, extrahované z původní vědecké literatury. Jsou zařazeni do rodin, tříd a nadtříd podle jejich vlastností DNA vazebné domény.[8][9][10][11]
Vazba TF na genomové místo je dokumentována specifikováním lokalizace místa, jeho sekvence a použité experimentální metody. Všechny weby, které odkazují na jeden TF nebo skupinu úzce souvisejících TF, jsou zarovnány a použity k vytvoření a polohovací bodovací matice (PSSM) nebo matice počítání. Mnoho matic knihovny matic TRANSFAC bylo vytvořeno týmem kurátoři, další byly převzaty z vědeckých publikací.
Dostupnost
Používání starší verze systému TRANSFAC je pro neziskové uživatele zdarma. Přístup k nejaktuálnější verzi vyžaduje licenci.
Aplikace
Databázi TRANSFAC lze použít jako encyklopedii eukaryotických transkripčních faktorů. Cílové sekvence a regulované geny mohou být uvedeny pro každý TF, který lze použít jako měřítko pro nástroje rozpoznávání TFBS nebo jako tréninkové sady pro nové algoritmy rozpoznávání vazebných míst transkripčních faktorů (TFBS).[12] Klasifikace TF umožňuje analyzovat takové datové soubory s ohledem na vlastnosti domén vázajících DNA.[13] Další aplikací je načíst všechny TF, které regulují daný (sada) genů. V kontextu systémově-biologických studií byly ke konstrukci a analýze regulačních sítí transkripce použity vztahy genů TF-cíl dokumentované v TRANSFAC.[14][15]Zdaleka nejčastějším použitím TRANSFAC je výpočetní predikce potenciálního TFBS. Existuje řada algoritmů, které pro tento účel používají jednotlivá vazebná místa nebo maticovou knihovnu:
- Patch - analyzuje podobnosti sekvencí s vazebnými místy dokumentovanými v TRANSFACu; je poskytován spolu s databází.[16][17]
- SiteSeer - analyzuje sekvenční podobnosti s vazebnými místy dokumentovanými v TRANSFACu.[18][19]
- Shoda - identifikuje potenciální TFBS pomocí maticové knihovny; je poskytován spolu s databází.[20][21]
- TESS (Transcription Element Search System) - analyzuje sekvenční podobnosti s vazebnými místy TRANSFACu a potenciálními vazebnými místy pomocí maticových knihoven TRANSFAC a tří dalších zdrojů.[22][23] TESS také poskytuje program pro identifikaci cis-regulačních modulů (CRM, charakteristické kombinace TFBS), který využívá matice TRANSFAC.[24]
- PROMO - maticová předpověď TFBS pomocí komerční verze databáze[25][26]
- TFM Explorer - Identifikace běžných potenciálních TFBS v sadě genů[27][28]
- MotifMogul - maticová sekvenční analýza s řadou různých algoritmů[29]
- ConTra - maticová sekvenční analýza v konzervovaných promotorových oblastech[30][31]
- PMS (Poly Matrix Search) - sekvenční analýza založená na matrici v konzervovaných oblastech promotoru [32][33]
Porovnání matic s maticovou knihovnou TRANSFAC a dalších zdrojů:
- T-Reg komparátor[34] porovnat jednotlivce nebo skupiny matic s maticemi TRANSFAC nebo jiných knihoven.
- MACO (Poly Matrix Search)[35][36] - maticové srovnání s maticovými knihovnami.
Řada serverů poskytuje genomické anotace počítané pomocí TRANSFAC.[37][38] Jiní použili takové analýzy k odvození sad cílových genů.[39][40]
Viz také
Reference
- ^ Wingender E (červenec 2008). „Projekt TRANSFAC jako příklad rámcové technologie, která podporuje analýzu genomové regulace“. Stručný. Bioinformatika. 9 (4): 326–32. doi:10.1093 / bib / bbn016. PMID 18436575.
- ^ Wingender E (březen 1988). "Kompilace proteinů regulujících transkripci". Nucleic Acids Res. 16 (5): 1879–902. doi:10.1093 / nar / 16.5.1879. PMC 338188. PMID 3282223.
- ^ Wingender E, Heinemeyer T, Lincoln D (1991). "Regulační sekvence DNA: předvídatelnost jejich funkce". Analýza genomu - od sekvence po funkci; BioTechForum - Pokroky v molekulární genetice (J. Collins, A. J. Driesel, Eds.). 4: 95–108.
- ^ Wingender E, Dietze P, Karas H, Knüppel R (leden 1996). „TRANSFAC: databáze transkripčních faktorů a jejich vazebných míst pro DNA“. Nucleic Acids Res. 24 (1): 238–41. doi:10.1093 / nar / 24.1.238. PMC 145586. PMID 8594589.
- ^ TRANSFAC Public na portálu pro regulaci genů BIOBASE
- ^ Přístup na TRANSFAC Public prostřednictvím TESS Archivováno 2012-07-24 na Wayback Machine v Laboratoři výpočetní biologie a informatiky (CBIL) v Brně University of Pennsylvania (Penn)
- ^ TRANSFAC převzal genXplain
- ^ Wingender E (1997). "[Klasifikace eukaryotických transkripčních faktorů]". Mol. Biol. (Mosk.) (v Rusku). 31 (4): 584–600. PMID 9340487.
- ^ Heinemeyer T, Chen X, Karas H, Kel AE, Kel OV, Liebich I, Meinhardt T, Reuter I, Schacherer F, Wingender E (leden 1999). „Rozšíření databáze TRANSFAC směrem k expertnímu systému regulačních molekulárních mechanismů“. Nucleic Acids Res. 27 (1): 318–22. doi:10.1093 / nar / 27.1.318. PMC 148171. PMID 9847216.
- ^ Stegmaier P, Kel AE, Wingender E (2004). "Systematická klasifikace transkripčních faktorů na doménu vázající DNA". Genome Inform. 15 (2): 276–86. PMID 15706513.
- ^ Wingender, E: Klasifikace transkripčních faktorů
- ^ Tompa M, Li N, Bailey TL, Church GM, De Moor B, Eskin E, Favorov AV, Frith MC, Fu Y, Kent WJ, Makeev VJ, Mironov AA, Noble WS, Pavesi G, Pesole G, Régnier M, Simonis N, Sinha S, Thijs G, van Helden J, Vandenbogaert M, Weng Z, Workman C, Ye C, Zhu Z (leden 2005). "Hodnocení výpočetních nástrojů pro objevení vazebných míst transkripčních faktorů". Nat. Biotechnol. 23 (1): 137–44. doi:10.1038 / nbt1053. PMID 15637633. S2CID 3234451.
- ^ Narlikar L, Gordân R, Ohler U, Hartemink AJ (červenec 2006). „Informativní výsledky založené na strukturní třídě transkripčních faktorů zlepšují objevování motivů de novo“. Bioinformatika. 22 (14): e384–92. doi:10.1093 / bioinformatika / btl251. PMID 16873497.
- ^ Goemann B, Wingender E, Potapov AP (2009). „Přístup k vyhodnocení topologického významu motivů a dalších vzorů v regulačních sítích“. BMC Syst Biol. 3: 53. doi:10.1186/1752-0509-3-53. PMC 2694767. PMID 19454001.
- ^ Kozhenkov S, Dubinina Y, Sedova M, Gupta A, Ponomarenko J, Baitaluk M (2010). „BiologicalNetworks 2.0 - integrativní pohled na biologická data genomu“. BMC bioinformatika. 11: 610. doi:10.1186/1471-2105-11-610. PMC 3019228. PMID 21190573.
- ^ Náplast na bezplatném portálu BIOBASE
- ^ Matys V, Kel-Margoulis OV, Fricke E, Liebich I, Land S, Barre-Dirrie A, Reuter I, Chekmenev D, Krull M, Hornischer K, Voss N, Stegmaier P, Lewicki-Potapov B, Saxel H, Kel AE , Wingender E (leden 2006). „TRANSFAC a jeho modul TRANSCompel: regulace transkripčních genů u eukaryot“. Nucleic Acids Res. 34 (Problém s databází): D108–10. doi:10.1093 / nar / gkj143. PMC 1347505. PMID 16381825.
- ^ SiteSeer Archivováno 2011-06-25 na Wayback Machine z University of Manchester
- ^ Boardman PE, Oliver SG, Hubbard SJ (červenec 2003). „SiteSeer: Vizualizace a analýza vazebných míst transkripčního faktoru v nukleotidových sekvencích“. Nucleic Acids Res. 31 (13): 3572–5. doi:10.1093 / nar / gkg511. PMC 168918. PMID 12824368.
- ^ Zápas na bezplatném portálu BIOBASE
- ^ Kel AE, Gössling E, Reuter I, Cheremushkin E, Kel-Margoulis OV, Wingender E (červenec 2003). "MATCH: Nástroj pro vyhledávání míst vázajících transkripční faktory v sekvencích DNA". Nucleic Acids Res. 31 (13): 3576–9. doi:10,1093 / nar / gkg585. PMC 169193. PMID 12824369.
- ^ TESS (vyhledávací systém s transkripčními prvky) ve společnosti CBIL of University of Pennsylvania
- ^ Vyhledávání na stránkách u TESS Archivováno 2012-07-24 na Wayback Machine
- ^ AnGEL CRM vyhledává Archivováno 2012-07-24 na Wayback Machine v systému TESS
- ^ PROMO na serveru ALGGEN serveru Polytechnická univerzita v Katalánsku (UPC)
- ^ Messeguer X, Escudero R, Farré D, Núñez O, Martínez J, Albà MM (únor 2002). "PROMO: detekce známých regulačních prvků transkripce pomocí vyhledávání podle druhů". Bioinformatika. 18 (2): 333–4. doi:10.1093 / bioinformatika / 18.2.333. PMID 11847087.
- ^ Průzkumník TFM na bioinformatickém softwarovém serveru skupiny SEQUOIA
- ^ Tonon L, Touzet H, Varré JS (červenec 2010). „TFM-Explorer: těžba cis-regulačních oblastí v genomech“. Nucleic Acids Res. 38 (Problém s webovým serverem): W286–92. doi:10.1093 / nar / gkq473. PMC 2896114. PMID 20522509.
- ^ MotifMogul Institutu pro systémovou biologii v Seattlu
- ^ ConTra z Gentská univerzita
- ^ Hooghe B, Hulpiau P, van Roy F, De Bleser P (červenec 2008). „ConTra: nástroj pro analýzu uspořádání promotorů pro identifikaci vazebných míst transkripčních faktorů napříč druhy“. Nucleic Acids Res. 36 (Problém s webovým serverem): W128–32. doi:10.1093 / nar / gkn195. PMC 2447729. PMID 18453628.
- ^ PMS Archivováno 2012-07-10[Délka časového razítka] na Archiv. Dnes, vyvinutý na Nanjing University
- ^ Su G, Mao B, Wang J (2006). „Webový server pro předpověď predikce vazebného faktoru transkripce“. Bioinformace. 1 (5): 156–7. doi:10.6026/97320630001156. PMC 1891680. PMID 17597879.
- ^ T-Reg komparátor Archivováno 2012-07-18[Délka časového razítka] na Archiv. Dnes na serveru Max Planck Institute for Molecular Genetics
- ^ MACO Archivováno 2012-07-10[Délka časového razítka] na Archiv. Dnes, vyvinutý v Nanjing University
- ^ Su G, Mao B, Wang J (2006). „MACO: nástroj pro bodování zarovnání mezer pro srovnání vazebných míst transkripčních faktorů“. V Silico Biol. (Gedrukt). 6 (4): 307–10. PMID 16922693.
- ^ PReMOD: Lidský a myší genom z let 2004 a 2005; IRCM / McGill University, Montreal
- ^ PRIMA: Lidský genom z roku 2004; Tel-Aviv University
- ^ MSigDB: Sady cílových genů savčích transkripčních faktorů; GSEA wiki server Široký institut MIT a Harvard, Cambridge, MA
- ^ Xie X, Lu J, Kulbokas EJ, Golub TR, Mootha V, Lindblad-Toh K, Lander ES, Kellis M (březen 2005). „Systematický objev regulačních motivů v lidských promotorech a 3 'UTRs porovnáním několika savců“. Příroda. 434 (7031): 338–45. doi:10.1038 / nature03441. PMC 2923337. PMID 15735639.
externí odkazy
- Historie databáze TRANSFAC na domovské stránce Edgara Wingendera