BASys - BASys
Obsah | |
---|---|
Popis | Pro automatickou anotaci bakteriálního genomu a generování chromozomální mapy |
Typy dat zajat | Zadávání dat: Sekvence surového genomu (formát FASTA), označená sekvence genomu (formát FAST) nebo předpokládaná / značená sekvence proteomu (FASTA); Výstup dat: Plně anotovaný genom spolu s interaktivní anotovanou mapou genomu |
Kontakt | |
Výzkumné centrum | University of Alberta |
Laboratoř | Dr. David Wishart |
Primární citace | [1] |
Přístup | |
webová stránka | https://www.basys.ca/ |
Stáhnout URL | https://www.basys.ca/ |
Smíšený | |
Uvolnění dat frekvence | Poslední aktualizace 2012 |
Kurátorská politika | Ručně upraveno |
BASys (Bacterial Annotation System) je volně dostupný webový server, který lze použít k provádění automatizované, komplexní anotace bakteriálních genomy.[2] S příchodem sekvenování DNA nové generace je nyní možné sekvenovat kompletní genom a bakterie (obvykle ~ 4 miliony základen) během jediného dne. To vedlo k výbuchu v počtu plně sekvenovaných mikroby. Ve skutečnosti od roku 2013 existovalo více než 2700 plně sekvenovaných bakterií genomy uložen u GenBank. Pokračující výzvou mikrobiální genomiky je však nalezení zdrojů nebo nástrojů pro anotování velkého počtu nově sekvenovaných genomy. BASys byl vyvinut v roce 2005 v očekávání těchto potřeb. Ve skutečnosti byla společnost BASys první veřejně přístupnou mikrobiální látkou na světě genom anotační webový server. Díky své široké popularitě byl server BASys aktualizován v roce 2011 přidáním více uzlů serveru, aby zvládly velký počet dotazů, které dostával.
Server BASys je navržen tak, aby přijímal buď shromážděná data genomu (raw Sekvence DNA údaje) nebo úplné proteom úkoly jako vstup. Pokud je syrový Sekvence DNA poskytuje, společnost BASys zaměstnává Záblesk (verze 2.1.3) k identifikaci genů.[1] Výstupem z BASys je komplexní anotace celého genomu (s ~ 60 podpolemi anotací pro každý gen) a zvětšitelný, hypertextový odkaz mapa genomu genomu dotazu. BASys používá téměř 30 různých programů ke stanovení a anotaci názvů genů / proteinů, funkcí GO, funkcí COG, možných paralogů a ortologů, molekulové hmotnosti, izoelektrického bodu, operon struktura, subcelulární lokalizace, signální peptidy, transmembránové oblasti, sekundární struktura, 3D struktura, reakce a dráhy. Úplný seznam programů používaných programem BASys je uveden níže:
název | Metoda |
---|---|
Záblesk 2.1.3 | Záblesk je populární a velmi přesný program pro vyhledávání genů ab initio pro mikrobiální DNA. Na studii 31 úplných bakteriálních a archaálních genomů Záblesk dosáhl průměrné přesnosti predikce genu 99,36%. Záblesk používá Interpolované Markovovy modely k rozlišení kódujících oblastí od nekódující DNA. Záblesk S rostoucím obsahem GC klesá výkon. U genomů s vysokým obsahem GC (> 60%) Záblesk může generovat vysoký počet falešně pozitivních předpovědí, a proto je třeba je používat opatrně. |
HMMER 2.3.2 | Používá se pro místní vyhledávání Pfam |
Homodeller 2.0 | Místně vyvinutý homologické modelování program. |
SignalP 3.0 | Predikce signálního peptidu. |
TMHMM 2.0 | Předpověď transmembránové šroubovice v proteinu. |
PSIPRED 2.45 | Predikce sekundární struktury. PSIPRED dosáhne průměrného skóre Q3 80,6% pro sekundární struktura předpověď. |
PS_scan | Nástroj pro místní PROSITE skenování. |
VADAR 1.4 | Lokálně vyvinutý nástroj pro analýzu struktury proteinů. BASys používá VADAR k analýze proteinových struktur pro sekundární strukturní informace |
PSORT-B 2.0.4 | Používá se k předpovědi subcelulární polohy. PSORT-B dosahuje přesnosti 96% Grampozitivní a Gramnegativní bakterie |
ProteinNameExtractor 1.0 | Predikční modul funkce BASys. Tento modul byl ověřen proti sadě odborně anotovaných proteinů z C.trachomatis. |
FindParalogs 1.0 | Modul BASys pro identifikaci paralogu. Databáze paralogů je vytvořena z koncepčních překladů pro identifikované oblasti kódování dodávané BASys Záblesk nebo zadavatelem. |
FindHomologs 1.0 | Modul BASys pro identifikaci homologu. Vyhledává možné modelové databáze organismů homology. |
GOSearch 1.0 | Modul BASys pro extrakci Genová ontologie informace z různých zdrojů. |
OperonFinder 1.0 | Modul BASys pro identifikaci operony. |
StructureManager 1.0 | Modul BASys pro manipulaci proteinová struktura soubory. |
StructureClassifier 1.0 | Modul BASys pro určení třídy struktury z sekundární struktura informace. |
Vyhledávač struktur 1.0 | Modul BASys pro generování proteinové struktury z různých zdrojů. |
COG_Finder 1.0 | Modul BASys pro identifikaci funkčních kategorií COG a přístupů |
Vedoucí sekundární struktury 1.0 | Modul BASys pro generování sekundární struktura informace z různých zdrojů. |
ECNumber_Finder | Modul BASys pro mapování EC_number do az různých zdrojů. |
SwissProt Annotation Manager 1.0 | Modul BASys pro porovnání a přechodné použití anotací z SwissProt evidence. |
Správce anotací CCDB 1.0 | Modul BASys pro porovnání a přechodné použití anotací ze záznamů CCDB. |
Identifikátor genu 1.0 | Modul BASys pro koordinaci informací o genové identifikaci z záblesk nebo příspěvky uživatelů |
BASys Annotation Manager 1.0 | Správce potrubí BASys. |
Správce vyhledávání KEGG | Modul BASys pro vyhledávání a extrakci metabolických informací z KEGG. |
SubCellLocalization Manager 1.0 | Modul BASys pro generování subcelulární umístění anotace z různých zdrojů. |
Kromě své rozsáhlé anotace pro každý gen / protein v genomu dotazu, BASys také generuje barevné, klikatelné a plně zvětšitelné kruhové mapy každého vstupu chromozóm. Tyto bakteriální mapy genomu jsou generovány pomocí programu s názvem CGView (Circular Genome Viewer), který byl vyvinut v roce 2004.[3] The mapy genomu jsou navrženy tak, aby umožňovaly rychlou navigaci a detailní vizualizaci všech anotací genů generovaných BASys. Kompletní běh BASys trvá přibližně 16 hodin u průměrného bakteriálního chromozomu (přibližně 4 megabázy). Anotace BASys lze prohlížet a stahovat anonymně nebo prostřednictvím přístupového systému chráněného heslem. BASys uloží své poznámky o bakteriálním genomu na serveru maximálně po dobu 180 dnů. BASys zpracovává přibližně 1 000 podání ročně. BASys je přístupný na https://www.basys.ca/
Rozsah a přístup
Všechna data v BacMap jsou nechráněná nebo jsou odvozena z nechráněného zdroje. Je volně přístupný a dostupný komukoli. Kromě toho je téměř každá datová položka plně vysledovatelná a výslovně odkazuje na původní zdroj. Data BacMap jsou k dispozici prostřednictvím veřejného webového rozhraní a ke stažení.
Viz také
Reference
- ^ A b Van Domselaar, GH; Stothard P; Shrivastava S; Cruz JA; Guo A; Dong X; Lu P; Szafron D; Greiner R; Wishart DS. (Červenec 2005). „BASys: webový server pro automatickou anotaci bakteriálního genomu“. Nucleic Acids Res. 33 (Problém s webovým serverem): W455–9. doi:10.1093 / nar / gki593. PMC 1160269. PMID 15980511.
- ^ Stothard P, Van Domselaar G, Shrivastava S, Guo A, O'Neill B, Cruz J, Ellison M, Wishart DS (2005). „BacMap: interaktivní obrazový atlas anotovaných bakteriálních genomů“. Nucleic Acids Res. 33 (Problém s databází): D317–20. doi:10.1093 / nar / gki075. PMC 540029. PMID 15608206.
- ^ Stothard, P; Wishart DS (2005). „Vizualizace a průzkum kruhového genomu pomocí CGView“. Bioinformatika. 21 (4): 537–9. doi:10.1093 / bioinformatika / bti054. PMID 15479716.