BASys - BASys

BASys
Obsah
PopisPro automatickou anotaci bakteriálního genomu a generování chromozomální mapy
Typy dat
zajat
Zadávání dat: Sekvence surového genomu (formát FASTA), označená sekvence genomu (formát FAST) nebo předpokládaná / značená sekvence proteomu (FASTA); Výstup dat: Plně anotovaný genom spolu s interaktivní anotovanou mapou genomu
Kontakt
Výzkumné centrumUniversity of Alberta
LaboratořDr. David Wishart
Primární citace[1]
Přístup
webová stránkahttps://www.basys.ca/
Stáhnout URLhttps://www.basys.ca/
Smíšený
Uvolnění dat
frekvence
Poslední aktualizace 2012
Kurátorská politikaRučně upraveno

BASys (Bacterial Annotation System) je volně dostupný webový server, který lze použít k provádění automatizované, komplexní anotace bakteriálních genomy.[2] S příchodem sekvenování DNA nové generace je nyní možné sekvenovat kompletní genom a bakterie (obvykle ~ 4 miliony základen) během jediného dne. To vedlo k výbuchu v počtu plně sekvenovaných mikroby. Ve skutečnosti od roku 2013 existovalo více než 2700 plně sekvenovaných bakterií genomy uložen u GenBank. Pokračující výzvou mikrobiální genomiky je však nalezení zdrojů nebo nástrojů pro anotování velkého počtu nově sekvenovaných genomy. BASys byl vyvinut v roce 2005 v očekávání těchto potřeb. Ve skutečnosti byla společnost BASys první veřejně přístupnou mikrobiální látkou na světě genom anotační webový server. Díky své široké popularitě byl server BASys aktualizován v roce 2011 přidáním více uzlů serveru, aby zvládly velký počet dotazů, které dostával.

Server BASys je navržen tak, aby přijímal buď shromážděná data genomu (raw Sekvence DNA údaje) nebo úplné proteom úkoly jako vstup. Pokud je syrový Sekvence DNA poskytuje, společnost BASys zaměstnává Záblesk (verze 2.1.3) k identifikaci genů.[1] Výstupem z BASys je komplexní anotace celého genomu (s ~ 60 podpolemi anotací pro každý gen) a zvětšitelný, hypertextový odkaz mapa genomu genomu dotazu. BASys používá téměř 30 různých programů ke stanovení a anotaci názvů genů / proteinů, funkcí GO, funkcí COG, možných paralogů a ortologů, molekulové hmotnosti, izoelektrického bodu, operon struktura, subcelulární lokalizace, signální peptidy, transmembránové oblasti, sekundární struktura, 3D struktura, reakce a dráhy. Úplný seznam programů používaných programem BASys je uveden níže:

názevMetoda
Záblesk 2.1.3Záblesk je populární a velmi přesný program pro vyhledávání genů ab initio pro mikrobiální DNA. Na studii 31 úplných bakteriálních a archaálních genomů Záblesk dosáhl průměrné přesnosti predikce genu 99,36%. Záblesk používá Interpolované Markovovy modely k rozlišení kódujících oblastí od nekódující DNA. Záblesk S rostoucím obsahem GC klesá výkon. U genomů s vysokým obsahem GC (> 60%) Záblesk může generovat vysoký počet falešně pozitivních předpovědí, a proto je třeba je používat opatrně.
HMMER 2.3.2Používá se pro místní vyhledávání Pfam
Homodeller 2.0Místně vyvinutý homologické modelování program.
SignalP 3.0Predikce signálního peptidu.
TMHMM 2.0Předpověď transmembránové šroubovice v proteinu.
PSIPRED 2.45Predikce sekundární struktury. PSIPRED dosáhne průměrného skóre Q3 80,6% pro sekundární struktura předpověď.
PS_scanNástroj pro místní PROSITE skenování.
VADAR 1.4Lokálně vyvinutý nástroj pro analýzu struktury proteinů. BASys používá VADAR k analýze proteinových struktur pro sekundární strukturní informace
PSORT-B 2.0.4Používá se k předpovědi subcelulární polohy. PSORT-B dosahuje přesnosti 96% Grampozitivní a Gramnegativní bakterie
ProteinNameExtractor 1.0Predikční modul funkce BASys. Tento modul byl ověřen proti sadě odborně anotovaných proteinů z C.trachomatis.
FindParalogs 1.0Modul BASys pro identifikaci paralogu. Databáze paralogů je vytvořena z koncepčních překladů pro identifikované oblasti kódování dodávané BASys Záblesk nebo zadavatelem.
FindHomologs 1.0Modul BASys pro identifikaci homologu. Vyhledává možné modelové databáze organismů homology.
GOSearch 1.0Modul BASys pro extrakci Genová ontologie informace z různých zdrojů.
OperonFinder 1.0Modul BASys pro identifikaci operony.
StructureManager 1.0Modul BASys pro manipulaci proteinová struktura soubory.
StructureClassifier 1.0Modul BASys pro určení třídy struktury z sekundární struktura informace.
Vyhledávač struktur 1.0Modul BASys pro generování proteinové struktury z různých zdrojů.
COG_Finder 1.0Modul BASys pro identifikaci funkčních kategorií COG a přístupů
Vedoucí sekundární struktury 1.0Modul BASys pro generování sekundární struktura informace z různých zdrojů.
ECNumber_FinderModul BASys pro mapování EC_number do az různých zdrojů.
SwissProt Annotation Manager 1.0Modul BASys pro porovnání a přechodné použití anotací z SwissProt evidence.
Správce anotací CCDB 1.0Modul BASys pro porovnání a přechodné použití anotací ze záznamů CCDB.
Identifikátor genu 1.0Modul BASys pro koordinaci informací o genové identifikaci z záblesk nebo příspěvky uživatelů
BASys Annotation Manager 1.0Správce potrubí BASys.
Správce vyhledávání KEGGModul BASys pro vyhledávání a extrakci metabolických informací z KEGG.
SubCellLocalization Manager 1.0Modul BASys pro generování subcelulární umístění anotace z různých zdrojů.

Kromě své rozsáhlé anotace pro každý gen / protein v genomu dotazu, BASys také generuje barevné, klikatelné a plně zvětšitelné kruhové mapy každého vstupu chromozóm. Tyto bakteriální mapy genomu jsou generovány pomocí programu s názvem CGView (Circular Genome Viewer), který byl vyvinut v roce 2004.[3] The mapy genomu jsou navrženy tak, aby umožňovaly rychlou navigaci a detailní vizualizaci všech anotací genů generovaných BASys. Kompletní běh BASys trvá přibližně 16 hodin u průměrného bakteriálního chromozomu (přibližně 4 megabázy). Anotace BASys lze prohlížet a stahovat anonymně nebo prostřednictvím přístupového systému chráněného heslem. BASys uloží své poznámky o bakteriálním genomu na serveru maximálně po dobu 180 dnů. BASys zpracovává přibližně 1 000 podání ročně. BASys je přístupný na https://www.basys.ca/

Rozsah a přístup

Všechna data v BacMap jsou nechráněná nebo jsou odvozena z nechráněného zdroje. Je volně přístupný a dostupný komukoli. Kromě toho je téměř každá datová položka plně vysledovatelná a výslovně odkazuje na původní zdroj. Data BacMap jsou k dispozici prostřednictvím veřejného webového rozhraní a ke stažení.

Viz také

Reference

  1. ^ A b Van Domselaar, GH; Stothard P; Shrivastava S; Cruz JA; Guo A; Dong X; Lu P; Szafron D; Greiner R; Wishart DS. (Červenec 2005). „BASys: webový server pro automatickou anotaci bakteriálního genomu“. Nucleic Acids Res. 33 (Problém s webovým serverem): W455–9. doi:10.1093 / nar / gki593. PMC  1160269. PMID  15980511.
  2. ^ Stothard P, Van Domselaar G, Shrivastava S, Guo A, O'Neill B, Cruz J, Ellison M, Wishart DS (2005). „BacMap: interaktivní obrazový atlas anotovaných bakteriálních genomů“. Nucleic Acids Res. 33 (Problém s databází): D317–20. doi:10.1093 / nar / gki075. PMC  540029. PMID  15608206.
  3. ^ Stothard, P; Wishart DS (2005). „Vizualizace a průzkum kruhového genomu pomocí CGView“. Bioinformatika. 21 (4): 537–9. doi:10.1093 / bioinformatika / bti054. PMID  15479716.