Mikroby online - MicrobesOnline
Mikroby online je veřejně a volně přístupná webová stránka, která hostí řadu komparativních genomických nástrojů pro srovnání mikrobiálních druhů na genomické, transkriptomické a funkční úrovni.[1][2] MicrobesOnline byl vyvinut Virtuálním institutem pro mikrobiální stres a přežití, který je založen na Lawrence Berkeley National Laboratory v Berkeley v Kalifornii. Web byl spuštěn v roce 2005 s pravidelnými aktualizacemi až do roku 2011.
Hlavním cílem MicrobesOnline je poskytnout snadno použitelný zdroj, který integruje velké množství dat z více zdrojů. Tato integrovaná platforma usnadňuje studium v systému Windows komparativní genomika, metabolická cesta analýza, genom složení, funkční genomika stejně jako v proteinová doména a rodina data. Poskytuje také nástroje k prohledávání nebo procházení databáze s geny, druhy, sekvencemi, ortologické skupiny, genová ontologie (GO) termíny nebo klíčová slova cesty atd. Dalším z jejích hlavních rysů je Gene Cart, který umožňuje uživatelům vést záznamy o svých genech, které nás zajímají. Jedním z vrcholů databáze je celková přístupnost navigace a propojení mezi nástroji.
Pozadí
Vývoj vysoce výkonných metod pro genom sekvenování přinesla nepřeberné množství dat, která vyžadují sofistikované řešení bioinformatika nástroje pro jejich analýzu a interpretaci.[3] V současné době existuje řada nástrojů ke studiu sekvenčních dat genomiky a získávání informací z různých perspektiv. Nedostatek sjednocení nomenklatury a standardizovaných protokolů mezi nástroji však velmi ztěžuje přímé srovnání jejich výsledků.[4] Uživatel je navíc nucen neustále přepínat z různých webů nebo softwaru a upravovat formát svých dat tak, aby vyhovoval individuálním požadavkům. MicrobesOnline byl vyvinut s cílem integrovat kapacity různých nástrojů do jednotné platformy pro snadné srovnání výsledků analýzy se zaměřením na prokaryot druhové a bazální eukaryoty.
Druhy zahrnuté v databázi
MicrobesOnline hostitelé genomové, genová exprese a zdatnost údaje pro širokou škálu mikrobiálních druhů. Genomická data jsou k dispozici pro 1752 bakterie, 94 archaea a 119 eukaryot, tedy celkem 3707 genomů, z nichž 2842 je označeno jako úplné. Údaje o genové expresi jsou k dispozici pro 113 druhů a údaje o kondici jsou k dispozici pro 4 organismy.[5]
Funkce a architektura stránek
MicrobesOnline poskytuje různé nástroje pro vyhledávání, analýzu a integraci informací souvisejících s bakteriálními genomy pro aplikace ve čtyřech hlavních oblastech: genetické informace, funkční genomika, srovnávací genomika a studie metabolických cest.[6] Domovská stránka MicrobesOnline je portál pro přístup k jeho funkcím, který zahrnuje šest hlavních sekcí: horní navigační prvky, selektor genomu, příklady tutoriálu založeného na E. coli K-12, odkaz na Genome-Linked Application for Metabolic Mapy (GLAMM), nejdůležitější webové stránky a seznam „about MicrobesOnline“. V rámci probíhajícího projektu autoři MicrobesOnline tvrdí, že budou rozšířeny nástroje pro analýzu dat a podporu více typů dat.[7]
Genetické informace
Informace o mikrobiálních genech uložených v MicrobesOnline zahrnuje sekvence (geny, přepisy a bílkoviny ), genomický loci, anotace genů a některé statistiky sekvencí. K těmto informacím lze přistupovat prostřednictvím tří funkcí zobrazených na domovské stránce MicrobesOnline: sekvenční vyhledávání a pokročilé vyhledávání v horní navigační sekci a selektor genomu. Pro nástroj pro vyhledávání sekvencí se integruje MicrobesOnline BLAT, FastHMM a FastBLAST [8] hledat proteinové sekvence a použití MEGABLAST hledat nukleotidové sekvence.[9] Poskytuje také odkaz na VÝBUCH jako alternativní způsob vyhledávání sekvencí. Na druhé straně pokročilý vyhledávací nástroj umožňuje uživateli vyhledávat genetické informace podle kategorií, vlastního dotazu, vyhledávání zástupných znaků a vyhledávání konkrétního pole, které používá název genu, popis, shluk ortologických skupin (COG) id termín GO, KEGG číslo enzymové provize (EC) atd. jako klíčová slova.
Pole „Vybrané genomy“ selektoru genomu uvádí seznam genomů přidaných ze seznamu oblíbených genomů vlevo nebo vyhledávaných podle klíčových slov. Na pravé straně selektoru genomu lze po výběru genomů použít čtyři akce: rozhraní „najít geny“ prohledá název genu ve vybraných genomech a zobrazí výsledky v zobrazení seznamu genů; tlačítko „info“ uvádí v souhrnném zobrazení stručné shrnutí vybraných genomů; tlačítko „GO“ otevře prohlížeč GO s názvem VertiGo, který uvádí počet genů pod různými položkami GO; Nakonec tlačítko „cesta“ iniciuje prohlížeč cest, který ilustruje úplné cesty všech organismů v databázi MicrobesOnline.
Názvy genomu zobrazené v souhrnném zobrazení navíc vedou k zobrazení dat s jedním genomem, které představuje nepřeberné množství informací o vybraném genomu. V zobrazení seznamu genů vedou odkazy „G O D H S T B ...“ uživatele k nástroji pro lokusové informace, kde jsou k dispozici podrobné informace, jako např. operon & regulon, jsou zobrazeny domény a rodiny, sekvence, anotace atd.
Genové vozíky
Důležitou funkcí pro uložení práce uživatele je Gene Cart. Mnoho webových stránek MicrobesOnline zobrazujících genetické informace obsahuje odkaz pro přidání požadovaných genů do košíku relačních genů, který je k dispozici všem uživatelům. Toto je dočasný genový vozík a jako takový ztrácí informace, když uživatel zavře webový prohlížeč. Geny v relačním genovém košíku lze uložit do permanentního genového košíku, který je k dispozici pouze registrovaným uživatelům po přihlášení.
Funkční genomika
Jedním z cílů nastavení MicrobesOnline je ukládání funkčních informací o mikrobiálních genomech. Takové informace zahrnují genovou ontologii a profily genové exprese založené na microarray, ke kterým lze přistupovat prostřednictvím dvou rozhraní zvaných GO prohlížeč a Expression Data Viewer. Prohlížeč GO poskytuje odkazy na geny uspořádané podle termínů genové ontologie a prohlížeč Expression Data Viewer poskytuje jak přístup k profilům exprese, tak informace o experimentálních podmínkách.
Hierarchie genové ontologie
Prohlížeč GO, známý také jako VertiGo, používá MicrobesOnline k vyhledávání a vizualizaci hierarchie GO, což je jednotný slovní systém, který popisuje vlastnosti genových produktů, včetně buněčných složek, molekulárních funkcí a biologického procesu. Selektor genomu na domovské stránce MicrobesOnline poskytuje přímý způsob procházení hierarchie GO vybraných genomů a také poskytuje seznam genů pod vybraným termínem GO, který lze poté přidat do košíku relačního genu pro další analýzu.
Informace o genovém výrazu
Prohlížeč datových výrazů je rozhraní pro vyhledávání a kontrolu microarray experimenty s expresí základního genu a profily výrazů. Skládá se z několika komponent: prohlížeč experimentů pro vyhledávání konkrétních experimentů ve vybraných genomech za vybraných experimentálních podmínek, prohlížeč expresních experimentů poskytujících podrobnosti o každém experimentu s mikročipy, prohlížeč genových expresí zobrazující teplotní mapa úrovní exprese vybraného genu a stejných genů operon a nakonec nástroj pro vyhledávání profilů pro prohledávání profilů genové exprese. Prohlížeč datových výrazů je přístupný třemi způsoby: „Procházet funkční data“ na navigační liště, „Data genových výrazů“ na domovské stránce a „Seznam genových výrazů“ v zobrazení dat s jedním genomem, kde jsou data výrazů jsou dostupné. Zobrazení dat s jedním genomem může také zobrazit a interakce protein-protein prohlížeč, který umožňuje kontrolu interakčních komplexů a stahování dat exprese (např. Escherichia coli str. K-12 substr. MG1655). Dále může uživatel spustit MultiExperiment Viewer (MeV) v zobrazení dat s jedním genomem pro analýzu a vizualizaci dat výrazu.
Srovnávací genomika
MicrobesOnline ukládá informace o genech homologie a fylogeneze pro srovnávací genomové studie, ke kterým lze přistupovat prostřednictvím dvou rozhraní. Prvním z nich je Prohlížeč stromů, který pro vybraný gen a jeho genové okolí vykreslí druhový strom nebo genový strom. Druhým z nich je Prohlížeč ortologie, který je rozšířením Prohlížeče genomu a demonstruje vybraný gen v kontextu jeho genového sousedství srovnaného s ortology v jiných vybraných genomech.[10] Oba prohlížeče poskytují možnosti uložení genu do košíku genů relace pro další analýzu.
Prohlížeč stromu
Prohlížeč stromů je přístupný prohledáním genu pomocí nástroje Najít geny na domovské stránce s jeho identifikačním číslem VIMSS (např. VIMSS15779). Po zobrazení kontextového genu prostřednictvím možnosti „Procházet genomy podle stromů“ se zobrazí genový strom a genový kontextový diagram. Možnost „Zobrazit druhový strom“ navíc otevírá pohled na druhový strom, který zobrazuje druhový strom vedle genového stromu. Prohlížeč stromů navíc umožňuje uživatelům vybrat si geny i genomy podle jejich podobnosti. Dále to také ukazuje horizontální genové přenosy mezi genomy.
Prohlížeč ortologie
Prohlížeč ortologie zobrazuje ortology genomů ve srovnání s dotazovaným genomem výběrem více genomů z pole „Vybrat organismy k zobrazení“.
Informace o lokusu lze zobrazit pomocí možnosti „zobrazit geny“ a tento gen lze přidat do košíku relačního genu nebo lze stáhnout jeho údaje o genové expresi (včetně tepelné mapy). Alternativně se při procházení genomů po stromech zobrazí kontextové zobrazení genů.
Informace o metabolické cestě
Prohlížeč Pathway umožňuje uživatelům procházet Kjótskou encyklopedií genů a genů (KEGG)[11] mapy dráhy zobrazující předpokládanou přítomnost nebo nepřítomnost enzymů až pro dva vybrané genomy. Mapu konkrétní cesty a srovnání mezi dvěma druhy mikrobů lze zobrazit v prohlížeči cesty. Číslo provize enzymu (např. 3.1.3.25) poskytuje odkaz na zobrazení seznamu genů, které zobrazuje informace o vybraném enzymu a umožňuje uživateli přidat geny do košíku genů relace.
GLAMM je další nástroj pro vyhledávání a vizualizaci metabolických cest v jednotném webovém rozhraní. Pomáhá uživatelům identifikovat nebo konstruovat nové transgenní cesty.[12]
Bioinformatika
MicrobesOnline integroval řadu nástrojů pro analýzu sekvencí, profilů genové exprese a interakcí protein-protein do rozhraní zvaného Bioinformatics Workbench, které je přístupné prostřednictvím genových vozíků. Aktuálně podporované analýzy zahrnují vícenásobné zarovnání sekvence, konstrukce fylogenetické stromy, motiv vyhledávání a skenování, shrnutí profilů genové exprese a interakce protein-protein. Aby bylo možné ušetřit výpočetní prostředky, je uživateli povoleno spouštět dvě souběžné úlohy po dobu nejvýše čtyř hodin a všechny výsledky se ukládají dočasně, dokud relace není ukončena.[13] Výsledky lze sdílet s ostatními uživateli nebo skupinami prostřednictvím nástroje pro řízení přístupu k prostředkům.
Podpora databází
MicrobesOnline je postaven na integraci dat řady databází, které spravují různé aspekty jeho schopností. Úplný seznam je následující:[14]
- Sekvenční informace: Neredundantní proteinové, genové a transkriptové sekvence a poznámky jsou extrahovány z RefSeq [15] a Uniprot.[16]
- Taxonomická klasifikace druhů a sekvencí: NCBI Taxonomie [17] se používá ke klasifikaci druhů a sekvencí do fylogenetických skupin a k vytvoření fylogenetického stromu.
- Identifikace neanotovaných proteinů ze sekvencí: CRITICA [18] se používá k nalezení úseků sekvence DNA, které kódují proteiny. Používá se jak komparativní genomika, tak komparace a metoda nezávislá na anotacích.
- Identifikace anotovaných genů ze sekvencí: MicrobesOnline spoléhá na Záblesk [19] k automatickému hledání genů v bakteriích, archaeách a virových sekvencích.
- Klasifikace proteinů: Klasifikace proteinů podle jejich konzervované domény, rodiny a superrodin stanovená PIRSF,[20] Pfam,[21] CHYTRÝ [22] a SUPERFAMILY [23] úložiště jsou zahrnuta.
- Informace o genové ortologii: Ortologické skupiny genů napříč druhy jsou založeny na informacích v databázi COG,[24] který se při detekci homologie spoléhá na srovnání proteinových sekvencí.
- Funkční informace genů a proteinů: K rozsahu poskytovaných funkčních informací přispívá: GOA [25] pro Genová ontologie anotace genů do funkčních kategorií, KEGG [26] - pro metabolické, molekulární a signální dráhy genů a - PANTER [27][28] pro informace o molekulárních a funkčních drahách v kontextu vztahů mezi rodinami proteinů a jejich evoluci. TIGRFAM [29] a Gene3D [30] jsou označovány jako strukturní informace a anotace proteinů.
- Údaje o genovém výrazu: Oba NCBI GEO [31] a databáze mnoha mikrobových mikropolí [32] podporovat data genové exprese MicrobesOnline. Datové sady zkompilované databází Many Microbe Microarrays Database mají další výhodu v tom, že jsou přímo srovnatelné, protože pouze data generovaná jednokanálovým Affymetrix microarrays jsou přijímány a jsou následně normalizovány.
- Detekce CRISPR: CRISPR [33] jsou DNA lokusy zapojené do imunity proti invazivním sekvencím, kde jsou krátké přímé repetice odděleny spacer sekvencemi.[34] Databáze generované CRT [35] a PILER-CL [36] k detekci CRISPR se používají algoritmy.
- Detekce tRNA: TRNAscan-SE [37] databáze se používá jako reference k identifikaci sekvencí tRNA.
- Předkládání údajů uživateli: Uživatelé mají schopnost nahrávat jak genomy, tak expresní soubory do MicrobesOnline a analyzovat je pomocí nabízených analytických nástrojů, s možností uchovat data v soukromí (v případě nepublikovaných dat) nebo je zveřejnit.[38] Údaje z mikročipu by měly zahrnovat jasnou identifikaci organismů, platforem, ošetření a kontrol, experimentálních podmínek, použitých časových bodů a normalizačních technik a také údaje o expresi ve formátu logaritmu nebo logaritmu. Přestože jsou akceptovány sekvence konceptu genomu, musí být v souladu s určitými pokyny: (1) shromážděný genom musí mít méně než 100 lešení, (2) FASTA měl by být použit formát souboru s jedinečným štítkem na kontig, (3) pokud možno by měly být přítomny genové předpovědi (v tomto případě patří akceptované formáty GenBank, EMBL, oddělené tabulátory a FASTA ), (4) Měl by být uveden název genomu a ID taxonomie NCBI.
Aktualizace
MicrobesOnline byl aktualizován každé 3 až 9 měsíců od roku 2007 do roku 2011, kdy byly přidány nové funkce a údaje o nových druzích. Od března 2011 však nebyly vydány žádné nové poznámky k vydání.[39]
Kompatibilita s jinými weby
MicrobesOnline je kompatibilní s dalšími podobnými platformami integrovaných dat mikrobů, jako jsou IMG a RegTransBase, vzhledem k tomu, že v databázi jsou udržovány standardní identifikátory genů.[40]
Mikroby Online v oblasti platforem pro analýzu mikrobů
Existují další snahy o vytvoření jednotné platformy pro nástroje pro analýzu prokaryot, většina z nich se však zaměřuje na jednu sadu typů analýz. Několik příkladů těchto zaměřených databází zahrnuje databáze s důrazem na analýzu metabolických dat (Microme[41]), komparativní genomika (MBGD [42] a prohlížeč OMA [43]), regulony a transkripční faktory (RegPrecise [44]), srovnávací funkční genomika (Pathline [45]), mezi mnoha dalšími. Jiné týmy však vynaložily značné úsilí na vytvoření komplexních platforem, které se do značné míry překrývají s možnostmi MicrobesOnline. Mikroskop [46] a Integrovaný systém mikrobiálních genomů[47][48] (IMG) jsou příklady populárních a nedávno aktualizovaných databází (od září 2014[Aktualizace]).
Rozšíření analýzy metagenomu: metaMicrobesOnline
metaMicrobesOnline [49] byl sestaven stejnými vývojáři jako MicrobesOnline a představuje rozšíření kapacit MicrobesOnline zaměřením na fylogenetickou analýzu metagenomy. S podobným webovým rozhraním jako MicrobesOnline je uživatel schopen přepínat mezi weby pomocí odkazu „přepnout na“ na domovské stránce.
Viz také
- Integrovaný systém mikrobiálních genomů (IMG)
- VÝBUCH
- BLAT (bioinformatika)
- Formát FASTA
- Genová ontologie
- Skrytý Markovův model (HMM)
- Homologie (biologie)
- KEGG
- Zarovnání více sekvencí
externí odkazy
- Domovská stránka MicrobesOnline
- Domovská stránka IMG odkaz: Nucleic Acids Research, 2006, roč. 34, vydání databáze D344-D348
- Konsorcium pro genovou ontologii (GOC): mezinárodní spolupráce na vývoji genové ontologie a vytváření anotací genetických funkcí.
- Otevřené biologické a biomedicínské ontologie: komunitní platforma, která integruje databáze a nástroje genové ontologie.
- Kyoto Encyclopedia of Genes and Genomes (KEGG): velká sbírka databází genů, genomů, biologických cest, chemikálií, drog a nemocí.
- NCBI COG: zdroje fylogenetických studií proteinů kódovaných v kompletních genomech.
- GLAMM: Aplikace spojená s genomem pro metabolické mapy, což je interaktivní prohlížeč metabolických cest a experimentů.
- Výukový program GLAMM: komplexní pokyny pro používání GLAMMU.
- Hledání MEGABLAST: Úvod NCBI do algoritmu MEGABLAST.
- MeV: MultiExperiment Viewer: univerzální nástroj pro analýzu dat microarray.
- Microme: platforma, která integruje databázi, nástroje a prohlížeče pro studium bakteriálního metabolismu.
- MBGD: Mikrobiální databáze genomu pro srovnávací analýzu
- Virtuální institut pro mikrobiální stres a přežití (VIMSS): zastánce integrovaného programu ke studiu, jak mikroby reagují na životní prostředí a přežívají jej.
Reference
- ^ Alm, E. J .; Huang, K. H .; Price, M. N .; Koche, R. P .; Keller, K; Dubchak, I.L .; Arkin, A. P. (2005). „Mikroby Online Web pro srovnávací genomiku ". Výzkum genomu. 15 (7): 1015–22. doi:10,1101 / gr. 3844805. PMC 1172046. PMID 15998914.
- ^ Dehal, P. S .; Joachimiak, M. P .; Price, M. N .; Bates, J. T .; Baumohl, J. K .; Chivian, D .; Friedland, G. D .; Huang, K. H .; Keller, K .; Novichkov, P. S .; Dubchak, I.L .; Alm, E. J .; Arkin, A. P. (2009). „Mikroby Online: Integrovaný portál pro srovnávací a funkční genomiku “. Výzkum nukleových kyselin. 38 (Problém s databází): D396–400. doi:10.1093 / nar / gkp919. PMC 2808868. PMID 19906701.
- ^ Feist, A. M .; Herrgård, M. J .; Thiele, I .; Reed, J.L .; Palsson, B. Ø. (2008). „Rekonstrukce biochemických sítí v mikroorganismech“. Příroda Recenze Mikrobiologie. 7 (2): 129–43. doi:10.1038 / nrmicro1949. PMC 3119670. PMID 19116616.
- ^ Chen, I. M. A .; Markowitz, V. M .; Chu, K .; Anderson, I .; Mavromatis, K .; Kyrpides, N. C .; Ivanova, N. N. (2013). „Zlepšení anotací mikrobiálního genomu v kontextu integrované databáze“. PLOS ONE. 8 (2): e54859. Bibcode:2013PLoSO ... 854859C. doi:10.1371 / journal.pone.0054859. PMC 3570495. PMID 23424620.
- ^ „Domovská stránka MicrobesOnline“. Mikroby online. Citováno 2014-09-09.
- ^ Virtuální institut pro mikrobiální stres a přežití; Ernest Orlando Lawrence Berkeley National Laboratory (2008). Msgstr "Průvodce webem a výukový program". Mikroby online. 1 Cyclotron Road • Berkeley, CA 94720.CS1 maint: umístění (odkaz)
- ^ Dehal, P. S .; Joachimiak, M. P .; Price, M. N .; Bates, J. T .; Baumohl, J. K .; Chivian, D .; Friedland, G. D .; Huang, K. H .; Keller, K .; Novichkov, P. S .; Dubchak, I.L .; Alm, E. J .; Arkin, A. P. (2009). „Mikroby Online: Integrovaný portál pro srovnávací a funkční genomiku “. Výzkum nukleových kyselin. 38 (Problém s databází): D396–400. doi:10.1093 / nar / gkp919. PMC 2808868. PMID 19906701.
- ^ Price, M. N .; Dehal, P. S .; Arkin, A. P. (2008). „FastBLAST: Homologické vztahy pro miliony proteinů“. PLOS ONE. 3 (10): e3589. Bibcode:2008PLoSO ... 3.3589P. doi:10,1371 / journal.pone.0003589. PMC 2571987. PMID 18974889.
- ^ Barrell, D .; Dimmer, E .; Huntley, R. P .; Binns, D .; O'Donovan, C .; Apweiler, R. (2009). „Databáze GOA v roce 2009 - integrovaný zdroj anotací genové ontologie“. Výzkum nukleových kyselin. 37 (Problém s databází): D396–403. doi:10.1093 / nar / gkn803. PMC 2686469. PMID 18957448.
- ^ Virtuální institut pro mikrobiální stres a přežití; Ernest Orlando Lawrence Berkeley National Laboratory (2008). Msgstr "Průvodce webem a výukový program". Mikroby online. 1 Cyclotron Road • Berkeley, CA 94720.CS1 maint: umístění (odkaz)
- ^ Kanehisa, M. (2004). „Zdroj KEGG pro dešifrování genomu“. Výzkum nukleových kyselin. 32 (90001): 277D – 280. doi:10.1093 / nar / gkh063. PMC 308797. PMID 14681412.
- ^ Bates, J. T .; Chivian, D .; Arkin, A. P. (2011). „GLAMM: Aplikace spojená s genomem pro metabolické mapy“. Výzkum nukleových kyselin. 39 (Problém s webovým serverem): W400–5. doi:10.1093 / nar / gkr433. PMC 3125797. PMID 21624891.
- ^ Virtuální institut pro mikrobiální stres a přežití; Ernest Orlando Lawrence Berkeley National Laboratory (2008). "Průvodce webem a návod". Mikroby online. 1 Cyclotron Road • Berkeley, CA 94720.CS1 maint: umístění (odkaz)
- ^ Alm, E. J .; Huang, K. H .; Price, M. N .; Koche, R. P .; Keller, K; Dubchak, I.L .; Arkin, A. P. (2005). „Mikroby Online Web pro srovnávací genomiku ". Výzkum genomu. 15 (7): 1015–22. doi:10,1101 / gr. 3844805. PMC 1172046. PMID 15998914.
- ^ Pruitt, K. D .; Tatusová, T .; Maglott, D. R. (2007). "Referenční sekvence NCBI (viz Sekv): Upravená neredundantní databáze sekvencí genomů, transkriptů a proteinů ". Výzkum nukleových kyselin. 35 (Problém s databází): D61–5. doi:10.1093 / nar / gkl842. PMC 1716718. PMID 17130148.
- ^ Uniprot, Consortium (2009). "Univerzální zdroj bílkovin (Uni Prot) 2009". Výzkum nukleových kyselin. 37 (Problém s databází): D169–74. doi:10.1093 / nar / gkn664. PMC 2686606. PMID 18836194.
- ^ Sayers, E. W .; Barrett, T .; Benson, D. A .; Bryant, S. H .; Canese, K .; Chetvernin, V .; Church, D. M .; Dicuccio, M .; Edgar, R .; Federhen, S .; Feolo, M .; Geer, L. Y .; Helmberg, W .; Kapustin, Y .; Landsman, D .; Lipman, D. J .; Madden, T. L .; Maglott, D. R .; Miller, V .; Mizrachi, I .; Ostell, J .; Pruitt, K. D .; Schuler, G. D .; Sequeira, E .; Sherry, S. T .; Shumway, M .; Sirotkin, K .; Souvorov, A .; Starchenko, G .; et al. (2009). „Databázové zdroje Národního centra pro biotechnologické informace“. Výzkum nukleových kyselin. 37 (Problém s databází): D5–15. doi:10.1093 / nar / gkn741. PMC 2686545. PMID 18940862.
- ^ Badger, J. H .; Olsen, G. J. (1999). „CRITICA: Nástroj pro identifikaci kódovacích oblastí vyvolávající srovnávací analýzu“. Molekulární biologie a evoluce. 16 (4): 512–24. doi:10.1093 / oxfordjournals.molbev.a026133. PMID 10331277.
- ^ Delcher, A.L .; Bratke, K. A .; Powers, E. C .; Salzberg, S.L. (2007). „Identifikace bakteriálních genů a DNA endosymbiontu pomocí Glimmeru“. Bioinformatika. 23 (6): 673–679. doi:10.1093 / bioinformatika / btm009. PMC 2387122. PMID 17237039.
- ^ Wu, C.H .; Nikolskaya, A .; Huang, H .; Yeh, L. S .; Natale, D. A .; Vinayaka, C. R .; Hu, Z. Z .; Mazumder, R .; Kumar, S .; Kourtesis, P .; Ledley, R. S .; Suzek, B.E .; Arminski, L .; Chen, Y .; Zhang, J .; Cardenas, J. L .; Chung, S .; Castro-Alvear, J .; Dinkov, G .; Barker, W. C. (2004). „PIRSF: Systém klasifikace rodin na zdroji proteinových informací“. Výzkum nukleových kyselin. 32 (90001): 112D – 1114. doi:10.1093 / nar / gkh097. PMC 308831. PMID 14681371.
- ^ Finn, R. D .; Tate, J .; Mistry, J .; Coggill, P. C .; Sammut, S. J .; Hotz, H. -R .; Ceric, G .; Forslund, K .; Eddy, S. R .; Sonnhammer, E. L. L .; Bateman, A. (2007). „Databáze proteinových rodin Pfam“. Výzkum nukleových kyselin. 36 (Problém s databází): D281–8. doi:10,1093 / nar / gkm960. PMC 2238907. PMID 18039703.
- ^ Letunic, I .; Doerks, T .; Bork, P. (2009). „SMART 6: Nedávné aktualizace a nový vývoj“. Výzkum nukleových kyselin. 37 (Problém s databází): D229–32. doi:10.1093 / nar / gkn808. PMC 2686533. PMID 18978020.
- ^ Wilson, D .; Madera, M .; Vogel, C .; Chothia, C.; Gough, J. (2007). „Databáze SUPERFAMILY v roce 2007: Rodiny a funkce“. Výzkum nukleových kyselin. 35 (Problém s databází): D308 – D313. doi:10.1093 / nar / gkl910. PMC 1669749. PMID 17098927.
- ^ Tatusov, R. L .; Fedorová, N. D .; Jackson, J. D .; Jacobs, A. R .; Kiryutin, B .; Koonin, E. V .; Krylov, D. M .; Mazumder, R .; Mekhedov, S.L .; Nikolskaya, A. N .; Rao, B. S .; Smirnov, S .; Sverdlov, A. V .; Vasudevan, S .; Wolf, Y. I .; Yin, J. J .; Natale, D. A. (2003). „Databáze COG: Aktualizovaná verze obsahuje eukaryoty“. BMC bioinformatika. 4: 41. doi:10.1186/1471-2105-4-41. PMC 222959. PMID 12969510.
- ^ Barrell, D .; Dimmer, E .; Huntley, R. P .; Binns, D .; O'Donovan, C .; Apweiler, R. (2009). „Databáze GOA v roce 2009 - integrovaný zdroj anotací genové ontologie“. Výzkum nukleových kyselin. 37 (Problém s databází): D396–403. doi:10.1093 / nar / gkn803. PMC 2686469. PMID 18957448.
- ^ Kanehisa, M. (2004). „Zdroj KEGG pro dešifrování genomu“. Výzkum nukleových kyselin. 32 (90001): 277D – 280. doi:10.1093 / nar / gkh063. PMC 308797. PMID 14681412.
- ^ Mi, H .; Guo, N .; Kejariwal, A .; Thomas, P. D. (2007). „PANTHER verze 6: Údaje o sekvenci a vývoji proteinů s rozšířeným zastoupením biologických drah“. Výzkum nukleových kyselin. 35 (Problém s databází): D247–52. doi:10.1093 / nar / gkl869. PMC 1716723. PMID 17130144.
- ^ Mi, H .; Thomas, P. (2009). „PANTHER Pathway: Databáze cest založená na ontologii spojená s nástroji pro analýzu dat“. Síť proteinů a analýza dráhy. Metody v molekulární biologii. 563. str. 123–40. doi:10.1007/978-1-60761-175-2_7. ISBN 978-1-60761-174-5. PMID 19597783.
- ^ Selengut, J. D .; Haft, D. H .; Davidsen, T .; Ganapathy, A .; Gwinn-Giglio, M .; Nelson, W. C .; Richter, A. R .; White, O. (2007). „TIGRFAM a vlastnosti genomu: Nástroje pro přiřazení molekulární funkce a biologického procesu v prokaryotických genomech“. Výzkum nukleových kyselin. 35 (Problém s databází): D260–4. doi:10.1093 / nar / gkl1043. PMC 1781115. PMID 17151080.
- ^ Yeats, C .; Lees, J .; Reid, A .; Kellam, P .; Martin, N .; Liu, X .; Orengo, C. (2007). „Gene3D: Komplexní strukturální a funkční anotace genomů“. Výzkum nukleových kyselin. 36 (Problém s databází): D414–8. doi:10.1093 / nar / gkm 1019. PMC 2238970. PMID 18032434.
- ^ Barrett, T .; Troup, D. B .; Wilhite, S.E .; Ledoux, P .; Rudnev, D .; Evangelista, C .; Kim, I.F .; Soboleva, A .; Tomashevsky, M .; Marshall, K. A .; Phillippy, K. H .; Sherman, P. M .; Muertter, R. N .; Edgar, R. (2009). „NCBI GEO: Archiv pro vysoce výkonná funkční genomová data“. Výzkum nukleových kyselin. 37 (Problém s databází): D885–90. doi:10.1093 / nar / gkn764. PMC 2686538. PMID 18940857.
- ^ Faith, J. J .; Driscoll, M.E .; Fusaro, V. A .; Cosgrove, E. J .; Hayete, B .; Juhn, F. S .; Schneider, S. J .; Gardner, T. S. (2007). „Mnoho databází mikrobových mikropolí: Jednotně normalizované kompendia Affymetrix se strukturovanými experimentálními metadaty“. Výzkum nukleových kyselin. 36 (Problém s databází): D866–70. doi:10.1093 / nar / gkm 815. PMC 2238822. PMID 17932051.
- ^ Marraffini, L. A .; Sontheimer, E. J. (2010). „CRISPR interference: RNA-řízená adaptivní imunita v bakteriích a archaeách“. Genetika hodnocení přírody. 11 (3): 181–190. doi:10.1038 / nrg2749. PMC 2928866. PMID 20125085.
- ^ Marraffini, L. A .; Sontheimer, E. J. (2010). "CRISPR interference: RNA-řízená adaptivní imunita v bakteriích a archaeách". Genetika hodnocení přírody. 11 (3): 181–190. doi:10.1038 / nrg2749. PMC 2928866. PMID 20125085.
- ^ Bland, C; Ramsey, T. L .; Sabree, F; Lowe, M; Brown, K; Kyrpides, N. C .; Hugenholtz, P (2007). „Nástroj pro rozpoznávání CRISPR (CRT): Nástroj pro automatickou detekci shlukovaných pravidelně rozložených palindromických opakování“. BMC bioinformatika. 8: 209. doi:10.1186/1471-2105-8-209. PMC 1924867. PMID 17577412.
- ^ Edgar, R. C. (2007). „PILER-CR: Rychlá a přesná identifikace opakování CRISPR“. BMC bioinformatika. 8: 18. doi:10.1186/1471-2105-8-18. PMC 1790904. PMID 17239253.
- ^ Lowe, T. M .; Eddy, S. R. (1997). „TRNAscan-SE: Program pro lepší detekci genů transferové RNA v genomové sekvenci“. Výzkum nukleových kyselin. 25 (5): 955–64. doi:10.1093 / nar / 25.5.955. PMC 146525. PMID 9023104.
- ^ „Domovská stránka MicrobesOnline“. Mikroby online. Citováno 2014-09-09.
- ^ „Poznámky k verzi MicrobesOnline“. Mikroby online. Citováno 2014-09-10.
- ^ Dehal, P. S .; Joachimiak, M. P .; Price, M. N .; Bates, J. T .; Baumohl, J. K .; Chivian, D .; Friedland, G. D .; Huang, K. H .; Keller, K .; Novichkov, P. S .; Dubchak, I.L .; Alm, E. J .; Arkin, A. P. (2009). „Mikroby Online: Integrovaný portál pro srovnávací a funkční genomiku “. Výzkum nukleových kyselin. 38 (Problém s databází): D396–400. doi:10.1093 / nar / gkp919. PMC 2808868. PMID 19906701.
- ^ "Microme". Microme. Citováno 2014-09-09.
- ^ Uchiyama, I .; Mihara, M .; Nishide, H .; Chiba, H. (2012). „Aktualizace MBGD 2013: Databáze mikrobiálního genomu pro zkoumání rozmanitosti mikrobiálního světa“. Výzkum nukleových kyselin. 41 (Problém s databází): D631–5. doi:10.1093 / nar / gks1006. PMC 3531178. PMID 23118485.
- ^ Altenhoff, A. M .; Schneider, A .; Gonnet, G. H .; Dessimoz, C. (2010). „OMA 2011: Odhad ortologie mezi 1000 úplnými genomy“. Výzkum nukleových kyselin. 39 (Problém s databází): D289–94. doi:10.1093 / nar / gkq1238. PMC 3013747. PMID 21113020.
- ^ Novichkov, P. S .; Kazakov, A. E .; Ravcheev, D. A .; Leyn, S. A .; Kovaleva, G. Y .; Sutormin, R. A .; Kazanov, M. D .; Riehl, W .; Arkin, A. P .; Dubchak, I .; Rodionov, D. A. (2013). „Reg Přesný 3.0 - Zdroj pro zkoumání transkripční regulace v bakteriích v genomu “. BMC Genomics. 14: 745. doi:10.1186/1471-2164-14-745. PMC 3840689. PMID 24175918.
- ^ Meyer, M .; Wong, B .; Styczynski, M .; Munzner, T.; Pfister, H. (2010). "Pathline: Nástroj pro srovnávací funkční genomiku". Fórum počítačové grafiky. 29 (3): 1043–1052. doi:10.1111 / j.1467-8659.2009.01710.x.
- ^ Vallenet, D .; Belda, E .; Calteau, A .; Cruveiller, S .; Engelen, S .; Lajus, A .; Le Fevre, F .; Longin, C .; Mornico, D .; Roche, D .; Rouy, Z .; Salvignol, G .; Scarpelli, C .; Thil Smith, A. A .; Weiman, M .; Medigue, C. (2012). „Mikro Rozsah--integrovaný mikrobiální zdroj pro léčení a srovnávací analýzu genomových a metabolických údajů ". Výzkum nukleových kyselin. 41 (Problém s databází): D636–47. doi:10.1093 / nar / gks1194. PMC 3531135. PMID 23193269.
- ^ Markowitz, V. M .; Szeto, E .; Palaniappan, K .; Grechkin, Y .; Chu, K .; Chen, I. M. A .; Dubchak, I .; Anderson, I .; Lykidis, A .; Mavromatis, K .; Ivanova, N. N .; Kyrpides, N. C. (2007). „Systém integrovaných mikrobiálních genomů (IMG) v roce 2007: Rozšíření datového obsahu a analytických nástrojů“. Výzkum nukleových kyselin. 36 (Problém s databází): D528–33. doi:10.1093 / nar / gkm 846. PMC 2238897. PMID 17933782.
- ^ Markowitz, V. M .; Chen, I. -M. A.; Palaniappan, K .; Chu, K .; Szeto, E .; Pillay, M .; Ratner, A .; Huang, J .; Woyke, T .; Huntemann, M .; Anderson, I .; Billis, K .; Varghese, N .; Mavromatis, K .; Pati, A .; Ivanova, N. N .; Kyrpides, N. C. (2013). „Verze IMG 4 integrovaného systému srovnávací analýzy mikrobiálních genomů“. Výzkum nukleových kyselin. 42 (Problém s databází): D560–7. doi:10.1093 / nar / gkt963. PMC 3965111. PMID 24165883.
- ^ Chivian, D .; Dehal, P. S .; Keller, K .; Arkin, A. P. (2012). „Meta Mikroby Online: Fylogenomická analýza mikrobiálních komunit ". Výzkum nukleových kyselin. 41 (Problém s databází): D648–54. doi:10.1093 / nar / gks1202. PMC 3531168. PMID 23203984.