Mikroby online - MicrobesOnline

Přehled hlavních komponent webu MicrobesOnline

Mikroby online je veřejně a volně přístupná webová stránka, která hostí řadu komparativních genomických nástrojů pro srovnání mikrobiálních druhů na genomické, transkriptomické a funkční úrovni.[1][2] MicrobesOnline byl vyvinut Virtuálním institutem pro mikrobiální stres a přežití, který je založen na Lawrence Berkeley National Laboratory v Berkeley v Kalifornii. Web byl spuštěn v roce 2005 s pravidelnými aktualizacemi až do roku 2011.

Hlavním cílem MicrobesOnline je poskytnout snadno použitelný zdroj, který integruje velké množství dat z více zdrojů. Tato integrovaná platforma usnadňuje studium v ​​systému Windows komparativní genomika, metabolická cesta analýza, genom složení, funkční genomika stejně jako v proteinová doména a rodina data. Poskytuje také nástroje k prohledávání nebo procházení databáze s geny, druhy, sekvencemi, ortologické skupiny, genová ontologie (GO) termíny nebo klíčová slova cesty atd. Dalším z jejích hlavních rysů je Gene Cart, který umožňuje uživatelům vést záznamy o svých genech, které nás zajímají. Jedním z vrcholů databáze je celková přístupnost navigace a propojení mezi nástroji.

Pozadí

Vývoj vysoce výkonných metod pro genom sekvenování přinesla nepřeberné množství dat, která vyžadují sofistikované řešení bioinformatika nástroje pro jejich analýzu a interpretaci.[3] V současné době existuje řada nástrojů ke studiu sekvenčních dat genomiky a získávání informací z různých perspektiv. Nedostatek sjednocení nomenklatury a standardizovaných protokolů mezi nástroji však velmi ztěžuje přímé srovnání jejich výsledků.[4] Uživatel je navíc nucen neustále přepínat z různých webů nebo softwaru a upravovat formát svých dat tak, aby vyhovoval individuálním požadavkům. MicrobesOnline byl vyvinut s cílem integrovat kapacity různých nástrojů do jednotné platformy pro snadné srovnání výsledků analýzy se zaměřením na prokaryot druhové a bazální eukaryoty.

Druhy zahrnuté v databázi

MicrobesOnline hostitelé genomové, genová exprese a zdatnost údaje pro širokou škálu mikrobiálních druhů. Genomická data jsou k dispozici pro 1752 bakterie, 94 archaea a 119 eukaryot, tedy celkem 3707 genomů, z nichž 2842 je označeno jako úplné. Údaje o genové expresi jsou k dispozici pro 113 druhů a údaje o kondici jsou k dispozici pro 4 organismy.[5]

Funkce a architektura stránek

Je zvýrazněna domovská stránka MicrobesOnline se šesti hlavními částmi pro přístup do databáze.

MicrobesOnline poskytuje různé nástroje pro vyhledávání, analýzu a integraci informací souvisejících s bakteriálními genomy pro aplikace ve čtyřech hlavních oblastech: genetické informace, funkční genomika, srovnávací genomika a studie metabolických cest.[6] Domovská stránka MicrobesOnline je portál pro přístup k jeho funkcím, který zahrnuje šest hlavních sekcí: horní navigační prvky, selektor genomu, příklady tutoriálu založeného na E. coli K-12, odkaz na Genome-Linked Application for Metabolic Mapy (GLAMM), nejdůležitější webové stránky a seznam „about MicrobesOnline“. V rámci probíhajícího projektu autoři MicrobesOnline tvrdí, že budou rozšířeny nástroje pro analýzu dat a podporu více typů dat.[7]

Genetické informace

Informace o mikrobiálních genech uložených v MicrobesOnline zahrnuje sekvence (geny, přepisy a bílkoviny ), genomický loci, anotace genů a některé statistiky sekvencí. K těmto informacím lze přistupovat prostřednictvím tří funkcí zobrazených na domovské stránce MicrobesOnline: sekvenční vyhledávání a pokročilé vyhledávání v horní navigační sekci a selektor genomu. Pro nástroj pro vyhledávání sekvencí se integruje MicrobesOnline BLAT, FastHMM a FastBLAST [8] hledat proteinové sekvence a použití MEGABLAST hledat nukleotidové sekvence.[9] Poskytuje také odkaz na VÝBUCH jako alternativní způsob vyhledávání sekvencí. Na druhé straně pokročilý vyhledávací nástroj umožňuje uživateli vyhledávat genetické informace podle kategorií, vlastního dotazu, vyhledávání zástupných znaků a vyhledávání konkrétního pole, které používá název genu, popis, shluk ortologických skupin (COG) id termín GO, KEGG číslo enzymové provize (EC) atd. jako klíčová slova.

Příklad zobrazení seznamu genů

Pole „Vybrané genomy“ selektoru genomu uvádí seznam genomů přidaných ze seznamu oblíbených genomů vlevo nebo vyhledávaných podle klíčových slov. Na pravé straně selektoru genomu lze po výběru genomů použít čtyři akce: rozhraní „najít geny“ prohledá název genu ve vybraných genomech a zobrazí výsledky v zobrazení seznamu genů; tlačítko „info“ uvádí v souhrnném zobrazení stručné shrnutí vybraných genomů; tlačítko „GO“ otevře prohlížeč GO s názvem VertiGo, který uvádí počet genů pod různými položkami GO; Nakonec tlačítko „cesta“ iniciuje prohlížeč cest, který ilustruje úplné cesty všech organismů v databázi MicrobesOnline.

Názvy genomu zobrazené v souhrnném zobrazení navíc vedou k zobrazení dat s jedním genomem, které představuje nepřeberné množství informací o vybraném genomu. V zobrazení seznamu genů vedou odkazy „G O D H S T B ...“ uživatele k nástroji pro lokusové informace, kde jsou k dispozici podrobné informace, jako např. operon & regulon, jsou zobrazeny domény a rodiny, sekvence, anotace atd.

Genové vozíky

Vlastní ukázka dočasného genového vozíku a permanentního genového vozíku.

Důležitou funkcí pro uložení práce uživatele je Gene Cart. Mnoho webových stránek MicrobesOnline zobrazujících genetické informace obsahuje odkaz pro přidání požadovaných genů do košíku relačních genů, který je k dispozici všem uživatelům. Toto je dočasný genový vozík a jako takový ztrácí informace, když uživatel zavře webový prohlížeč. Geny v relačním genovém košíku lze uložit do permanentního genového košíku, který je k dispozici pouze registrovaným uživatelům po přihlášení.

Funkční genomika

Jedním z cílů nastavení MicrobesOnline je ukládání funkčních informací o mikrobiálních genomech. Takové informace zahrnují genovou ontologii a profily genové exprese založené na microarray, ke kterým lze přistupovat prostřednictvím dvou rozhraní zvaných GO prohlížeč a Expression Data Viewer. Prohlížeč GO poskytuje odkazy na geny uspořádané podle termínů genové ontologie a prohlížeč Expression Data Viewer poskytuje jak přístup k profilům exprese, tak informace o experimentálních podmínkách.

Hierarchie genové ontologie

Geny E.coli K-12 podceňují DH10B pod zvýrazněnou položkou GO „adheze buněk“.

Prohlížeč GO, známý také jako VertiGo, používá MicrobesOnline k vyhledávání a vizualizaci hierarchie GO, což je jednotný slovní systém, který popisuje vlastnosti genových produktů, včetně buněčných složek, molekulárních funkcí a biologického procesu. Selektor genomu na domovské stránce MicrobesOnline poskytuje přímý způsob procházení hierarchie GO vybraných genomů a také poskytuje seznam genů pod vybraným termínem GO, který lze poté přidat do košíku relačního genu pro další analýzu.

Informace o genovém výrazu

Prohlížeč experimentu jako součást Prohlížeče výrazových dat.

Prohlížeč datových výrazů je rozhraní pro vyhledávání a kontrolu microarray experimenty s expresí základního genu a profily výrazů. Skládá se z několika komponent: prohlížeč experimentů pro vyhledávání konkrétních experimentů ve vybraných genomech za vybraných experimentálních podmínek, prohlížeč expresních experimentů poskytujících podrobnosti o každém experimentu s mikročipy, prohlížeč genových expresí zobrazující teplotní mapa úrovní exprese vybraného genu a stejných genů operon a nakonec nástroj pro vyhledávání profilů pro prohledávání profilů genové exprese. Prohlížeč datových výrazů je přístupný třemi způsoby: „Procházet funkční data“ na navigační liště, „Data genových výrazů“ na domovské stránce a „Seznam genových výrazů“ v zobrazení dat s jedním genomem, kde jsou data výrazů jsou dostupné. Zobrazení dat s jedním genomem může také zobrazit a interakce protein-protein prohlížeč, který umožňuje kontrolu interakčních komplexů a stahování dat exprese (např. Escherichia coli str. K-12 substr. MG1655). Dále může uživatel spustit MultiExperiment Viewer (MeV) v zobrazení dat s jedním genomem pro analýzu a vizualizaci dat výrazu.

Srovnávací genomika

MicrobesOnline ukládá informace o genech homologie a fylogeneze pro srovnávací genomové studie, ke kterým lze přistupovat prostřednictvím dvou rozhraní. Prvním z nich je Prohlížeč stromů, který pro vybraný gen a jeho genové okolí vykreslí druhový strom nebo genový strom. Druhým z nich je Prohlížeč ortologie, který je rozšířením Prohlížeče genomu a demonstruje vybraný gen v kontextu jeho genového sousedství srovnaného s ortology v jiných vybraných genomech.[10] Oba prohlížeče poskytují možnosti uložení genu do košíku genů relace pro další analýzu.

Prohlížeč stromu

Pohled na druhový strom v obdélníkovém stylu

Prohlížeč stromů je přístupný prohledáním genu pomocí nástroje Najít geny na domovské stránce s jeho identifikačním číslem VIMSS (např. VIMSS15779). Po zobrazení kontextového genu prostřednictvím možnosti „Procházet genomy podle stromů“ se zobrazí genový strom a genový kontextový diagram. Možnost „Zobrazit druhový strom“ navíc otevírá pohled na druhový strom, který zobrazuje druhový strom vedle genového stromu. Prohlížeč stromů navíc umožňuje uživatelům vybrat si geny i genomy podle jejich podobnosti. Dále to také ukazuje horizontální genové přenosy mezi genomy.

Prohlížeč ortologie

Genový kontextový pohled, který ukazuje kontexty genomů vedle genového stromu.

Prohlížeč ortologie zobrazuje ortology genomů ve srovnání s dotazovaným genomem výběrem více genomů z pole „Vybrat organismy k zobrazení“.

Ortologie kolem VIMSS ID 15779 pěti daných genomů zobrazených v prohlížeči ortologie.

Informace o lokusu lze zobrazit pomocí možnosti „zobrazit geny“ a tento gen lze přidat do košíku relačního genu nebo lze stáhnout jeho údaje o genové expresi (včetně tepelné mapy). Alternativně se při procházení genomů po stromech zobrazí kontextové zobrazení genů.

Informace o metabolické cestě

Cesta metabolismu pyruvátu ilustrovaná prohlížečem Pathway.
Mapa dráhy KEGG z Rickettsia rickettsii je vizualizován pomocí GLAMM se zvýrazněným metabolitem.

Prohlížeč Pathway umožňuje uživatelům procházet Kjótskou encyklopedií genů a genů (KEGG)[11] mapy dráhy zobrazující předpokládanou přítomnost nebo nepřítomnost enzymů až pro dva vybrané genomy. Mapu konkrétní cesty a srovnání mezi dvěma druhy mikrobů lze zobrazit v prohlížeči cesty. Číslo provize enzymu (např. 3.1.3.25) poskytuje odkaz na zobrazení seznamu genů, které zobrazuje informace o vybraném enzymu a umožňuje uživateli přidat geny do košíku genů relace.

Uspořádání pracovní plochy bioinformatiky

GLAMM je další nástroj pro vyhledávání a vizualizaci metabolických cest v jednotném webovém rozhraní. Pomáhá uživatelům identifikovat nebo konstruovat nové transgenní cesty.[12]

Bioinformatika

MicrobesOnline integroval řadu nástrojů pro analýzu sekvencí, profilů genové exprese a interakcí protein-protein do rozhraní zvaného Bioinformatics Workbench, které je přístupné prostřednictvím genových vozíků. Aktuálně podporované analýzy zahrnují vícenásobné zarovnání sekvence, konstrukce fylogenetické stromy, motiv vyhledávání a skenování, shrnutí profilů genové exprese a interakce protein-protein. Aby bylo možné ušetřit výpočetní prostředky, je uživateli povoleno spouštět dvě souběžné úlohy po dobu nejvýše čtyř hodin a všechny výsledky se ukládají dočasně, dokud relace není ukončena.[13] Výsledky lze sdílet s ostatními uživateli nebo skupinami prostřednictvím nástroje pro řízení přístupu k prostředkům.

Podpora databází

Souhrn databází MicrobesOnline

MicrobesOnline je postaven na integraci dat řady databází, které spravují různé aspekty jeho schopností. Úplný seznam je následující:[14]

  • Sekvenční informace: Neredundantní proteinové, genové a transkriptové sekvence a poznámky jsou extrahovány z RefSeq [15] a Uniprot.[16]
  • Taxonomická klasifikace druhů a sekvencí: NCBI Taxonomie [17] se používá ke klasifikaci druhů a sekvencí do fylogenetických skupin a k vytvoření fylogenetického stromu.
  • Identifikace neanotovaných proteinů ze sekvencí: CRITICA [18] se používá k nalezení úseků sekvence DNA, které kódují proteiny. Používá se jak komparativní genomika, tak komparace a metoda nezávislá na anotacích.
  • Identifikace anotovaných genů ze sekvencí: MicrobesOnline spoléhá na Záblesk [19] k automatickému hledání genů v bakteriích, archaeách a virových sekvencích.
  • Klasifikace proteinů: Klasifikace proteinů podle jejich konzervované domény, rodiny a superrodin stanovená PIRSF,[20] Pfam,[21] CHYTRÝ [22] a SUPERFAMILY [23] úložiště jsou zahrnuta.
  • Informace o genové ortologii: Ortologické skupiny genů napříč druhy jsou založeny na informacích v databázi COG,[24] který se při detekci homologie spoléhá na srovnání proteinových sekvencí.
  • Funkční informace genů a proteinů: K rozsahu poskytovaných funkčních informací přispívá: GOA [25] pro Genová ontologie anotace genů do funkčních kategorií, KEGG [26] - pro metabolické, molekulární a signální dráhy genů a - PANTER [27][28] pro informace o molekulárních a funkčních drahách v kontextu vztahů mezi rodinami proteinů a jejich evoluci. TIGRFAM [29] a Gene3D [30] jsou označovány jako strukturní informace a anotace proteinů.
  • Údaje o genovém výrazu: Oba NCBI GEO [31] a databáze mnoha mikrobových mikropolí [32] podporovat data genové exprese MicrobesOnline. Datové sady zkompilované databází Many Microbe Microarrays Database mají další výhodu v tom, že jsou přímo srovnatelné, protože pouze data generovaná jednokanálovým Affymetrix microarrays jsou přijímány a jsou následně normalizovány.
  • Detekce CRISPR: CRISPR [33] jsou DNA lokusy zapojené do imunity proti invazivním sekvencím, kde jsou krátké přímé repetice odděleny spacer sekvencemi.[34] Databáze generované CRT [35] a PILER-CL [36] k detekci CRISPR se používají algoritmy.
  • Detekce tRNA: TRNAscan-SE [37] databáze se používá jako reference k identifikaci sekvencí tRNA.
  • Předkládání údajů uživateli: Uživatelé mají schopnost nahrávat jak genomy, tak expresní soubory do MicrobesOnline a analyzovat je pomocí nabízených analytických nástrojů, s možností uchovat data v soukromí (v případě nepublikovaných dat) nebo je zveřejnit.[38] Údaje z mikročipu by měly zahrnovat jasnou identifikaci organismů, platforem, ošetření a kontrol, experimentálních podmínek, použitých časových bodů a normalizačních technik a také údaje o expresi ve formátu logaritmu nebo logaritmu. Přestože jsou akceptovány sekvence konceptu genomu, musí být v souladu s určitými pokyny: (1) shromážděný genom musí mít méně než 100 lešení, (2) FASTA měl by být použit formát souboru s jedinečným štítkem na kontig, (3) pokud možno by měly být přítomny genové předpovědi (v tomto případě patří akceptované formáty GenBank, EMBL, oddělené tabulátory a FASTA ), (4) Měl by být uveden název genomu a ID taxonomie NCBI.

Aktualizace

MicrobesOnline byl aktualizován každé 3 až 9 měsíců od roku 2007 do roku 2011, kdy byly přidány nové funkce a údaje o nových druzích. Od března 2011 však nebyly vydány žádné nové poznámky k vydání.[39]

Kompatibilita s jinými weby

MicrobesOnline je kompatibilní s dalšími podobnými platformami integrovaných dat mikrobů, jako jsou IMG a RegTransBase, vzhledem k tomu, že v databázi jsou udržovány standardní identifikátory genů.[40]

Mikroby Online v oblasti platforem pro analýzu mikrobů

Existují další snahy o vytvoření jednotné platformy pro nástroje pro analýzu prokaryot, většina z nich se však zaměřuje na jednu sadu typů analýz. Několik příkladů těchto zaměřených databází zahrnuje databáze s důrazem na analýzu metabolických dat (Microme[41]), komparativní genomika (MBGD [42] a prohlížeč OMA [43]), regulony a transkripční faktory (RegPrecise [44]), srovnávací funkční genomika (Pathline [45]), mezi mnoha dalšími. Jiné týmy však vynaložily značné úsilí na vytvoření komplexních platforem, které se do značné míry překrývají s možnostmi MicrobesOnline. Mikroskop [46] a Integrovaný systém mikrobiálních genomů[47][48] (IMG) jsou příklady populárních a nedávno aktualizovaných databází (od září 2014).

Rozšíření analýzy metagenomu: metaMicrobesOnline

metaMicrobesOnline [49] byl sestaven stejnými vývojáři jako MicrobesOnline a představuje rozšíření kapacit MicrobesOnline zaměřením na fylogenetickou analýzu metagenomy. S podobným webovým rozhraním jako MicrobesOnline je uživatel schopen přepínat mezi weby pomocí odkazu „přepnout na“ na domovské stránce.

Viz také

externí odkazy

Reference

  1. ^ Alm, E. J .; Huang, K. H .; Price, M. N .; Koche, R. P .; Keller, K; Dubchak, I.L .; Arkin, A. P. (2005). „Mikroby Online Web pro srovnávací genomiku ". Výzkum genomu. 15 (7): 1015–22. doi:10,1101 / gr. 3844805. PMC  1172046. PMID  15998914.
  2. ^ Dehal, P. S .; Joachimiak, M. P .; Price, M. N .; Bates, J. T .; Baumohl, J. K .; Chivian, D .; Friedland, G. D .; Huang, K. H .; Keller, K .; Novichkov, P. S .; Dubchak, I.L .; Alm, E. J .; Arkin, A. P. (2009). „Mikroby Online: Integrovaný portál pro srovnávací a funkční genomiku “. Výzkum nukleových kyselin. 38 (Problém s databází): D396–400. doi:10.1093 / nar / gkp919. PMC  2808868. PMID  19906701.
  3. ^ Feist, A. M .; Herrgård, M. J .; Thiele, I .; Reed, J.L .; Palsson, B. Ø. (2008). „Rekonstrukce biochemických sítí v mikroorganismech“. Příroda Recenze Mikrobiologie. 7 (2): 129–43. doi:10.1038 / nrmicro1949. PMC  3119670. PMID  19116616.
  4. ^ Chen, I. M. A .; Markowitz, V. M .; Chu, K .; Anderson, I .; Mavromatis, K .; Kyrpides, N. C .; Ivanova, N. N. (2013). „Zlepšení anotací mikrobiálního genomu v kontextu integrované databáze“. PLOS ONE. 8 (2): e54859. Bibcode:2013PLoSO ... 854859C. doi:10.1371 / journal.pone.0054859. PMC  3570495. PMID  23424620.
  5. ^ „Domovská stránka MicrobesOnline“. Mikroby online. Citováno 2014-09-09.
  6. ^ Virtuální institut pro mikrobiální stres a přežití; Ernest Orlando Lawrence Berkeley National Laboratory (2008). Msgstr "Průvodce webem a výukový program". Mikroby online. 1 Cyclotron Road • Berkeley, CA 94720.CS1 maint: umístění (odkaz)
  7. ^ Dehal, P. S .; Joachimiak, M. P .; Price, M. N .; Bates, J. T .; Baumohl, J. K .; Chivian, D .; Friedland, G. D .; Huang, K. H .; Keller, K .; Novichkov, P. S .; Dubchak, I.L .; Alm, E. J .; Arkin, A. P. (2009). „Mikroby Online: Integrovaný portál pro srovnávací a funkční genomiku “. Výzkum nukleových kyselin. 38 (Problém s databází): D396–400. doi:10.1093 / nar / gkp919. PMC  2808868. PMID  19906701.
  8. ^ Price, M. N .; Dehal, P. S .; Arkin, A. P. (2008). „FastBLAST: Homologické vztahy pro miliony proteinů“. PLOS ONE. 3 (10): e3589. Bibcode:2008PLoSO ... 3.3589P. doi:10,1371 / journal.pone.0003589. PMC  2571987. PMID  18974889.
  9. ^ Barrell, D .; Dimmer, E .; Huntley, R. P .; Binns, D .; O'Donovan, C .; Apweiler, R. (2009). „Databáze GOA v roce 2009 - integrovaný zdroj anotací genové ontologie“. Výzkum nukleových kyselin. 37 (Problém s databází): D396–403. doi:10.1093 / nar / gkn803. PMC  2686469. PMID  18957448.
  10. ^ Virtuální institut pro mikrobiální stres a přežití; Ernest Orlando Lawrence Berkeley National Laboratory (2008). Msgstr "Průvodce webem a výukový program". Mikroby online. 1 Cyclotron Road • Berkeley, CA 94720.CS1 maint: umístění (odkaz)
  11. ^ Kanehisa, M. (2004). „Zdroj KEGG pro dešifrování genomu“. Výzkum nukleových kyselin. 32 (90001): 277D – 280. doi:10.1093 / nar / gkh063. PMC  308797. PMID  14681412.
  12. ^ Bates, J. T .; Chivian, D .; Arkin, A. P. (2011). „GLAMM: Aplikace spojená s genomem pro metabolické mapy“. Výzkum nukleových kyselin. 39 (Problém s webovým serverem): W400–5. doi:10.1093 / nar / gkr433. PMC  3125797. PMID  21624891.
  13. ^ Virtuální institut pro mikrobiální stres a přežití; Ernest Orlando Lawrence Berkeley National Laboratory (2008). "Průvodce webem a návod". Mikroby online. 1 Cyclotron Road • Berkeley, CA 94720.CS1 maint: umístění (odkaz)
  14. ^ Alm, E. J .; Huang, K. H .; Price, M. N .; Koche, R. P .; Keller, K; Dubchak, I.L .; Arkin, A. P. (2005). „Mikroby Online Web pro srovnávací genomiku ". Výzkum genomu. 15 (7): 1015–22. doi:10,1101 / gr. 3844805. PMC  1172046. PMID  15998914.
  15. ^ Pruitt, K. D .; Tatusová, T .; Maglott, D. R. (2007). "Referenční sekvence NCBI (viz Sekv): Upravená neredundantní databáze sekvencí genomů, transkriptů a proteinů ". Výzkum nukleových kyselin. 35 (Problém s databází): D61–5. doi:10.1093 / nar / gkl842. PMC  1716718. PMID  17130148.
  16. ^ Uniprot, Consortium (2009). "Univerzální zdroj bílkovin (Uni Prot) 2009". Výzkum nukleových kyselin. 37 (Problém s databází): D169–74. doi:10.1093 / nar / gkn664. PMC  2686606. PMID  18836194.
  17. ^ Sayers, E. W .; Barrett, T .; Benson, D. A .; Bryant, S. H .; Canese, K .; Chetvernin, V .; Church, D. M .; Dicuccio, M .; Edgar, R .; Federhen, S .; Feolo, M .; Geer, L. Y .; Helmberg, W .; Kapustin, Y .; Landsman, D .; Lipman, D. J .; Madden, T. L .; Maglott, D. R .; Miller, V .; Mizrachi, I .; Ostell, J .; Pruitt, K. D .; Schuler, G. D .; Sequeira, E .; Sherry, S. T .; Shumway, M .; Sirotkin, K .; Souvorov, A .; Starchenko, G .; et al. (2009). „Databázové zdroje Národního centra pro biotechnologické informace“. Výzkum nukleových kyselin. 37 (Problém s databází): D5–15. doi:10.1093 / nar / gkn741. PMC  2686545. PMID  18940862.
  18. ^ Badger, J. H .; Olsen, G. J. (1999). „CRITICA: Nástroj pro identifikaci kódovacích oblastí vyvolávající srovnávací analýzu“. Molekulární biologie a evoluce. 16 (4): 512–24. doi:10.1093 / oxfordjournals.molbev.a026133. PMID  10331277.
  19. ^ Delcher, A.L .; Bratke, K. A .; Powers, E. C .; Salzberg, S.L. (2007). „Identifikace bakteriálních genů a DNA endosymbiontu pomocí Glimmeru“. Bioinformatika. 23 (6): 673–679. doi:10.1093 / bioinformatika / btm009. PMC  2387122. PMID  17237039.
  20. ^ Wu, C.H .; Nikolskaya, A .; Huang, H .; Yeh, L. S .; Natale, D. A .; Vinayaka, C. R .; Hu, Z. Z .; Mazumder, R .; Kumar, S .; Kourtesis, P .; Ledley, R. S .; Suzek, B.E .; Arminski, L .; Chen, Y .; Zhang, J .; Cardenas, J. L .; Chung, S .; Castro-Alvear, J .; Dinkov, G .; Barker, W. C. (2004). „PIRSF: Systém klasifikace rodin na zdroji proteinových informací“. Výzkum nukleových kyselin. 32 (90001): 112D – 1114. doi:10.1093 / nar / gkh097. PMC  308831. PMID  14681371.
  21. ^ Finn, R. D .; Tate, J .; Mistry, J .; Coggill, P. C .; Sammut, S. J .; Hotz, H. -R .; Ceric, G .; Forslund, K .; Eddy, S. R .; Sonnhammer, E. L. L .; Bateman, A. (2007). „Databáze proteinových rodin Pfam“. Výzkum nukleových kyselin. 36 (Problém s databází): D281–8. doi:10,1093 / nar / gkm960. PMC  2238907. PMID  18039703.
  22. ^ Letunic, I .; Doerks, T .; Bork, P. (2009). „SMART 6: Nedávné aktualizace a nový vývoj“. Výzkum nukleových kyselin. 37 (Problém s databází): D229–32. doi:10.1093 / nar / gkn808. PMC  2686533. PMID  18978020.
  23. ^ Wilson, D .; Madera, M .; Vogel, C .; Chothia, C.; Gough, J. (2007). „Databáze SUPERFAMILY v roce 2007: Rodiny a funkce“. Výzkum nukleových kyselin. 35 (Problém s databází): D308 – D313. doi:10.1093 / nar / gkl910. PMC  1669749. PMID  17098927.
  24. ^ Tatusov, R. L .; Fedorová, N. D .; Jackson, J. D .; Jacobs, A. R .; Kiryutin, B .; Koonin, E. V .; Krylov, D. M .; Mazumder, R .; Mekhedov, S.L .; Nikolskaya, A. N .; Rao, B. S .; Smirnov, S .; Sverdlov, A. V .; Vasudevan, S .; Wolf, Y. I .; Yin, J. J .; Natale, D. A. (2003). „Databáze COG: Aktualizovaná verze obsahuje eukaryoty“. BMC bioinformatika. 4: 41. doi:10.1186/1471-2105-4-41. PMC  222959. PMID  12969510.
  25. ^ Barrell, D .; Dimmer, E .; Huntley, R. P .; Binns, D .; O'Donovan, C .; Apweiler, R. (2009). „Databáze GOA v roce 2009 - integrovaný zdroj anotací genové ontologie“. Výzkum nukleových kyselin. 37 (Problém s databází): D396–403. doi:10.1093 / nar / gkn803. PMC  2686469. PMID  18957448.
  26. ^ Kanehisa, M. (2004). „Zdroj KEGG pro dešifrování genomu“. Výzkum nukleových kyselin. 32 (90001): 277D – 280. doi:10.1093 / nar / gkh063. PMC  308797. PMID  14681412.
  27. ^ Mi, H .; Guo, N .; Kejariwal, A .; Thomas, P. D. (2007). „PANTHER verze 6: Údaje o sekvenci a vývoji proteinů s rozšířeným zastoupením biologických drah“. Výzkum nukleových kyselin. 35 (Problém s databází): D247–52. doi:10.1093 / nar / gkl869. PMC  1716723. PMID  17130144.
  28. ^ Mi, H .; Thomas, P. (2009). „PANTHER Pathway: Databáze cest založená na ontologii spojená s nástroji pro analýzu dat“. Síť proteinů a analýza dráhy. Metody v molekulární biologii. 563. str. 123–40. doi:10.1007/978-1-60761-175-2_7. ISBN  978-1-60761-174-5. PMID  19597783.
  29. ^ Selengut, J. D .; Haft, D. H .; Davidsen, T .; Ganapathy, A .; Gwinn-Giglio, M .; Nelson, W. C .; Richter, A. R .; White, O. (2007). „TIGRFAM a vlastnosti genomu: Nástroje pro přiřazení molekulární funkce a biologického procesu v prokaryotických genomech“. Výzkum nukleových kyselin. 35 (Problém s databází): D260–4. doi:10.1093 / nar / gkl1043. PMC  1781115. PMID  17151080.
  30. ^ Yeats, C .; Lees, J .; Reid, A .; Kellam, P .; Martin, N .; Liu, X .; Orengo, C. (2007). „Gene3D: Komplexní strukturální a funkční anotace genomů“. Výzkum nukleových kyselin. 36 (Problém s databází): D414–8. doi:10.1093 / nar / gkm 1019. PMC  2238970. PMID  18032434.
  31. ^ Barrett, T .; Troup, D. B .; Wilhite, S.E .; Ledoux, P .; Rudnev, D .; Evangelista, C .; Kim, I.F .; Soboleva, A .; Tomashevsky, M .; Marshall, K. A .; Phillippy, K. H .; Sherman, P. M .; Muertter, R. N .; Edgar, R. (2009). „NCBI GEO: Archiv pro vysoce výkonná funkční genomová data“. Výzkum nukleových kyselin. 37 (Problém s databází): D885–90. doi:10.1093 / nar / gkn764. PMC  2686538. PMID  18940857.
  32. ^ Faith, J. J .; Driscoll, M.E .; Fusaro, V. A .; Cosgrove, E. J .; Hayete, B .; Juhn, F. S .; Schneider, S. J .; Gardner, T. S. (2007). „Mnoho databází mikrobových mikropolí: Jednotně normalizované kompendia Affymetrix se strukturovanými experimentálními metadaty“. Výzkum nukleových kyselin. 36 (Problém s databází): D866–70. doi:10.1093 / nar / gkm 815. PMC  2238822. PMID  17932051.
  33. ^ Marraffini, L. A .; Sontheimer, E. J. (2010). „CRISPR interference: RNA-řízená adaptivní imunita v bakteriích a archaeách“. Genetika hodnocení přírody. 11 (3): 181–190. doi:10.1038 / nrg2749. PMC  2928866. PMID  20125085.
  34. ^ Marraffini, L. A .; Sontheimer, E. J. (2010). "CRISPR interference: RNA-řízená adaptivní imunita v bakteriích a archaeách". Genetika hodnocení přírody. 11 (3): 181–190. doi:10.1038 / nrg2749. PMC  2928866. PMID  20125085.
  35. ^ Bland, C; Ramsey, T. L .; Sabree, F; Lowe, M; Brown, K; Kyrpides, N. C .; Hugenholtz, P (2007). „Nástroj pro rozpoznávání CRISPR (CRT): Nástroj pro automatickou detekci shlukovaných pravidelně rozložených palindromických opakování“. BMC bioinformatika. 8: 209. doi:10.1186/1471-2105-8-209. PMC  1924867. PMID  17577412.
  36. ^ Edgar, R. C. (2007). „PILER-CR: Rychlá a přesná identifikace opakování CRISPR“. BMC bioinformatika. 8: 18. doi:10.1186/1471-2105-8-18. PMC  1790904. PMID  17239253.
  37. ^ Lowe, T. M .; Eddy, S. R. (1997). „TRNAscan-SE: Program pro lepší detekci genů transferové RNA v genomové sekvenci“. Výzkum nukleových kyselin. 25 (5): 955–64. doi:10.1093 / nar / 25.5.955. PMC  146525. PMID  9023104.
  38. ^ „Domovská stránka MicrobesOnline“. Mikroby online. Citováno 2014-09-09.
  39. ^ „Poznámky k verzi MicrobesOnline“. Mikroby online. Citováno 2014-09-10.
  40. ^ Dehal, P. S .; Joachimiak, M. P .; Price, M. N .; Bates, J. T .; Baumohl, J. K .; Chivian, D .; Friedland, G. D .; Huang, K. H .; Keller, K .; Novichkov, P. S .; Dubchak, I.L .; Alm, E. J .; Arkin, A. P. (2009). „Mikroby Online: Integrovaný portál pro srovnávací a funkční genomiku “. Výzkum nukleových kyselin. 38 (Problém s databází): D396–400. doi:10.1093 / nar / gkp919. PMC  2808868. PMID  19906701.
  41. ^ "Microme". Microme. Citováno 2014-09-09.
  42. ^ Uchiyama, I .; Mihara, M .; Nishide, H .; Chiba, H. (2012). „Aktualizace MBGD 2013: Databáze mikrobiálního genomu pro zkoumání rozmanitosti mikrobiálního světa“. Výzkum nukleových kyselin. 41 (Problém s databází): D631–5. doi:10.1093 / nar / gks1006. PMC  3531178. PMID  23118485.
  43. ^ Altenhoff, A. M .; Schneider, A .; Gonnet, G. H .; Dessimoz, C. (2010). „OMA 2011: Odhad ortologie mezi 1000 úplnými genomy“. Výzkum nukleových kyselin. 39 (Problém s databází): D289–94. doi:10.1093 / nar / gkq1238. PMC  3013747. PMID  21113020.
  44. ^ Novichkov, P. S .; Kazakov, A. E .; Ravcheev, D. A .; Leyn, S. A .; Kovaleva, G. Y .; Sutormin, R. A .; Kazanov, M. D .; Riehl, W .; Arkin, A. P .; Dubchak, I .; Rodionov, D. A. (2013). „Reg Přesný 3.0 - Zdroj pro zkoumání transkripční regulace v bakteriích v genomu “. BMC Genomics. 14: 745. doi:10.1186/1471-2164-14-745. PMC  3840689. PMID  24175918.
  45. ^ Meyer, M .; Wong, B .; Styczynski, M .; Munzner, T.; Pfister, H. (2010). "Pathline: Nástroj pro srovnávací funkční genomiku". Fórum počítačové grafiky. 29 (3): 1043–1052. doi:10.1111 / j.1467-8659.2009.01710.x.
  46. ^ Vallenet, D .; Belda, E .; Calteau, A .; Cruveiller, S .; Engelen, S .; Lajus, A .; Le Fevre, F .; Longin, C .; Mornico, D .; Roche, D .; Rouy, Z .; Salvignol, G .; Scarpelli, C .; Thil Smith, A. A .; Weiman, M .; Medigue, C. (2012). „Mikro Rozsah--integrovaný mikrobiální zdroj pro léčení a srovnávací analýzu genomových a metabolických údajů ". Výzkum nukleových kyselin. 41 (Problém s databází): D636–47. doi:10.1093 / nar / gks1194. PMC  3531135. PMID  23193269.
  47. ^ Markowitz, V. M .; Szeto, E .; Palaniappan, K .; Grechkin, Y .; Chu, K .; Chen, I. M. A .; Dubchak, I .; Anderson, I .; Lykidis, A .; Mavromatis, K .; Ivanova, N. N .; Kyrpides, N. C. (2007). „Systém integrovaných mikrobiálních genomů (IMG) v roce 2007: Rozšíření datového obsahu a analytických nástrojů“. Výzkum nukleových kyselin. 36 (Problém s databází): D528–33. doi:10.1093 / nar / gkm 846. PMC  2238897. PMID  17933782.
  48. ^ Markowitz, V. M .; Chen, I. -M. A.; Palaniappan, K .; Chu, K .; Szeto, E .; Pillay, M .; Ratner, A .; Huang, J .; Woyke, T .; Huntemann, M .; Anderson, I .; Billis, K .; Varghese, N .; Mavromatis, K .; Pati, A .; Ivanova, N. N .; Kyrpides, N. C. (2013). „Verze IMG 4 integrovaného systému srovnávací analýzy mikrobiálních genomů“. Výzkum nukleových kyselin. 42 (Problém s databází): D560–7. doi:10.1093 / nar / gkt963. PMC  3965111. PMID  24165883.
  49. ^ Chivian, D .; Dehal, P. S .; Keller, K .; Arkin, A. P. (2012). „Meta Mikroby Online: Fylogenomická analýza mikrobiálních komunit ". Výzkum nukleových kyselin. 41 (Problém s databází): D648–54. doi:10.1093 / nar / gks1202. PMC  3531168. PMID  23203984.