Databáze obecných modelových organizmů - Generic Model Organism Database

The Databáze obecných modelových organizmů (GMOD) Projekt poskytuje komunitám biologického výzkumu sadu nástrojů open-source software komponenty pro vizualizaci, anotování, správu a ukládání biologických dat. Projekt GMOD je financován Spojenými státy Národní institut zdraví, Národní vědecká nadace a Služba USDA Agricultural Research Service.
Dějiny
Projekt GMOD byl zahájen počátkem roku 2000 jako spolupráce mezi několika modelové databáze organismů (MOD), kteří sdíleli potřebu vytvářet podobné software nástroje pro zpracování dat ze sekvenčních projektů. MOD nebo specifické pro daný organismus databáze, popište genom a další informace o důležitých experimentální organismy ve vědách o živé přírodě a zachytit velké objemy dat a informací generovaných moderními biologie. Spíše než každá skupina navrhující vlastní software, čtyři hlavní MOD -FlyBase, Databáze genomu Saccharomyces, Databáze myší genomu, a WormBase —Pracovali společně na vytváření aplikací, které poskytují funkce potřebné pro všechny MOD, jako je software, který pomáhá spravovat data v MOD, a pomáhá uživatelům přistupovat k datům a dotazovat se na ně.
Projekt GMOD pracuje na udržení interoperability softwarových komponent. Mnoho nástrojů proto používá společný formát vstupních / výstupních souborů nebo spouští databázi schémat Chado.
Schéma databáze Chado
Chado[1] Schéma si klade za cíl pokrýt mnoho tříd dat často používaných moderními biology, od genetických dat přes fylogenetické stromy přes publikace přes organismy přes data z microarray přes ID až po expresi RNA / proteinů. Chado rozsáhle využívá řízené slovníky k psaní všech entit v databázi; například: geny, přepisy, exony, transponovatelné prvky atd., jsou uloženy v tabulce funkcí s typem poskytnutým Sekvenční ontologie. Když je do Sequence Ontology přidán nový typ, tabulka funkcí nevyžaduje žádnou úpravu, pouze aktualizaci dat v databázi. Totéž do značné míry platí o analytických datech, která lze uložit také v Chado.
Stávající základní moduly Chado jsou:
- sekvence - pro sekvence / funkce
- cv - pro řízené slovníky / ontologie
- obecně - aktuálně pouze dbxrefs
- organismus - taxonomické údaje
- pub - publikace a reference
- companalysis - rozšiřuje sekvenční modul o data výpočetní analýzy
- mapa - nesekvenční mapy
- genetické - genetické a fenotypové údaje
- exprese - genová exprese
- přírodní rozmanitost - údaje o populaci
Software
Celý seznam softwarových komponent GMOD najdete na stránce GMOD Components. Mezi tyto komponenty patří:
|
Zúčastněné databáze
Následující databáze organismů přispívají a / nebo přijímají komponenty GMOD pro databáze modelových organismů.
ANÝZ | Antonospora DB | Arabidopsis |
Beebase | BeetleBase[4] | Databáze hovězího genomu (BGD) |
BioHealthBase | Bovine QTL Viewer | Databáze rodin genů skotu EST |
CGD | CGL | ChromDB |
Projekt anotace chromozomu 7 | CSHLmpd | Databáze genomových variant |
DictyBase[5] | DroSpeGe | EcoCyc |
FlyBase | Plísňová komparativní genomika | Fungal Telomere Browser |
Prohlížeč genomu Gallus | GeneDB | GrainGenes |
Gramen | HapMap | Lidské 2q33 |
Segmentální duplikační databáze lidského genomu | IVDB | MAGI |
Databáze mořských biologických laboratoří | Myší genomová informatika | Non-Human Segmental Duplication Database |
OMAP | OryGenesDB | Oryza Chromosome 8 |
Pathway Tools | ParameciumDB[6] | PeanutMap |
Rostliny DB | PlasmoDB | PomBase |
PseudoCAP | PossumBase | PUMAdb |
Databáze krysích genomů | Databáze genomu Saccharomyces | SGD Lite |
SmedDB | Sol Genomics Network | Sója |
Databáze sójových bobů | T1DBase | Informační zdroj Arabidopsis |
TGD | Genome Institute | Institut pro genomický výzkum |
Prohlížeč rýžového genomu TIGR | ToxoDB | Prohlížeč TriAnnot BAC |
VectorBase | wFleaBase[7] | WormBase |
XanthusBase | Xenbase |
Související projekty
- Bioperl, BioJava, Biopython, BioRuby, atd.
- Ensembl
- Genová ontologie
- DAS
- Genomics Unified Schema
- Manatee: Ruční anotační nástroj
- Biocurator.org
- Otevřené biomedicínské ontologie
- Sekvenční ontologický projekt
Viz také
- Biologická databáze
- Projekt genomu
- Genomika
- Genom
- Překladač genomu - softwarová platforma vše v jednom pro návrh a vizualizaci DNA, správu dat a spolupráci.
Reference
- ^ Christopher J. Mungall; David B. Emmert; Konsorcium FlyBase (2007). „Případová studie Chado: modulární schéma založené na ontologii pro reprezentaci biologických informací souvisejících s genomem“. Bioinformatika. 23 (13): i337 – i346. doi:10.1093 / bioinformatika / btm189. PMID 17646315.
- ^ Stein LD; Mungall C; Shu S; Caudy M; Mangone M; Den A; Nickerson E; Stajich JE; Harris TW; Arva A; Lewis S. (2002). „Prohlížeč generického genomu: stavební kámen pro databázi modelového organismu“. Genome Res. 12 (10): 1599–610. doi:10,1101 / gr. 403602. PMC 187535. PMID 12368253.
- ^ Afgan, E .; Baker, D .; van den Beek, M .; Blankenberg, D .; Bouvier, D .; Čech, M .; Chilton, J .; Clements, D .; Coraor, N .; Eberhard, C .; Grüning, B .; Guerler, A .; Hillman-Jackson, J .; Von Kuster, G .; Rasche, E .; Soranzo, N .; Turaga, N .; Taylor, J .; Nekrutenko, A .; Goecks, J. (8. července 2016). „Platforma Galaxy pro přístupné, reprodukovatelné a kolaborativní biomedicínské analýzy: aktualizace z roku 2016“. Výzkum nukleových kyselin. 44 (W1): W3 – W10. doi:10.1093 / nar / gkw343. PMC 4987906. PMID 27137889.
- ^ Wang L; Wang S; Li Y; Paradesi MS; Brown SJ. (2007). „BeetleBase: databáze modelových organismů pro Tribolium castaneum“. Nucleic Acids Res. 35 (Problém s databází): D476–9. doi:10.1093 / nar / gkl776. PMC 1669707. PMID 17090595.
- ^ Chisholm RL; Gaudet P; Jen EM; Pilcher KE; Fey P; Obchodník SN; Kibbe WA. (2006). „dictyBase, databáze modelových organismů pro Dictyostelium discoideum“. Nucleic Acids Res. 34 (Problém s databází): D423–7. doi:10.1093 / nar / gkj090. PMC 1347453. PMID 16381903.
- ^ Arnaiz O; Cain S; Cohen J; Sperling L. (2007). „ParameciumDB: zdroj komunity, který integruje sekvenci genomu Paramecium tetraurelia s genetickými daty“. Nucleic Acids Res. 35 (Problém s databází): D439–44. doi:10.1093 / nar / gkl777. PMC 1669747. PMID 17142227.
- ^ Colbourne JK; Singan VR; Gilbert DG. (2005). „wFleaBase: databáze genomu dafnií“. BMC bioinformatika. 6: 45. doi:10.1186/1471-2105-6-45. PMC 555599. PMID 15752432.