DcGO - DcGO
Obsah | |
---|---|
Popis | Databáze dcGO je komplexní zdroj ontologie zaměřený na domény pro proteinové domény. |
Typy dat zajat | Proteinové domény, ontologie |
Kontakt | |
Výzkumné centrum | University of Bristol |
Primární citace | PMID 23161684 |
Přístup | |
webová stránka | Web dcGO |
Stáhnout URL | dcGO STÁHNOUT |
Nástroje | |
Web | PSnet, sTOL, dcGOR, dcGO Predictor, Obohacování dcGO |
dcGO je komplexní ontologická databáze pro proteinové domény.[1] Jako prostředek ontologie se integruje dcGO Otevřené biomedicínské ontologie z různých kontextů, od funkčních informací, jako je Gene Ontology, po ostatní o enzymech a cestách, od fenotypových informací přes hlavní modelové organismy po informace o lidských nemocech a drogách. Jako proteinová doména prostředek, dcGO zahrnuje anotace k jednotlivým doménám i naddoménám (tj. kombinace dvou nebo více po sobě jdoucích domén).
Koncepty
Za DCGO jsou dva klíčové koncepty. Prvním konceptem je označení proteinové domény s ontologií, například s Gene Ontology. Proto se mu říká dcGO, genová ontologie zaměřená na doménu. Druhým konceptem je použití ontologicky značených proteinových domén například pro predikci funkce proteinu. Zjednodušeně řečeno, první koncept je o tom, jak vytvořit zdroj dcGO, a druhý koncept je o tom, jak použít zdroj dcGO.
Časové osy
- V roce 2010 byl algoritmus za DCGO původně publikován jako vylepšení SUPERFAMILY databáze.[2]
- V roce 2011 se produkt „dcGO Predictor“ umístil na 10. místě v soutěži CAFA 2011, když byl přihlášen Genová ontologie.[3][4] Tento prediktor je pouze metoda založená na doméně bez strojového učení.
- V roce 2012 byla databáze oficiálně vydána a publikována v čísle databáze NAR.
- V roce 2013 byl webový server vylepšen, aby podporoval mnoho analýz pomocí zdroje dcGO.
- Na začátku roku 2014 byl pro predikci funkcí a fenotypů předložen „dcGO Predictor“, který se v predikci fenotypů CAFA umístil na 4. místě.
- Na konci roku 2014 byl vyvinut open-source balíček R dcGOR, který pomáhá analyzovat ontologie a anotace proteinové domény.
Webový server
Nedávným použitím dcGO je vybudování doménové sítě z funkčního hlediska pro srovnání mezi ontologiemi,[5] a kombinovat s druhovým stromem života (sTOL) za účelem poskytnutí fylogenentického kontextu pro fungování a fenotyp.[6]
Software
Software s otevřeným zdrojovým kódem dcGOR je vyvinut pomocí Programovací jazyk R. analyzovat ontologie a anotace zaměřené na doménu.[7] Mezi podporované analýzy patří:
- snadný přístup k široké škále ontologií a jejich anotací zaměřených na doménu;
- schopen vytvářet přizpůsobené ontologie a anotace;
- analýza a vizualizace obohacování podle domény;
- konstrukce doménové (sémantické podobnosti) sítě podle antologií ontologie;
- analýza významnosti pro odhad použití kontaktní (statistické významnosti) sítě algoritmus náhodného chodce;
- vysoce výkonné paralelní výpočty.
Mezi funkce v rámci aktivního vývoje patří:
- algoritmus a implementace pro vytváření antologií ontologie zaměřených na doménu;
- predikce ontologického termínu pro architektury domén vstupních proteinů;
- rekonstrukce diskrétních znaků předků pomocí maximální věrohodnosti / šetrnosti.
Viz také
Reference
- ^ Fang, H .; Gough, J. (2012). „DcGO: Databáze doménových ontologií o funkcích, fenotypech, nemocech a dalších“. Výzkum nukleových kyselin. 41 (Problém s databází): D536 – D544. doi:10.1093 / nar / gks1080. PMC 3531119. PMID 23161684.
- ^ De Lima Morais, D. A .; Fang, H .; Rackham, O. J. L .; Wilson, D .; Pethica, R .; Chothia, C.; Gough, J. (2010). „SUPERFAMILY 1,75 včetně metody ontogenní genové ontologie“. Výzkum nukleových kyselin. 39 (Problém s databází): D427 – D434. doi:10.1093 / nar / gkq1130. PMC 3013712. PMID 21062816.
- ^ Fang, H .; Gough, J. (2013). „Řešení funkční genomiky zaměřené na doménu pomocí dcGO Predictor“. BMC bioinformatika. 14 Suppl 3: S9. doi:10.1186 / 1471-2105-14-S3-S9. PMC 3584936. PMID 23514627.
- ^ Radivojac, P .; Clark, W. T .; Oron, T. R .; Schnoes, A. M .; Wittkop, T .; Sokolov, A .; Graim, K .; Funk, C .; Verspoor, K .; Ben-Hur, A .; Pandey, G .; Yunes, J. M .; Talwalkar, A. S .; Repo, S .; Souza, M. L .; Piovesan, D .; Casadio, R .; Wang, Z .; Cheng, J .; Fang, H .; Gough, J .; Koskinen, P .; Törönen, P .; Nokso-Koivisto, J .; Holm, L .; Cozzetto, D .; Buchan, D. W. A .; Bryson, K .; Jones, D. T .; et al. (2013). „Rozsáhlé vyhodnocení výpočetní predikce funkce proteinu“. Přírodní metody. 10 (3): 221–227. doi:10.1038 / nmeth.2340. PMC 3584181. PMID 23353650.
- ^ Fang, H; Gough, J (2013). "Matice nemoc-lék-fenotyp odvozená chůzí po síti funkční domény". Molekulární biosystémy. 9 (7): 1686–96. doi:10.1039 / c3mb25495j. PMID 23462907.
- ^ Fang, H .; Oates, M.E .; Pethica, R. B .; Greenwood, J. M .; Sardar, A. J .; Rackham, O. J. L .; Donoghue, P. C. J .; Stamatakis, A .; De Lima Morais, D. A .; Gough, J. (2013). „Denně aktualizovaný strom (sekvencovaného) života jako reference pro výzkum genomu“. Vědecké zprávy. 3: 2015. Bibcode:2013NatSR ... 3E2015F. doi:10.1038 / srep02015. PMC 6504836. PMID 23778980.
- ^ Fang, H (2014). „DcGOR: Balíček R pro analýzu ontologií a anotací proteinové domény“. PLoS výpočetní biologie. 10 (10): e1003929. Bibcode:2014PLSCB..10E3929F. doi:10.1371 / journal.pcbi.1003929. PMC 4214615. PMID 25356683.