Genová ontologie - Gene ontology
![]() | |
---|---|
Obsah | |
Popis | Zdroj s řízená slovní zásoba popsat funkci geny a genové produkty |
Přístup | |
webová stránka | genontologie |
The Genová ontologie (JÍT) je hlavní bioinformatika iniciativa na sjednocení zastoupení gen a genový produkt atributy napříč všemi druh.[1] Přesněji řečeno, projekt si klade za cíl: 1) udržovat a rozvíjet své řízená slovní zásoba genu a atributů genového produktu; 2) opatřit poznámkami geny a genové produkty a asimilovat a šířit anotační data; a 3) poskytnout nástroje pro snadný přístup ke všem aspektům dat poskytovaných projektem a umožnit funkční interpretaci experimentálních dat pomocí GO, například prostřednictvím analýzy obohacení.[2][3] GO je součástí většího klasifikačního úsilí, Otevřené biomedicínské ontologie, přičemž je jedním z počátečních kandidátských členů Slévárna OBO.[4]
Zatímco genová nomenklatura se zaměřuje na gen a genové produkty, genová ontologie se zaměřuje na funkci genů a genových produktů. GO také rozšiřuje úsilí pomocí značkovací jazyk vytvářet data (nejen genů a jejich produktů, ale také kurátorských atributů) strojově čitelné, a to způsobem, který je jednotný pro všechny druhy (zatímco konvence genové nomenklatury se liší podle biologických taxon ).
Termíny a ontologie
Z praktického hlediska je ontologie reprezentací něčeho, o čem víme. „Ontologie“ se skládají z reprezentací věcí, které jsou zjistitelné nebo přímo pozorovatelné, a vztahů mezi těmito věcmi. V biologii a souvisejících doménách neexistuje univerzální standardní terminologie a použití výrazů může být specifické pro určitý druh, oblast výzkumu nebo dokonce konkrétní výzkumná skupina. To ztěžuje komunikaci a sdílení dat. Projekt Gene Ontology poskytuje ontologie definovaných pojmů představujících genový produkt vlastnosti. Ontologie pokrývá tři domény:
- buněčná složka, části a buňka nebo jeho extracelulární životní prostředí;
- molekulární funkce, elementární aktivity genového produktu na molekulární úrovni, jako je vazba nebo katalýza;
- biologický proces, operace nebo soubory molekulárních událostí s definovaným začátkem a koncem, které se vztahují k fungování integrovaných živých jednotek: buněk, papírové kapesníky, orgány, a organismy.
Každý termín GO v rámci ontologie má název termínu, kterým může být slovo nebo řetězec slov; jedinečný alfanumerický identifikátor; definice s citovanými zdroji; a ontologii označující doménu, ke které patří. Termíny mohou mít také synonyma, která jsou klasifikována jako přesně ekvivalentní názvu termínu, širší, užší nebo související; odkazy na rovnocenné koncepty v jiných databázích; a komentáře k významu nebo použití pojmu. GO ontologie je strukturována jako a směrovaný acyklický graf a každý termín je definován vztahy k jednomu nebo více dalším výrazům ve stejné doméně a někdy k jiným doménám. Slovník GO je navržen tak, aby byl druhově neutrální, a zahrnuje pojmy platné pro prokaryoty a eukaryoty, singl a mnohobuněčné organismy.
GO není statické a doplňky, opravy a úpravy navrhují a získávají členové výzkumných a anotačních komunit i ti, kteří jsou přímo zapojeni do projektu GO.[5] Například anotátor může požadovat konkrétní výraz představující metabolickou cestu, nebo může být část ontologie revidována pomocí komunitních odborníků (např.[6]). Navrhované úpravy jsou zkontrolovány redaktory ontologie a případně implementovány.
Soubory ontologie a anotace GO jsou volně dostupné na webových stránkách GO[7] v mnoha formátech nebo k nim lze přistupovat online pomocí prohlížeče GO AmiGO. Projekt Gene Ontology také poskytuje mapování jeho termínů ke stažení na jiné klasifikační systémy.
Příklad termínu
- id: GO: 0000016
- název: aktivita laktázy
- ontologie: molekulární_funkce
- def: "Katalýza reakce: laktóza + H2O = D-glukóza + D-galaktóza." [ES: 3.2.1.108]
- synonymum: "aktivita laktázy-florizinové hydrolázy" BROAD [EC: 3.2.1.108]
- synonymum: "aktivita laktózy galaktohydrolázy" PŘESNÁ [EC: 3.2.1.108]
- xref: EC: 3.2.1.108
- xref: MetaCyc: LACTASE-RXN
- xref: Reactome: 20536
- is_a: GO: 0004553! aktivita hydrolázy, hydrolýza O-glykosylových sloučenin
Zdroj dat:[8]
Anotace
Anotace genomu zahrnuje praxi získávání údajů o genovém produktu a poznámky GO k tomu používají výrazy z GO. Anotace kurátorů GO jsou integrovány a šířeny na webových stránkách GO, kde je lze přímo stáhnout nebo zobrazit online pomocí AmiGO.[9] Kromě identifikátoru genového produktu a příslušného výrazu GO mají poznámky GO alespoň následující údaje: odkaz slouží k vytvoření anotace (např. článek v deníku); An důkazní kód označení typu důkazu, na kterém je anotace založena; Datum a tvůrce anotace
Do anotace GO mohou být zahrnuty také podpůrné informace, v závislosti na použitých termínech GO a použitých důkazech, a doplňující informace, například podmínky, za kterých je funkce sledována.
Evidenční kód pochází z řízená slovní zásoba kódů, Ontology Evidence Code, zahrnující manuální i automatizované metody anotací.[10] Například, Návazné prohlášení autora (TAS) znamená, že kurátor přečetl publikovanou vědeckou práci a metadata pro tuto anotaci jsou citována k této práci; Vyvozeno z podobnosti sekvence (ISS) znamená, že lidský kurátor zkontroloval výstup z hledání podobnosti sekvence a ověřil, že je biologicky smysluplný. Anotace z automatizovaných procesů (například přemapování anotací vytvořených pomocí jiného slovníku anotací) dostanou kód Odvozeno z elektronické anotace (IEA). V roce 2010 bylo více než 98% všech anotací GO odvozeno výpočetně, nikoli kurátory, ale od 2. července 2019 bylo výpočetně odvozeno pouze asi 30% všech anotací GO.[11][12]Jelikož tyto anotace nejsou kontrolovány člověkem, považuje je Konsorcium GO za okrajově méně spolehlivé a jsou obvykle na vyšší úrovni a méně podrobné. Úplné datové sady anotací lze stáhnout z webu GO. Na podporu vývoje anotací pořádá GO Consortium workshopy a mentoruje nové skupiny kurátorů a vývojářů.
Mnoho strojové učení byly navrženy a implementovány algoritmy pro predikci anotací genové ontologie.[13][14]
Příklad anotace
- Genový produkt: aktin, alfa srdeční sval 1, UniProtKB: P68032
- GO termín: kontrakce srdce; GO: 0060047 (biologický proces)
- Evidenční kód: odvozeno z mutantního fenotypu (IMP)
- Odkaz: PMID 17611253
- Přiřazeno: UniProtKB, 6. června 2008
Zdroj dat:[15]
Nástroje
K dispozici je velké množství nástrojů[16] online i ke stažení, které využívají údaje poskytnuté projektem GO. Drtivá většina z nich pochází od třetích stran; konsorcium GO vyvíjí a podporuje dva nástroje, AmiGO a OBO-Edit.
AmiGO[17][9] je webová aplikace, která umožňuje uživatelům dotazovat se, procházet a vizualizovat ontologie a data anotací genových produktů. Má také a VÝBUCH nářadí,[18] nástroje umožňující analýzu větších souborů dat,[19][20] a rozhraní pro přímý dotaz na databázi GO.[21]
AmiGO lze použít online na webových stránkách GO pro přístup k údajům poskytnutým konsorciem GO, nebo si jej lze stáhnout a nainstalovat pro místní použití v jakékoli databázi využívající schéma databáze GO (např.[22]). Je to zdarma open source software a je k dispozici jako součást distribuce softwaru go-dev.[23]
OBO-Edit[24] je open source, na platformě nezávislý ontologický editor vyvinutý a udržovaný Gene Ontology Consortium. Je implementován v Jáva a používá a graficky orientovaný přístup k zobrazování a úpravám ontologií. OBO-Edit obsahuje komplexní rozhraní pro vyhledávání a filtrování s možností vykreslení podmnožin výrazů, aby byly vizuálně odlišné; uživatelské rozhraní lze také přizpůsobit podle preferencí uživatele. OBO-Edit má také uvažovatel které mohou na základě existujících vztahů a jejich vlastností odvodit odkazy, které nebyly výslovně uvedeny. Ačkoli byl vyvinut pro biomedicínské ontologie, lze OBO-Edit použít k prohlížení, vyhledávání a úpravám jakékoli ontologie. Je volně k dispozici ke stažení.[23]
Konsorcium
Konsorcium pro genovou ontologii je soubor biologické databáze a výzkumné skupiny aktivně zapojené do projektu genové ontologie.[12] To zahrnuje řadu modelový organismus databáze a vícedruhové databáze proteinů, skupiny pro vývoj softwaru a specializovaná redakce.
Dějiny
Genová ontologie byla původně zkonstruována v roce 1998 konsorciem vědců studujících genomy ze tří modelové organismy: Drosophila melanogaster (ovocný let), Mus musculus (myš) a Saccharomyces cerevisiae (pivovarské nebo pekařské droždí).[25] Mnoho jiných Modelové databáze organizmů se připojili ke Gene Ontology Consortium a přispívají nejen daty anotací, ale také přispívají k vývoji ontologií a nástrojů pro prohlížení a používání dat. K tomuto projektu přispívá řada významných databází rostlin, živočichů a mikroorganismů.[7] Od července 2019 obsahuje GO 44 945 podmínek; existuje 6 408 283 anotací pro 4 467 různých biologických organismů.[7] Existuje značná část literatury o vývoji a používání GO a stala se standardním nástrojem v EU bioinformatika arzenál. Jejich cíle mají tři aspekty: budování genové ontologie, přiřazování ontologie genovým / genovým produktům a vývoj softwaru a databází pro první dva objekty.
Začíná se také objevovat několik analýz genové ontologie využívajících formální vlastnosti tříd nezávislé na doméně (metaproperties). Například ontologická analýza biologických ontologií viz.[26]
Viz také
- Blast2GO[27]
- Srovnávací databáze toxikogenomiky
- DAVID bioinformatika
- Interferome
- Národní centrum pro biomedicínskou ontologii
Reference
- ^ Konsorcium pro genovou ontologii (leden 2008). „Projekt genové ontologie v roce 2008“. Výzkum nukleových kyselin. 36 (Problém s databází): D440–4. doi:10.1093 / nar / gkm883. PMC 2238979. PMID 17984083.
- ^ Dessimoz, Christophe; Škunca, Nives, eds. (2017). Příručka pro genovou ontologii. Metody v molekulární biologii. 1446. doi:10.1007/978-1-4939-3743-1. ISBN 9781493937431. ISSN 1064-3745. S2CID 3708801.
- ^ Gaudet, Pascale; Škunca, Nives; Hu, James C .; Dessimoz, Christophe (2017). "Primer na genovou ontologii". Příručka pro genovou ontologii. Metody v molekulární biologii. 1446. s. 25–37. doi:10.1007/978-1-4939-3743-1_3. ISBN 978-1-4939-3741-7. ISSN 1064-3745. PMC 6377150. PMID 27812933.
- ^ Smith B, Ashburner M, Rosse C, Bard J, Bug W, Ceusters W, Goldberg LJ, Eilbeck K, Irsko A, Mungall CJ, Leontis N, Rocca-Serra P, Ruttenberg A, Sansone SA, Scheuermann RH, Shah N, Whetzel PL, Lewis S (listopad 2007). „Slévárna OBO: koordinovaný vývoj ontologií na podporu integrace biomedicínských dat“. Přírodní biotechnologie. 25 (11): 1251–5. doi:10.1038 / nbt1346. PMC 2814061. PMID 17989687.
- ^ Lovering, Ruth C. (2017). "Jak přispívá vědecká komunita k genové ontologii?". V Dessimozu, C; Skunca, N (eds.). Příručka pro genovou ontologii. Metody v molekulární biologii. 1446. Springer (New York). str. 85–93. doi:10.1007/978-1-4939-3743-1_7. ISBN 978-1-4939-3741-7. ISSN 1064-3745. PMID 27812937.
- ^ Diehl AD, Lee JA, Scheuermann RH, Blake JA (Duben 2007). „Vývoj ontologie pro biologické systémy: imunologie“. Bioinformatika. 23 (7): 913–5. doi:10.1093 / bioinformatika / btm029. PMID 17267433.
- ^ A b C „Zdroj genové ontologie“. Konsorcium pro genovou ontologii.
- ^ Sjcarbon, Gene Ontology Consortium Wiki (10.7.2013). „AmiGO_2_Manual: term_Page“ (html).
- ^ A b AmiGO - aktuální oficiální webová sada nástrojů pro vyhledávání a procházení databáze genové ontologie
- ^ „Evidence kódu ontologie“. Ontologie evidenčního kódu.
- ^ du Plessis L, Skunca N, Dessimoz C (listopad 2011). „Co, kde, jak a proč genová ontologie - základ pro bioinformatiky“. Briefings in Bioinformatics. 12 (6): 723–35. doi:10.1093 / bib / bbr002. PMC 3220872. PMID 21330331.
- ^ A b „Konsorcium GO“. Citováno 2009-03-16.
- ^ Pinoli P, Chicco D, Masseroli M (červen 2013). „Výpočtové algoritmy pro predikci anotace genové ontologie“. BMC bioinformatika. 16 (6): S4. doi:10.1186 / 1471-2105-16-S6-S4. PMC 4416163. PMID 25916950.
- ^ Cozzetto, Domenico; Jones, David T. (2017). Msgstr "Výpočetní metody pro převody anotací ze sekvence". V Dessimozu, C; Skunca, N (eds.). Příručka pro genovou ontologii. Metody v molekulární biologii. 1446. Springer (New York). str. 55–67. doi:10.1007/978-1-4939-3743-1_5. ISBN 978-1-4939-3741-7. ISSN 1064-3745. PMID 27812935.
- ^ Konsorcium GO (2009-03-16). „AmiGO: P68032 Associations“.
- ^ Mosquera JL, Sánchez-Pla A (červenec 2008). „SerbGO: hledání nejlepšího nástroje GO“. Výzkum nukleových kyselin. 36 (Problém s webovým serverem): W368–71. doi:10.1093 / nar / gkn256. PMC 2447766. PMID 18480123.
- ^ Carbon S, Irsko A, Mungall CJ, Shu S, Marshall B, Lewis S (leden 2009). AmiGO Hub; Pracovní skupina pro webovou přítomnost. „AmiGO: online přístup k datům ontologií a anotací“. Bioinformatika. 25 (2): 288–9. doi:10.1093 / bioinformatika / btn615. PMC 2639003. PMID 19033274.
- ^ „Nástroj AmiGO BLAST“. Archivovány od originál dne 20.08.2011. Citováno 2009-03-13.
- ^ Nástroj AmiGO Term Enrichment Archivováno 2008-04-07 na Wayback Machine; najde významné sdílené termíny GO v sadě anotací
- ^ AmiGO Slimmer Archivováno 29. 09. 2011 na Wayback Machine; mapuje podrobné poznámky až k výrazům na vysoké úrovni
- ^ HUSA GO Online prostředí SQL; umožňuje přímé dotazování SQL na databázi GO
- ^ The Plant Ontology Consortium (2009-03-16). „Plant Ontology Consortium“. Citováno 2009-03-16.
- ^ A b „Stahování genové ontologie na SourceForge“. Citováno 2009-03-16.
- ^ Day-Richter J, Harris MA, Haendel M, Lewis S (Srpen 2007). „OBO-Edit - editor ontologie pro biology“. Bioinformatika. 23 (16): 2198–200. doi:10.1093 / bioinformatika / btm112. PMID 17545183.
- ^ Ashburner M, Ball CA, Blake JA, Botstein D, Butler H, Cherry JM, Davis AP, Dolinski K, Dwight SS, Eppig JT, Harris MA, Hill DP, Issel-Tarver L, Kasarskis A, Lewis S, Matese JC, Richardson JE, Ringwald M, Rubin GM , Sherlock G (květen 2000). "Genová ontologie: nástroj pro sjednocení biologie. The Gene Ontology Consortium". Genetika přírody. 25 (1): 25–9. doi:10.1038/75556. PMC 3037419. PMID 10802651.
- ^ Deb, B. (2012). „Ontologická analýza některých biologických ontologií“. Frontiers in Genetics. 3: 269. doi:10.3389 / fgene.2012.00269. PMC 3509948. PMID 23226158.
- ^ Götz S, García-Gómez JM, Terol J, Williams TD, Nagaraj SH, Nueda MJ, Robles M, Talón M, Dopazo J, Conesa A (červen 2008). „Vysoce výkonná funkční anotace a dolování dat pomocí sady Blast2GO“. Výzkum nukleových kyselin. 36 (10): 3420–35. doi:10.1093 / nar / gkn176. PMC 2425479. PMID 18445632.
externí odkazy
- AmiGO - aktuální oficiální webová sada nástrojů pro vyhledávání a procházení databáze genové ontologie
- Konsorcium pro genovou ontologii - oficiální stránka
- PlantRegMap - anotace GO pro 165 druhů rostlin a analýza obohacení GO
- SimCT - webový nástroj pro zobrazení vztahů mezi biologickými objekty anotovanými k ontologii ve formě shlukového stromu.
- SerbGO - nástroj GO k porovnání schopností různých programů s cílem ukázat jejich společné rysy a rozdíly a zjistit, které nástroje, pokud existují, mají některé specifické funkce vyžadované uživatelem pro analýzu GO.
- Genová ontologie zaměřená na doménu - databáze doménových ontologií o funkcích, fenotypech, nemocech a dalších.