CATH databáze - CATH database
Obsah | |
---|---|
Popis | Klasifikace struktury proteinů |
Kontakt | |
Výzkumné centrum | University College v Londýně |
Laboratoř | Ústav strukturní a molekulární biologie |
Primární citace | Dawson a kol. (2016) [1] |
Datum vydání | 1997 |
Přístup | |
webová stránka | katdb |
Stáhnout URL | katdb |
Smíšený | |
Uvolnění dat frekvence | CATH-B je vydáván denně. Oficiální vydání jsou přibližně roční. |
Verze | 4.1 |
The Databáze klasifikace proteinových struktur CATH je bezplatný, veřejně dostupný online zdroj, který poskytuje informace o evolučních vztazích proteinové domény. To bylo vytvořeno v polovině 90. let profesorem Christine Orengo a kolegové včetně Janet Thornton a David Jones,[2] a nadále je vyvíjí skupina Orengo v University College v Londýně. CATH sdílí mnoho širokých funkcí s SCOP zdroje, existuje však také mnoho oblastí, ve kterých se podrobná klasifikace velmi liší.[3][4][5][6]
Hierarchická organizace
Experimentálně určené proteinové trojrozměrné struktury jsou získány z Proteinová datová banka a rozdělit se na sebe polypeptidové řetězce, kde je to relevantní. Proteinové domény jsou v těchto řetězcích identifikovány pomocí směsi automatických metod a manuální léčby.
Domény jsou poté klasifikovány v rámci strukturální hierarchie CATH: na úrovni třídy (C) jsou domény přiřazeny podle jejich sekundární struktura obsah, tj. vše alfa, Všechno beta směs alfa a beta nebo malá sekundární struktura; na úrovni architektury (A) se pro přiřazení používají informace o uspořádání sekundární struktury v trojrozměrném prostoru; na úrovni topologie / skládání (T) se používají informace o tom, jak jsou připojeny a uspořádány prvky sekundární struktury; přiřazení se provádí na Homologní nadčeleď (H) úroveň, pokud existují dobré důkazy o tom, že domény jsou spojeny vývojem [2] tj. jsou homologní.
# | Úroveň | Popis |
---|---|---|
1 | Cděvče | celkový obsah sekundární struktury domény. (Ekvivalent k SCOP Třída ) |
2 | Architecture | vysoká strukturální podobnost, ale žádný důkaz homologie. (Odpovídá úrovni skládání v SCOP) |
3 | Topologie / složit | rozsáhlé seskupení topologií, které sdílejí konkrétní strukturální rysy |
4 | Homologní nadčeleď | svědčící o prokazatelném evolučním vztahu. (Ekvivalent SCOP nadčeleď ) |
Další sekvenční data pro domény bez experimentálně určených struktur poskytuje sesterský zdroj CATH, Gene3D, který se používá k naplnění homologních superrodin. Proteinové sekvence z UniProtKB a Ensembl jsou skenovány proti CATH HMM, aby se předpověděly hranice sekvencí domén a provedla homologní přiřazení superrodiny.
Zprávy
Tým CATH má za cíl poskytovat oficiální vydání klasifikace CATH každých 12 měsíců. Tento proces vydání je důležitý, protože umožňuje zajištění interní validace, dalších anotací a analýzy. Může to však znamenat, že mezi novými strukturami objevujícími se v PDB a nejnovějším oficiálním vydáním CATH existuje časové zpoždění,
Za účelem řešení tohoto problému: CATH-B poskytuje omezené množství informací k nejnovějším anotacím domény (např. Hranice domén a klasifikace superrodin).
Poslední vydání CATH-Gene3D (v4.1) bylo vydáno v červenci 2016 a skládá se z:
- 308 999 položek strukturálních proteinových domén [1]
- 53 479 436 položek strukturální proteinové domény [1]
- 2737 homologních záznamů nadrodiny [1]
- 92 882 funkčních záznamů rodiny [1]
Software s otevřeným zdrojovým kódem
CATH je open source software projekt s vývojáři vyvíjejícími a udržujícími řadu nástrojů otevřeného zdroje.[7] CATH udržuje seznam úkolů GitHub umožnit externím uživatelům vytvářet a sledovat problémy týkající se klasifikace proteinové struktury CATH.
Reference
- ^ A b C d E Dawson, NL; Lewis, TE; Das, S; Lees, JG; Lee, D; Ashford, P; Orengo, CA; Sillitoe, I (28. listopadu 2016). „CATH: rozšířený zdroj pro predikci funkce proteinu prostřednictvím struktury a sekvence“. Výzkum nukleových kyselin. 45 (D1): D289 – D295. doi:10.1093 / nar / gkw1098. PMC 5210570. PMID 27899584.
- ^ A b Orengo, CA; Michie, AD; Jones, S; Jones, DT; Swindells, MB; Thornton, JM (1997). "CATH - hierarchická klasifikace struktur proteinových domén". Struktura. 5 (8): 1093–1109. doi:10.1016 / S0969-2126 (97) 00260-8. ISSN 0969-2126. PMID 9309224.
- ^ „CATH: Databáze klasifikace proteinových struktur na UCL“. Cathdb.info. Citováno 9. března 2017.
- ^ „KOCOUR“. Cathdb.info. Citováno 9. března 2017.
- ^ „CATH Database (@CATHDatabase)“. Cvrlikání. Citováno 9. března 2017.
- ^ Pearl, F. M. G. (2003). „Databáze CATH: rozšířený zdroj proteinové rodiny pro strukturální a funkční genomiku“. Výzkum nukleových kyselin. 31 (1): 452–455. doi:10.1093 / nar / gkg062. ISSN 1362-4962. PMC 165509. PMID 12520050.
- ^ "Nástroje". cathdb.info. Citováno 18. prosince 2016.