Proteinová datová banka - Protein Data Bank
Obsah | |
---|---|
Popis | |
Kontakt | |
Primární citace | PMID 30357364 |
Přístup | |
Datový formát | mmCIF, PDB |
webová stránka |
The Proteinová datová banka (PDB)[1] je databáze pro trojrozměrná strukturní data velkých biologických molekul, jako je např bílkoviny a nukleové kyseliny. Data obvykle získaná uživatelem Rentgenová krystalografie, NMR spektroskopie nebo kryo-elektronová mikroskopie a předložil biologové a biochemici z celého světa, jsou volně přístupné na internetu prostřednictvím webových stránek jejích členských organizací (PDBe,[2] PDBj,[3] RCSB,[4] a BMRB[5]). Na PNR dohlíží organizace zvaná Celosvětová proteinová banka, wwPDB.
PNR je klíčem v oblastech EU strukturní biologie, jako strukturní genomika. Většina významných vědeckých časopisů a některé finanční agentury nyní vyžadují, aby vědci předkládali údaje o své struktuře do PNR. Mnoho dalších databází používá proteinové struktury uložené v PDB. Například, SCOP a KOCOUR klasifikovat proteinové struktury, zatímco PDBsum poskytuje grafický přehled položek PDB pomocí informací z jiných zdrojů, jako je Genová ontologie.[6][7]
Dějiny
Ke spuštění PDB se sblížily dvě síly: malá, ale rostoucí sbírka souborů dat o struktuře proteinů určená rentgenovou difrakcí; a nově dostupný (1968) displej s molekulární grafikou, Brookhaven RAster displej (BRAD), k vizualizaci těchto proteinových struktur ve 3D. V roce 1969, za sponzorství Waltera Hamiltona na Brookhaven National Laboratory, Edgar Meyer (Texas A&M University ) začal psát software pro ukládání souborů atomových souřadnic v běžném formátu, aby byly k dispozici pro geometrické a grafické vyhodnocení. Do roku 1971 umožnil jeden z Meyerových programů SEARCH vědcům vzdálený přístup k informacím z databáze ke studiu proteinových struktur offline.[8] SEARCH pomohl při vytváření sítí, což znamenalo funkční začátek PNR.
Proteinová datová banka byla vyhlášena v říjnu 1971 v roce Příroda nová biologie[9] jako společný podnik mezi Cambridge krystalografické datové centrum, Velká Británie a Brookhaven National Laboratory, USA.
Po Hamiltonově smrti v roce 1973 převzal vedení PDB na následujících 20 let Tom Koeztle. V lednu 1994 Joel Sussman izraelských Weizmann Institute of Science byl jmenován vedoucím PNR. V říjnu 1998[10]PDB byl převeden do Research Collaboratory for Structural Bioinformatics (RCSB);[11] převod byl dokončen v červnu 1999. Novým ředitelem byl Helen M. Berman z Rutgersova univerzita (jedna z řídících institucí RCSB, druhá je San Diego Superpočítačové centrum na UC San Diego ).[12] V roce 2003, s vytvořením wwPDB, se PDB stala mezinárodní organizací. Zakládajícími členy jsou PDBe (Evropa),[2] RCSB (USA) a PDBj (Japonsko).[3] The BMRB[5] připojil se v roce 2006. Každý ze čtyř členů wwPDB může fungovat jako depoziční, zpracovatelská a distribuční centra pro data PDB. Zpracování údajů se týká skutečnosti, že pracovníci wwPDB každý odeslaný záznam kontrolují a anotují.[13] Data se poté automaticky kontrolují na hodnověrnost (zdrojový kód[14] pro tuto validaci byl software bezplatně zpřístupněn veřejnosti).
Obsah
Databáze PDB se aktualizuje každý týden (UTC +0 středa), spolu s seznamem fondů.[16] Ke dni 1. dubna 2020[Aktualizace], PDB zahrnoval:
Experimentální Metoda | Proteiny | Nukleové kyseliny | Protein / nukleová kyselina komplexy | jiný | Celkový |
---|---|---|---|---|---|
Rentgenová difrakce | 135170 | 2097 | 6945 | 4 | 144216 |
NMR | 11337 | 1325 | 264 | 8 | 12934 |
Elektronová mikroskopie | 3475 | 35 | 1136 | 0 | 4646 |
Hybridní | 155 | 5 | 3 | 1 | 164 |
jiný | 286 | 4 | 6 | 13 | 309 |
Celkový: | 150423 | 3466 | 8354 | 26 | 162269 |
- 134 146 struktur v PNR má a strukturní faktor soubor.
- 10 289 struktur má soubor omezení NMR.
- 4 814 struktur v PNR má a chemické směny soubor.
- 4 718 struktur v PDB má a 3DEM mapový soubor uložený v EM datová banka
Většina struktur je určena rentgenovou difrakcí, ale přibližně 10% struktur je určeno pomocí proteinová NMR. Při použití rentgenové difrakce se získají aproximace souřadnic atomů proteinu, zatímco pomocí NMR se odhaduje vzdálenost mezi páry atomů proteinu. Konečná konformace proteinu se získá z NMR řešením a geometrie vzdálenosti problém. Po roce 2013 určuje rostoucí počet proteinů kryo-elektronová mikroskopie. Kliknutím na čísla v propojené externí tabulce se zobrazí příklady struktur určených touto metodou.
U struktur PDB určených rentgenovou difrakcí, které mají soubor strukturních faktorů, lze zobrazit jejich mapu hustoty elektronů. Data těchto struktur jsou uložena na „serveru elektronové hustoty“.[17][18]
Historicky počet struktur v PNR rostl přibližně exponenciálním tempem, se 100 registrovanými strukturami v roce 1982, 1000 strukturami v roce 1993, 10 000 v roce 1999 a 100 000 v roce 2014.[19][20] Od roku 2007 se zdá, že se rychlost akumulace nových proteinových struktur ustálila.[je zapotřebí objasnění ]
Formát souboru
Formát souboru původně používaný PDB byl nazýván formát souboru PDB. Původní formát byl omezen šířkou počítačové děrovací karty na 80 znaků na řádek. Kolem roku 1996 se formát „makromolekulární krystalografické informace“, mmCIF, což je rozšíření Formát CIF byl zaveden. mmCIF se v roce 2014 stal standardním formátem pro archiv PDB.[21] V roce 2019 wwPDB oznámila, že depozice pro krystalografické metody budou přijímány pouze ve formátu mmCIF.[22]
An XML verze PDB s názvem PDBML byla popsána v roce 2005.[23]Soubory struktur lze stáhnout v kterémkoli z těchto tří formátů, i když rostoucí počet struktur neodpovídá staršímu formátu PDB. Jednotlivé soubory lze snadno stáhnout do grafických balíčků z Internetu URL:
- U souborů ve formátu PDB použijte např.
http://www.pdb.org/pdb/files/4hhb.pdb.gz
nebohttp://pdbe.org/download/4hhb
- U souborů PDBML (XML) použijte např.
http://www.pdb.org/pdb/files/4hhb.xml.gz
nebohttp://pdbe.org/pdbml/4hhb
„4 hhb
„je identifikátor PDB. Každá struktura publikovaná v PDB přijímá čtyřmístný alfanumerický identifikátor, jeho PDB ID. (Toto není jedinečný identifikátor pro biomolekuly, protože může být obsaženo několik struktur pro stejnou molekulu - v různých prostředích nebo konformacích. v PDB s různými ID PDB.)
Prohlížení dat
Soubory struktury lze prohlížet pomocí jednoho z několik bezplatných a otevřených počítačových programů, počítaje v to Jmol, Pymol, VMD, a Rasmol. Jiné nesvobodné, shareware programy zahrnují ICM-Browser,[24] Zvonkohra MDL, UCSF Chimera Prohlížeč Swiss-PDB,[25] StarBiochem[26] (interaktivní molekulární prohlížeč založený na Javě s integrovaným vyhledáváním proteinové databanky), Sírius a VisProt3DS[27] (nástroj pro vizualizaci proteinů ve 3D stereoskopickém zobrazení v anaglythu a dalších režimech) a Discovery Studio. Web RCSB PDB obsahuje rozsáhlý seznam bezplatných i komerčních vizualizačních programů molekul a pluginů webového prohlížeče.
Viz také
- Krystalografická databáze
- Struktura bílkovin
- Predikce struktury proteinů
- Databáze struktury proteinů
- PDBREPORT vypíše všechny anomálie (také chyby) ve strukturách PDB
- PDBsum —Extrahuje data z jiných databází o strukturách PDB
- Proteopedia —Kooperativní 3D encyklopedie proteinů a dalších molekul
Reference
- ^ wwPDB, Consortium (2019). „Protein Data Bank: the single global archive for 3D macromolecular structure data“. Nucleic Acids Res. 47 (D1): 520–528. doi:10.1093 / nar / gky949. PMC 6324056. PMID 30357364.
- ^ A b "PDBe home
. pdbe.org. - ^ A b „Protein Data Bank Japan - PDB Japan - PDBj“. pdbj.org.
- ^ Banka, údaje o proteinech RCSB. „RCSB PDB: Homepage“. rcsb.org.
- ^ A b „Banka biologické magnetické rezonance“. bmrb.wisc.edu.
- ^ Berman, H. M. (leden 2008). „Proteinová datová banka: historická perspektiva“ (PDF). Acta Crystallographica oddíl A. A64 (1): 88–95. doi:10.1107 / S0108767307035623. PMID 18156675.
- ^ Laskowski RA, Hutchinson EG, Michie AD, Wallace AC, Jones ML, Thornton JM (prosinec 1997). "PDBsum: webová databáze shrnutí a analýz všech struktur PDB". Trends Biochem. Sci. 22 (12): 488–90. doi:10.1016 / S0968-0004 (97) 01140-7. PMID 9433130.
- ^ Meyer EF (1997). „První roky Protein Data Bank“. Věda o bílkovinách. Cambridge University Press. 6 (7): 1591–1597. doi:10.1002 / pro.5560060724. PMC 2143743. PMID 9232661.
- ^ "Proteinová datová banka". Příroda nová biologie. 1971. doi:10.1038 / newbio233223b0.
- ^ Berman HM, Westbrook J, Feng Z, Gilliland G, Bhat TN, Weissig H, Shindyalov IN, Bourne PE (leden 2000). "Proteinová datová banka". Nucleic Acids Res. 28 (1): 235–242. doi:10.1093 / nar / 28.1.235. PMC 102472. PMID 10592235.
- ^ „Research Collaboratory for Structural Bioinformatics“. RCSB.org. Research Collaboratory for Structural Bioinformatics. Archivovány od originál dne 2007-02-05.
- ^ „Archiv zpravodaje RCSB PDB“. RCSB Proteinová datová banka.
- ^ Curry E, Freitas A, O'Riáin S (2010). „Úloha korekce dat řízených komunitou pro podniky“. V D. Wood (ed.). Propojení podnikových dat. Boston: Springer USA. s. 25–47. ISBN 978-1-441-97664-2.
- ^ „PDB Validation Suite“. sw-tools.pdb.org.
- ^ Burley SK, Berman HM, Bhikadiya C, Bi C, Chen L, Costanzo LD a kol. (konsorcium wwPDB) (leden 2019). „Protein Data Bank: the single global archive for 3D macromolecular structure data“. Výzkum nukleových kyselin. 47 (D1): D520 – D528. doi:10.1093 / nar / gky949. PMC 6324056. PMID 30357364.
- ^ „Rozpis současných pozic PDB“. RCSB.
- ^ „Server Uppsala Electron Density Server“. Univerzita v Uppsale. Citováno 2013-04-06.
- ^ Kleywegt GJ, Harris MR, Zou JY, Taylor TC, Wählby A, Jones TA (prosinec 2004). „Server elektronové hustoty Uppsala“. Acta Crystallogr D. 60 (Pt 12 Pt 1): 2240–2249. doi:10.1107 / S0907444904013253. PMID 15572777.
- ^ Anon (2014). „Tvrdá data: Pro Protein Data Bank nebyl žádný malý výkon zůstat relevantní pro 100 000 struktur“. Příroda. 509 (7500): 260. doi:10.1038 / 509260a. PMID 24834514.
- ^ „Zpráva o růstu obsahu“. RCSB PDB. Archivovány od originál dne 2007-04-28. Citováno 2013-04-06.
- ^ "wwPDB: Formáty souborů a PDB". wwpdb.org. Citováno 1. dubna 2020.
- ^ wwPDB.org. "wwPDB: Novinky 2019". wwpdb.org.
- ^ Westbrook J, Ito N, Nakamura H, Henrick K, Berman HM (duben 2005). "PDBML: reprezentace archivních dat makromolekulární struktury v XML" (PDF). Bioinformatika. 21 (7): 988–992. doi:10.1093 / bioinformatika / bti082. PMID 15509603.
- ^ „ICM-Browser“. Molsoft L.L.C.. Citováno 2013-04-06.
- ^ „Švýcarský prohlížeč PDB“. Švýcarský institut pro bioinformatiku. Citováno 2013-04-06.
- ^ „STAR: Biochem - Home“. web.mit.edu.
- ^ „VisProt3DS“. Molecular Systems Ltd.. Citováno 2013-04-06.
externí odkazy
- Worldwide Protein Data Bank (wwPDB) —Nadřazený web pro regionální hostitele (níže)
- RCSB Proteinová datová banka (USA)
- PDBe (Evropa)
- PDBj (Japonsko)
- BMRB, banka biologických magnetických rezonancí (USA)
- Dokumentace wwPDB —Dokumentace ve formátech souborů PDB i PDBML
- Pohled na struktury —Úvod RCSB do krystalografie
- Domovská stránka PDBsum —Extrahuje data z jiných databází o strukturách PDB.
- Databáze nukleových kyselin, NDB —Zrcadlo PDB zejména pro vyhledávání nukleových kyselin
- Úvodní výukový program PDB sponzorovaný PDB
- PDBe: Rychlá prohlídka vlakem EBI OnLine