Proteinová datová banka (formát souboru) - Protein Data Bank (file format)
Přípona názvu souboru | .pdb, .ent, .brk |
---|---|
Typ internetového média | chemická látka / x-pdb |
Typ formátu | formát chemického souboru |
The Formát souboru Protein Data Bank (pdb) je textový formát souboru popisující trojrozměrné struktury molekul držených v Proteinová datová banka. Formát pdb odpovídajícím způsobem poskytuje popis a anotaci struktur proteinů a nukleových kyselin, včetně atomových souřadnic, přiřazení sekundárních struktur a také atomové konektivity. Kromě toho jsou uložena experimentální metadata. Formát PDB je starší formát souboru pro Proteinová datová banka který nyní uchovává data o biologických makromolekulách v novějších mmCIF formát souboru.
Dějiny
Formát souboru PDB byl vynalezen v roce 1976 jako soubor čitelný člověkem, který vědcům umožňuje výměnu proteinových souřadnic prostřednictvím databázového systému. Formát šířky pevného sloupce je omezen na 80 sloupců, což bylo založeno na šířce děrovacích karet počítače, které byly dříve použity k výměně souřadnic.[1] V průběhu let prošel formát souborů mnoha změnami a revizemi. Ke dni 13. července 2011[Aktualizace], nejnovější revize je 3.30.[2]
Příklad
Typický soubor PDB popisující protein se skládá ze stovek až tisíců řádků, jako je tento (převzato ze souboru popisujícího strukturu syntetického peptid podobný kolagenu ):
HEADER EXTRACELLULAR MATRIX 22-JAN-98 1A3ITITLE X-RAY CRYSTALLOGRAPHIC STANOVENÍ KOLAGENU-LIKETITLE 2 PEPTIDU S OPAKUJÍCÍ SEKVENCÍ (PRO-PRO-GLY) ... EXPDTA X-RAY DIFFRACTIONAUTHOR RZKRAM , R.BERISIO, L.MAZZARELLA, AUTOR 2 B.BRODSKY, A.ZAGARI, HMBERMAN ... POZNÁMKA 350 BIOMOLEKULA: 1 POZNÁMKA 350 POUŽIJTE NÁSLEDUJÍCÍ NA ŘETĚZY: A, B, CREMARK 350 BIOMT1 1 1,000000 0,000000 0,000000 0,00000POZNÁMKA 350 BIOMT2 1 0,000000 1,000000 0,000000 0,00000 ... SEQRES 1 A 9 PRO PRO GLY PRO PRO GLY PRO PRO GLYSEQRES 1 B 6 PRO PRO GLY PRO PRO GLYSEQRES 1 C 6 PRO PRO GLY PRO PRO GLY ... ATOM 1 N PRO A 1 8,316 21.206 21,530 1,00 17,44 NATOM 2 CA PRO A 1 7,608 20,729 20,336 1,00 17,44 CATOM 3 C PRO A 1 8,487 20,707 19,092 1,00 17,44 CATOM 4 O PRO A 1 9,466 21,457 19,005 1,00 17,44 OATOM 5 CB PRO A 1 6,460 21,723 20,211 1,00 22,26 C ... HETATM 130 C ACY 401 3,682 22,541 11,236 1,00 21,19 CHETATM 131 O ACY 401 2,807 23,097 10,553 1,00 21,19 OHETATM 132 OXT ACY 401 4,306 23,101 12,291 1,00 21,19 O ...
- Záznamy HEADER, TITLE a AUTHOR
- poskytovat informace o vědcích, kteří definovali strukturu; k dispozici je řada dalších typů záznamů, které poskytují další typy informací.
- POZNÁMKA:
- mohou obsahovat anotace ve volném formátu, ale také obsahují standardizované informace; například
POZNÁMKA 350 BIOMTU
záznamy popisují, jak vypočítat souřadnice experimentálně pozorovaného multimeru z výslovně specifikovaných souřadnic jedné opakující se jednotky. - SEQRES záznamů
- dát sekvence tří peptidových řetězců (pojmenovaných A, B a C), které jsou v tomto příkladu velmi krátké, ale obvykle pokrývají více linií.
- Záznamy ATOM
- popsat souřadnice atomů, které jsou součástí proteinu. Například první linie ATOM výše popisuje alfa-N atom prvního zbytku peptidového řetězce A, kterým je prolinový zbytek; první tři čísla s plovoucí desetinnou čárkou jsou její souřadnice x, yaz a jsou v jednotkách Ångströms.[3] Další tři sloupce jsou obsazenost, teplotní faktor a název prvku.
- Záznamy HETATM
- popsat souřadnice heteroatomů, tj. atomů, které nejsou součástí molekuly proteinu.
Software pro molekulární vizualizaci schopný zobrazovat soubory PDB
Viz také
- Formát chemických souborů
- ScientificPython - poskytuje rozhraní pro Krajta
- Software pro modelování molekulární mechaniky
Reference
- ^ Berman, Helen M. „Databáze proteinových dat: historická perspektiva.“ Acta Crystallographica oddíl A 64.1 (2007): 88-95.
- ^ „Atomic Coordinate Entry Format Version 3.3“. wwPDB. Červenec 2011.
- ^ „Formát wwPDB verze 3.3: Souřadnicová sekce“. Archivovány od originál dne 2012-02-28. Citováno 2012-03-23.
externí odkazy
- Průvodce formátováním PDB Toto je aktuální verze (3.3) specifikace formátu PDB.
- PDBML Novější alternativní formát souboru založený na XML pro molekulární souřadnice.
- Proteinová datová banka RCSB
- Proteinová datová banka v Evropě
- Molekulární modelování DataBase (MMDB) z NCBI
- Projekt sanace wwPDB z wwPDB
- MakeMultimer Online nástroj pro rozšiřování záznamů BIOMT v souborech pdb
- Molekuly Aplikace iPad / iPhone pro zobrazení souborů PDB
- Makromolekulární knihovna Pythonu (mmLib) - a Krajta knihovna schopná číst a zapisovat do formátů souborů PDB