CS23D - CS23D


CS23D je webový server pro generování 3D strukturálních modelů z NMR chemických posunů.[1] CS23D kombinuje maximální sestavu fragmentu s chemickým posunem závitů, de novo generování struktury, predikce torzního úhlu založená na chemickém posunu a upřesnění chemického posunu. CS23D využívá RefDB a ShiftX.
Vstupní formáty CS23D
CS23D přijímá soubory chemických posunů ve formátech SHIFTY nebo BMRB.
Možnosti CS23D
Uživatel může
- Vyloučte, aby se protein používal jako šablona
- V seznamu dostupných šablon ignorujte homology vysoké identity
- Změňte počet modelů ve finálním souboru
- Změňte počet kroků optimalizace modelu
Výstup CS23D
Výstup CS23D se skládá ze sady 10 souřadnic PDB s nejlepším skóre. K dispozici je také hypertextový odkaz na strukturu nejlepšího skóre. Zobrazí se celkové skóre CS23D, skóre založené na znalostech, skóre chemického posunu, statistika Ramachandranova grafu, korelace mezi pozorovanými a vypočítanými posuny před a po upřesnění. Uživatel získá závěr o spolehlivosti struktury.
Protokol CS23D
Hledání homologie: Dotazová sekvence se používá k nalezení homologních proteinů nebo / a proteinových fragmentů v neredundantní databázi PDB sekvencí a sekundárních struktur PPT-DB pomocí VÝBUCH.
Homologické modelování: Homologické modelování provádí program Homodeller, který je součástí programu PROTEUS2.[2] Proteiny, které jsou identifikovány během kroku hledání homologie, se používají jako šablony v modelování homologie.
Chemická změna reference: Chemické posuny jsou znovu odkazovány RefCorem,[3] který je součástí backendu webového serveru RCI.
Predikce sekundární struktury z chemických posunů: Sekundární struktura je předpovídána z chemických posunů pomocí CSI.
Predikce torzního úhlu z chemických posunů: Torzní úhly předpovídá z chemických posunů PREDITOR.[4]
Chemické posunování závitů: Torzní úhly páteře Phi a Psi předpovězené z chemických posunů PREDITOREM[4] jsou mapovány do devíti různých oblastí v prostoru Ramachandranu, přičemž každé z nich jsou přiřazena konkrétní písmena. Protein může být představován sekvencí těchto devíti „písmen torzního úhlu“. Thrifty používá tyto sekvence písmen torzního úhlu k identifikaci dobrých šablon v databázi ~ 18 500 neredundantních struktur PDB, u nichž byly jejich struktury převedeny na devítipísmennou „abecedu“ Ramachandran.
Podobným způsobem se navlékání chemických posunů provádí také pomocí třípísmenné abecedy sekundární struktury (H pro šroubovice, B pro beta řetězec, C pro cívku) a sekundární struktury předpovězené z chemických posunů programem CSI.
Sestava modelu:Subfragmenty identifikované homologním modelováním a kroky chemického posunu závitů jsou sestaveny do počátečních 3D modelů pomocí CS23D SFassembler (SubFragment assembler). Počáteční modely se vyhodnocují pomocí skórovací funkce GAFolder (viz níže) a nejlepší model se dále vylepšuje pomocí GAFolder (viz další informace o GAFolder níže).
Skládání Ab initio: Ab initio skládání provádí Rosetta[5] když nebyla pomocí kroků homologie modelování a chemického posunu závitů identifikována žádná šablona. Modely Rosetta jsou hodnoceny pomocí funkce skórování GAFolder a nejlepší modely Rosetta jsou vylepšeny pomocí GAFolder (viz níže).
Optimalizace modelu: Optimalizace modelu v CS23D se provádí pomocí minimalizátoru GAfolder založeného na torzním úhlu (složka Genetic Algorithm), který používá genetický algoritmus k vzorkování konformačního prostoru. Metoda je podobná té, kterou používá GENFOLD.[5] GAFolder provádí pohyby torzních úhlů v rozmezí definovaném hodnotami a nejistotami torzních úhlů předpovězených PREDITOREM.[4] GAFolder hodnotí proteinové modely pomocí skórovací funkce popsané níže.
Funkce bodování: Funkce skórování GAFolderu se skládá ze skóre založených na znalostech a skóre chemického posunu.
Skóre založené na znalostech zahrnout:
- poloměr gyračního skóre,
- energie vodíkové vazby,
- počet vodíkových vazeb,
- skóre špatných kontaktů,
- skóre disulfidové vazby,
- upravená energie vláken na základě Bryantova a Lawrencova potenciálu.[6]
- Ramachandranovo skóre, které hodnotí normalitu torzních úhlů modelu Phi a Psi
- Omega skóre, které hodnotí normálnost torzních omega úhlů modelu
- Skóre Chi, které je založeno na očekávaných úhlech chi pro různé kombinace phi a psi.
Složka chemického posunu funkce bodování GAfolder používá:
- vážené koeficienty korelace mezi experimentálními chemickými posuny (CA, CB, CO, N, HA, HN) a chemickými posuny vypočítanými pomocí SHIFTX 1.0.
- shoda mezi modelovou sekundární strukturou a sekundární strukturou predikovanou CSI z experimentálních chemických posunů.
Podprogramy CS23D
- CSI - predikce sekundární struktury z chemických posunů
- BLAST - zarovnání sekvence, hledání homologie
- PROTEUS2 - modelování homologie[2]
- PREDITOR - predikce torzních úhlů z chemických posunů[4]
- Pepmake - stavba proteinových modelů z torzních úhlů a sekvence
- PPT-DB - databáze sekundární struktury
- Rosetta - ab initio generování struktury[5]
- RCI - odhad nejistoty torzních úhlů předpovězených z chemických posunů PREDITOREM
- ShiftX 1.0 - se používá ke generování koeficientů korelace mezi pozorovanými chemickými posuny a posuny předpovídanými ShiftX z proteinových modelů
- SFAssembler - maximální sestava fragmentu
- GAFolder - zdokonalení chemického posunu pomocí genetického algoritmu
- Thrifty - závitování chemickým posunem
- RefCor - opětovné odkazování na chemický posun
Závislost CS23D na identitě sekvence šablony
CS23D je metoda založená na šabloně. Proto jeho výkon závisí na sekvenční identitě vybraných šablon, viz sousední obrázek. Podobně je Rosetta metodou zaujatou fragmenty. Jeho výkon závisí na kvalitě vybraných fragmentů. Kvalita fragmentu, a tedy výkon Rosetty, lze zlepšit použitím chemických posunů během kroku výběru fragmentu (např. V protokolu CS-Rosetta). U strukturálního řešení, které není předpjaté strukturou šablony nebo strukturou fragmentu, je možné zvážit získání omezení vzdálenosti založených na NOE (8-10 na zbytek) a jejich použití s GeNMR program v jeho ab initio režimu.
Viz také
- Chemický posun
- NMR
- Spektroskopie nukleární magnetické rezonance
- Proteinová nukleární magnetická rezonanční spektroskopie
- Dynamika proteinů # Domény a flexibilita proteinů
- Protein
- GeNMR
- Random Coil Index
- Predikce chemického posunu bílkovin
- Opětovné přiřazení proteinového chemického posunu
- Sekundární struktura bílkovin
- Index chemického posunu
- ShiftX
- Predikce struktury proteinů
Reference
- ^ Wishart DS, Arndt D, Berjanskii M, Tang P, Zhou J, Lin G (červenec 2008). „CS23D: webový server pro rychlé generování proteinové struktury pomocí NMR chemických posunů a sekvenčních dat“. Výzkum nukleových kyselin. 36 (Problém s webovým serverem): W496–502. doi:10.1093 / nar / gkn305. PMC 2447725. PMID 18515350.
- ^ A b Montgomerie S, Cruz JA, Shrivastava S, Arndt D, Berjanskii M, Wishart DS (červenec 2008). „PROTEUS2: webový server pro komplexní predikci struktury proteinů a strukturované anotace“. Výzkum nukleových kyselin. 36 (Problém s webovým serverem): W202–9. doi:10.1093 / nar / gkn255. PMC 2447806. PMID 18483082.
- ^ Berjanskii M, Wishart DS (2006). "NMR: predikce flexibility proteinů". Přírodní protokoly. 1 (2): 683–8. doi:10.1038 / nprot.2006.108. PMID 17406296.
- ^ A b C d Berjanskii MV, Neal S, Wishart DS (červenec 2006). „PREDITOR: webový server pro predikci omezení proteinového torzního úhlu“. Výzkum nukleových kyselin. 34 (Problém s webovým serverem): W63–9. doi:10.1093 / nar / gkl341. PMC 1538894. PMID 16845087.
- ^ A b C Rohl CA, Strauss CE, Misura KM, Baker D (2004). "Predikce struktury proteinů pomocí Rosetty". Metody v enzymologii. 383: 66–93. doi:10.1016 / S0076-6879 (04) 83004-0. PMID 15063647.
- ^ Bryant SH, Lawrence CE (květen 1993). "Empirická energetická funkce pro navlékání proteinové sekvence skrz skládací motiv". Proteiny. 16 (1): 92–112. doi:10,1002 / prot. 340160110. PMID 8497488.