CS23D - CS23D

Příklad výstupní stránky CS23D
CS23D Ramachandran spiknutí abeceda, která se používá v chemickém posunu závitů

CS23D je webový server pro generování 3D strukturálních modelů z NMR chemických posunů.[1] CS23D kombinuje maximální sestavu fragmentu s chemickým posunem závitů, de novo generování struktury, predikce torzního úhlu založená na chemickém posunu a upřesnění chemického posunu. CS23D využívá RefDB a ShiftX.

Vstupní formáty CS23D

CS23D přijímá soubory chemických posunů ve formátech SHIFTY nebo BMRB.

Možnosti CS23D

Uživatel může

  1. Vyloučte, aby se protein používal jako šablona
  2. V seznamu dostupných šablon ignorujte homology vysoké identity
  3. Změňte počet modelů ve finálním souboru
  4. Změňte počet kroků optimalizace modelu

Výstup CS23D

Výstup CS23D se skládá ze sady 10 souřadnic PDB s nejlepším skóre. K dispozici je také hypertextový odkaz na strukturu nejlepšího skóre. Zobrazí se celkové skóre CS23D, skóre založené na znalostech, skóre chemického posunu, statistika Ramachandranova grafu, korelace mezi pozorovanými a vypočítanými posuny před a po upřesnění. Uživatel získá závěr o spolehlivosti struktury.

Protokol CS23D

Hledání homologie: Dotazová sekvence se používá k nalezení homologních proteinů nebo / a proteinových fragmentů v neredundantní databázi PDB sekvencí a sekundárních struktur PPT-DB pomocí VÝBUCH.

Homologické modelování: Homologické modelování provádí program Homodeller, který je součástí programu PROTEUS2.[2] Proteiny, které jsou identifikovány během kroku hledání homologie, se používají jako šablony v modelování homologie.

Chemická změna reference: Chemické posuny jsou znovu odkazovány RefCorem,[3] který je součástí backendu webového serveru RCI.

Predikce sekundární struktury z chemických posunů: Sekundární struktura je předpovídána z chemických posunů pomocí CSI.

Predikce torzního úhlu z chemických posunů: Torzní úhly předpovídá z chemických posunů PREDITOR.[4]

Chemické posunování závitů: Torzní úhly páteře Phi a Psi předpovězené z chemických posunů PREDITOREM[4] jsou mapovány do devíti různých oblastí v prostoru Ramachandranu, přičemž každé z nich jsou přiřazena konkrétní písmena. Protein může být představován sekvencí těchto devíti „písmen torzního úhlu“. Thrifty používá tyto sekvence písmen torzního úhlu k identifikaci dobrých šablon v databázi ~ 18 500 neredundantních struktur PDB, u nichž byly jejich struktury převedeny na devítipísmennou „abecedu“ Ramachandran.

Podobným způsobem se navlékání chemických posunů provádí také pomocí třípísmenné abecedy sekundární struktury (H pro šroubovice, B pro beta řetězec, C pro cívku) a sekundární struktury předpovězené z chemických posunů programem CSI.

Sestava modelu:Subfragmenty identifikované homologním modelováním a kroky chemického posunu závitů jsou sestaveny do počátečních 3D modelů pomocí CS23D SFassembler (SubFragment assembler). Počáteční modely se vyhodnocují pomocí skórovací funkce GAFolder (viz níže) a nejlepší model se dále vylepšuje pomocí GAFolder (viz další informace o GAFolder níže).

Skládání Ab initio: Ab initio skládání provádí Rosetta[5] když nebyla pomocí kroků homologie modelování a chemického posunu závitů identifikována žádná šablona. Modely Rosetta jsou hodnoceny pomocí funkce skórování GAFolder a nejlepší modely Rosetta jsou vylepšeny pomocí GAFolder (viz níže).

Optimalizace modelu: Optimalizace modelu v CS23D se provádí pomocí minimalizátoru GAfolder založeného na torzním úhlu (složka Genetic Algorithm), který používá genetický algoritmus k vzorkování konformačního prostoru. Metoda je podobná té, kterou používá GENFOLD.[5] GAFolder provádí pohyby torzních úhlů v rozmezí definovaném hodnotami a nejistotami torzních úhlů předpovězených PREDITOREM.[4] GAFolder hodnotí proteinové modely pomocí skórovací funkce popsané níže.

Funkce bodování: Funkce skórování GAFolderu se skládá ze skóre založených na znalostech a skóre chemického posunu.

Skóre založené na znalostech zahrnout:

  1. poloměr gyračního skóre,
  2. energie vodíkové vazby,
  3. počet vodíkových vazeb,
  4. skóre špatných kontaktů,
  5. skóre disulfidové vazby,
  6. upravená energie vláken na základě Bryantova a Lawrencova potenciálu.[6]
  7. Ramachandranovo skóre, které hodnotí normalitu torzních úhlů modelu Phi a Psi
  8. Omega skóre, které hodnotí normálnost torzních omega úhlů modelu
  9. Skóre Chi, které je založeno na očekávaných úhlech chi pro různé kombinace phi a psi.

Složka chemického posunu funkce bodování GAfolder používá:

  1. vážené koeficienty korelace mezi experimentálními chemickými posuny (CA, CB, CO, N, HA, HN) a chemickými posuny vypočítanými pomocí SHIFTX 1.0.
  2. shoda mezi modelovou sekundární strukturou a sekundární strukturou predikovanou CSI z experimentálních chemických posunů.

Podprogramy CS23D

  1. CSI - predikce sekundární struktury z chemických posunů
  2. BLAST - zarovnání sekvence, hledání homologie
  3. PROTEUS2 - modelování homologie[2]
  4. PREDITOR - predikce torzních úhlů z chemických posunů[4]
  5. Pepmake - stavba proteinových modelů z torzních úhlů a sekvence
  6. PPT-DB - databáze sekundární struktury
  7. Rosetta - ab initio generování struktury[5]
  8. RCI - odhad nejistoty torzních úhlů předpovězených z chemických posunů PREDITOREM
  9. ShiftX 1.0 - se používá ke generování koeficientů korelace mezi pozorovanými chemickými posuny a posuny předpovídanými ShiftX z proteinových modelů
  10. SFAssembler - maximální sestava fragmentu
  11. GAFolder - zdokonalení chemického posunu pomocí genetického algoritmu
  12. Thrifty - závitování chemickým posunem
  13. RefCor - opětovné odkazování na chemický posun

Závislost CS23D na identitě sekvence šablony

CS23D je metoda založená na šabloně. Proto jeho výkon závisí na sekvenční identitě vybraných šablon, viz sousední obrázek. Podobně je Rosetta metodou zaujatou fragmenty. Jeho výkon závisí na kvalitě vybraných fragmentů. Kvalita fragmentu, a tedy výkon Rosetty, lze zlepšit použitím chemických posunů během kroku výběru fragmentu (např. V protokolu CS-Rosetta). U strukturálního řešení, které není předpjaté strukturou šablony nebo strukturou fragmentu, je možné zvážit získání omezení vzdálenosti založených na NOE (8-10 na zbytek) a jejich použití s GeNMR program v jeho ab initio režimu.

Viz také

Reference

  1. ^ Wishart DS, Arndt D, Berjanskii M, Tang P, Zhou J, Lin G (červenec 2008). „CS23D: webový server pro rychlé generování proteinové struktury pomocí NMR chemických posunů a sekvenčních dat“. Výzkum nukleových kyselin. 36 (Problém s webovým serverem): W496–502. doi:10.1093 / nar / gkn305. PMC  2447725. PMID  18515350.
  2. ^ A b Montgomerie S, Cruz JA, Shrivastava S, Arndt D, Berjanskii M, Wishart DS (červenec 2008). „PROTEUS2: webový server pro komplexní predikci struktury proteinů a strukturované anotace“. Výzkum nukleových kyselin. 36 (Problém s webovým serverem): W202–9. doi:10.1093 / nar / gkn255. PMC  2447806. PMID  18483082.
  3. ^ Berjanskii M, Wishart DS (2006). "NMR: predikce flexibility proteinů". Přírodní protokoly. 1 (2): 683–8. doi:10.1038 / nprot.2006.108. PMID  17406296.
  4. ^ A b C d Berjanskii MV, Neal S, Wishart DS (červenec 2006). „PREDITOR: webový server pro predikci omezení proteinového torzního úhlu“. Výzkum nukleových kyselin. 34 (Problém s webovým serverem): W63–9. doi:10.1093 / nar / gkl341. PMC  1538894. PMID  16845087.
  5. ^ A b C Rohl CA, Strauss CE, Misura KM, Baker D (2004). "Predikce struktury proteinů pomocí Rosetty". Metody v enzymologii. 383: 66–93. doi:10.1016 / S0076-6879 (04) 83004-0. PMID  15063647.
  6. ^ Bryant SH, Lawrence CE (květen 1993). "Empirická energetická funkce pro navlékání proteinové sekvence skrz skládací motiv". Proteiny. 16 (1): 92–112. doi:10,1002 / prot. 340160110. PMID  8497488.