Rozlišení proxy serverem - Resolution by Proxy

Rozlišení proxy serverem
Obsah
PopisVypočítá rozlišení struktury pouze pomocí souřadnicových dat
Kontakt
Výzkumné centrumUniversity of Alberta
LaboratořDr. David Wishart
Primární citace[1]
Přístup
Datový formátZadávání dat: Rentgenové nebo NMR souřadnice (formát PDB); Výstup dat: Odhadované rozlišení v Angstromech
webová stránkahttp://www.resprox.ca; http://www.resprox.ca/download.html
Smíšený
Uvolnění dat
frekvence
Každé 1–2 roky s pravidelnými opravami a aktualizacemi
Kurátorská politikaRučně upraveno

Rozlišení proxy serverem (ResProx) je metoda pro hodnocení ekvivalentu rentgen rozlišení NMR -odvozené proteinové struktury. ResProx vypočítá rozlišení z koordinovat spíše než z hustoty elektronů nebo jiných experimentálních vstupů. To umožňuje vypočítat rozlišení struktury bez ohledu na to, jak byla vyřešena (rentgen, NMR, EM, modelování, ab initio předpověď ). ResProx byl původně navržen tak, aby sloužil jako jednoduché vyhodnocení jedním číslem, které umožňuje přímé srovnání kvality / rozlišení rentgen struktur a kvality daného NMR struktura. Lze jej však také použít k posouzení spolehlivosti experimentálně hlášené rentgen rozlišení struktury, vyhodnotit proteinové struktury řešit nekonvenčními nebo hybridními prostředky a identifikovat podvodné struktury uložené v PNR.[1] ResProx obsahuje více než 25 různých strukturálních funkcí k určení jediné hodnoty podobné rozlišení. Hodnoty ResProx jsou hlášeny v Angstromech. Testy na tisících rentgen struktury ukazují, že hodnoty ResProx se velmi shodují s hodnotami rozlišení hlášenými rentgen krystalografové.[1] Hodnoty rozlišení pomocí proxy lze vypočítat pro nově určené proteinové struktury pomocí volně přístupného webového serveru ResProx.[1] Tento server přijímá bílkoviny koordinovat data (v PDB formát) a generuje odhad rozlišení (v Angstromech) pro tuto vstupní strukturu.

Souvislosti a odůvodnění

v Rentgenová krystalografie Rozlišení je měřítkem rozlišitelnosti nebo přesnosti v mapě elektronové hustoty molekuly. Rozlišení se obvykle uvádí v Angstromech (10–10 metrů) pro rentgen krystalové struktury. Čím menší je číslo, tím lepší je stupeň atomového rozlišení. V bílkovinách Rentgenová krystalografie nejlepší dosažitelné rozlišení je asi 1 Angstrom. Tato úroveň rozlišení umožňuje jednotlivcům atomy vodíku být vizualizován a těžké atomy (C, Ó, N ), aby byly velmi přesně mapovány. Většina proteinové struktury dnes řešené mají rozlišení 1,5 až 2,5 Angstromů, což znamená atomy vodíku nejsou viditelné a existuje určitá nejistota v přesném umístění těžkých atomů. Proteinové struktury s rozlišením> 2,5 Angstromů obecně mají řadu koordinovat nepřesnosti i další strukturální problémy. Když je rozlišení větší než 3,5 Angstromů, často existuje značná nejistota jak v umístění atomů, tak i v identitě jednotlivých amino zbytků. Jinými slovy, rozlišení nepřímo koreluje s kvalitou struktury (tj. Vyšší čísla znamenají horší struktury). Tento trend v proteinová struktura kvalita pro rentgen rozlišení velmi odpovídá trendu v kvalitě NMR -odhodlaný proteinové struktury. Nějaký NMR struktury mají velký počet omezení (NOE, H-vazby, J-vazby, dipolární vazby), vynikající geometrii, vysokou kvalitu struktury a velmi těsné soubory s vynikající atomovou přesností (RMSD <1 angstrom). jiný NMR struktury mají velmi málo omezení, špatnou geometrii nebo špatnou kvalitu struktury a velmi volné soubory (RMSD > 3 angstrómy). Neexistuje však žádné jednoduché mapování mezi nimi NMR RMSD hodnoty a rentgen hodnoty rozlišení. To znamená, že NMR soubor s 1 Angstromem RMSD neodpovídá kvalitou ani přesností rentgen struktura s rozlišením 1 Angstrom. Je to proto, že RMSD míra je jak funkcí počtu struktur použitých v souboru, tak výběrového zkreslení spektroskopa, který ukládá strukturní soubor. Stejně tak v NMR je možné generovat vysokou kvalitu, přesně stanovenou proteinové struktury s použitím relativně málo dobře zvolených omezení. Je také možné generovat velmi nízkou kvalitu NMR struktury z velkého počtu nedbale posouzených, mylných nebo nesprávně přiřazených omezení.

Za posledních 20 let bylo navrženo několik metod pro výpočet „ekvivalentního rozlišení“ pouze s použitím rentgen koordinovat data (spíše než rentgen difrakční data). Některé byly navrženy speciálně pro hodnocení NMR struktury jako Procheck-NMR [2] zatímco jiné byly navrženy spíše pro hodnocení a validaci kvality struktury rentgen struktury jako MolProbity,[3] a RosettaHoles2.[4] Tyto metody se však opírají o relativně malý počet proteinová struktura kvalitativní opatření k predikci rozlišení (4, 3, respektive 1 měření) a následně korelace mezi pozorovaným (rentgenovým) rozlišením a předpovězeným rozlišením není nijak zvlášť dobrá. Rozšířením počtu strukturních vlastností o distribuci torzních úhlů, přítomnost střetů atomů, normálnost vodíkových vazeb, počty porušení délek vazeb a úhlů vazeb, přítomnost dutin, zbytky specifických objemů balení, balení účinnost a vláknové energie je možné tuto korelaci poměrně podstatně zlepšit.

Algoritmus ResProx

ResProx používá kolekci 25 různých proteinová struktura funkce (jako jsou rozložení torzního úhlu, vodíkové vazby, objem náplně, dutiny, opatření Molprobity), které byly použity v metodě Support Vector Regression k maximalizaci korelace mezi předpokládaným rozlišením a pozorovaným rentgen rozlišení na sadě 2400 proteinové struktury se známým rentgen rozlišení. Přesné podrobnosti algoritmu jsou uvedeny v článku publikovaném Dr. Wishartem a kolegy.[1] Po proškolení a příslušném ověření na nezávislých testovacích sadách je tento model SVR schopen odhadnout rozlišení vyřešeného rentgen struktury s korelačním koeficientem 0,92, znamená absolutní chybu 0,28 Angstromů. To je o 15–30% lepší než u stávajících metod. To je znázorněno na obrázku 1. Protože výkon metody ResProx je tak vysoký a protože ji pouze potřebujete koordinovat údaje pro generování odhadu ekvivalentu rentgen rozlišení, je ideální pro použití NMR struktur. Když NMR struktury jsou analyzovány průměrem ResProx NMR struktura má ekvivalent rentgen rozlišení 2,8 angstromů - což je relativně špatné (obr. 2). To je v souladu s kvalitativními pozorováními týkajícími se celkové kvality a přesnosti NMR struktur. Jak je vidět na obrázku 2, velmi malé číslo NMR struktury vykazují rozlišení ekvivalentní <1,0 Angstromu - ale ty jsou vzácné.

Obrázek 1. Výkon ResProx oproti tréninkovým a testovacím datům.

Obrázek 2. Histogram ekvivalentního rozlišení ResProx pro NMR modely a experimentální rozlišení pro rentgenové struktury. Z PDB bylo náhodně vybráno 500 NMR souborů a 500 rentgenových struktur. Proteiny byly seskupeny do zásobníků s rozlišením 0,25 Á. Hodnoty rozlišení na ose X označují horní hranici každého zásobníku rozlišení. Hodnoty pro NMR struktury a rentgenové struktury představují počet struktur v každé rozlišovací přihrádce.

Server ResProx

Webový server ResProx je volně přístupný server, který přijímá NMR protein koordinovat data (v PDB formát) a generuje odhad rozlišení (v Angstromech) NMR struktura. K dispozici je také verze ResProx ke stažení. ResProx také poskytuje seznam 50834 proteinových struktur s PDB identifikátory spolu s jejich pozorovaným rozlišením a odpovídajícími hodnotami ResProx.

Reference

  1. ^ A b C d E Berjanskii, M; Zhou J; Liang Y; Li G; Wishart DS (červenec 2012). "Resolution-by-proxy: jednoduché opatření pro hodnocení a srovnání celkové kvality proteinových struktur NMR". J Biomol NMR. 53 (3): 167–80. doi:10.1007 / s10858-012-9637-2. PMID  22678091.
  2. ^ Laskowski, RA; Rullmannn JA; MacArthur MW; Kaptein R; Thornton JM (1996). „AQUA a PROCHECK-NMR: programy pro kontrolu kvality proteinových struktur řešených NMR“. J Biomol NMR. 8 (4): 477–486. doi:10.1007 / bf00228148. PMID  9008363.
  3. ^ Chen VB, Arendall WB 3., Headd JJ, Keedy DA, Immormino RM, Kapral GJ, Murray LW, Richardson JS, Richardson DC (2010). „MolProbity: validace struktury všech atomů pro makromolekulární krystalografii“. Acta Crystallogr D. 66 (Pt 1): 12–21. doi:10.1107 / S0907444909042073. PMC  2803126. PMID  20057044.
  4. ^ Sheffler, W; Baker D (2010). „RosettaHoles2: objemové opatření pro zušlechťování a ověřování struktury proteinů“. Protein Sci. 19 (10): 1991–1995. doi:10,1002 / pro.458. PMC  2998733. PMID  20665689.