Predikce chemického posunu bílkovin - Protein chemical shift prediction
Predikce chemického posunu bílkovin je odvětví biomolekul spektroskopie nukleární magnetické rezonance jehož cílem je přesný výpočet bílkovin chemické směny ze souřadnic bílkovin. O predikci chemického posunu bílkovin se poprvé pokusili koncem šedesátých let minulého století pomocí semiempirických metod aplikovaných na proteinové struktury řešené Rentgenová krystalografie.[1] Od té doby se predikce chemického posunu proteinů vyvinula tak, aby používala mnohem propracovanější přístupy kvantová mechanika, strojové učení a empiricky odvozené hyperplochy chemického posunu.[1] Nejnovější vyvinuté metody vykazují pozoruhodnou přesnost a přesnost.
Chemické posuny bílkovin
NMR chemické směny se často nazývají milníky z spektroskopie nukleární magnetické rezonance. Chemici používají chemické posuny již více než 50 let jako vysoce reprodukovatelné a snadno měřitelné parametry k mapování kovalentní struktury malých organických molekul. Citlivost NMR skutečně byla chemické směny typu a charakteru sousedního atomy v kombinaci s jejich rozumně předvídatelnými tendencemi je učinily neocenitelnými jak pro dešifrování, tak pro popis struktury tisíců nově syntetizovaných nebo nově izolovaných sloučenin[1][2][3][4] Stejná citlivost na řadu důležitých strukturních vlastností proteinů učinila proteinové chemické posuny stejně cenné pro proteinové chemiky a biomolekulární NMR spektroskopy.[4] Zejména jsou chemické posuny proteinů citlivé nejen na účinky substituentů nebo kovalentních atomů (jako např elektronegativita, redoxní stavy nebo kruhové proudy ), ale jsou také citliví na páteř torzní úhly (tj. sekundární struktura), vodíkové vazby, lokální atomové pohyby a dostupnost rozpouštědla.
Význam predikce chemického posunu bílkovin
Pro pomoc s procesem přiřazení chemického posunu lze použít předpokládané nebo odhadované chemické posuny bílkovin. To platí zejména v případě, že podobná (nebo identická) proteinová struktura byla vyřešena rentgenovou krystalografií. V tomto případě lze trojrozměrnou strukturu použít k odhadu, jaké by měly být chemické posuny NMR, a tím zjednodušit proces přiřazování experimentálně pozorovaných chemických posunů. Předpovězené / odhadované chemické posuny proteinů lze také použít k identifikaci nesprávných nebo nesprávných přiřazení, k opravě nesprávně odkazovaných nebo nesprávně odkazovaných chemických posunů, k optimalizaci proteinových struktur prostřednictvím zdokonalení chemického posunu a k identifikaci relativních příspěvků různých elektronických nebo geometrických efektů k posuny specifické pro jádro.[1] Chemické posuny bílkovin lze také použít k identifikaci sekundárních struktur, k odhadu páteř torzní úhly k určení polohy aromatické kruhy, posoudit cystein oxidační stavy, odhadnout expozici rozpouštědlu a měřit páteř flexibilita.[4]
Pokrok v programech predikce chemických posunů
Významný pokrok v roce 2006 chemický posun predikce byla učiněna neustálým zlepšováním našeho chápání klíčových fyzikálně-chemických faktorů přispívajících ke změnám chemického posunu. Těmto vylepšením také pomohla významná výpočetní vylepšení [5][6][7][8] a rychlou expanzi databází biomolekulárních chemických posunů [9].[10] Za poslední čtyři desetiletí byly použity nejméně tři různé metody výpočtu nebo předpovědi bílkovin chemické směny se objevily. První je založen na použití srovnání sekvence / struktury proti proteinu chemický posun databáze je druhá založena na přímém výpočtu posunů z atomových souřadnic a třetí je založena na použití kombinace těchto dvou přístupů.[1][4]
- Predikce posunů pomocí sekvenční homologie: vycházejí z jednoduchého pozorování, že podobné proteinové sekvence sdílejí podobné struktury a podobné chemické posuny[1][3]
- Předvídání posunů od souřadnicových dat / struktury:
- Semi-klasické metody: používají empirické rovnice odvozené z klasická fyzika a experimentální data[1]
- Kvantově mechanické metody (QM): používají se hustota funkční teorie (DFT)[1][2]
- Empirické metody: spoléhejte se na používání chemický posun „Hyperplochy“ nebo související tabulky „struktura / posun“[1]
- Hybridní metody: kombinace výše uvedených dvou metod[1]
Vznik hybridních predikčních metod
Na začátku roku 2000 si několik výzkumných skupin uvědomilo, že chemické posuny proteinů lze efektivněji a přesněji vypočítat kombinací různých metod dohromady, jak je znázorněno na obrázku 1. To vedlo k vývoji několika programů a webových serverů, které rychle vypočítávají chemické posuny proteinů, pokud jsou k dispozici údaje o proteinových souřadnicích.[1] Tyto „hybridní“ programy spolu s některými jejich funkcemi a adresami URL jsou uvedeny níže v tabulce 1.
Shrnutí programů predikce chemického posunu bílkovin
název | Metoda | webová stránka |
---|---|---|
SHIFTCALC[11] | Hybridní - empirické chemické posuny hyperplochy v kombinaci s poloklasickými výpočty | https://archive.is/20140324204821/http://nmr.group.shef.ac.uk/NMR/mainpage.html |
ŘAZENÍ[12] | Hybrid - hyperplochy chemického posunu QM kombinované s poloklasickými výpočty | http://casegroup.rutgers.edu/qshifts/qshifts.htm |
CheSHIFT[13] | QM vypočítal hyperplochy chemického posunu | http://cheshift.com/ |
SHIFTX[2] | Hybridní - empirické chemické posuny hyperplochy v kombinaci s poloklasickými výpočty | http://shiftx.wishartlab.com |
PROSHIFT[14] | Model neuronové sítě využívající atomové parametry a informace o sekvenci | http://www.meilerlab.org/index.php/servers/show?s_id=9 |
SPARTA[15] | Hybrid - shoda sekvence a posunu do databází kombinovaná s poloklasickými výpočty | http://spin.niddk.nih.gov/bax/software/SPARTA/index.html |
SPARTA +[16] | Hybrid - shoda sekvencí a posunů do databází kombinovaná s poloklasickými výpočty a umělou neuronovou sítí | http://spin.niddk.nih.gov/bax/software/SPARTA+/ |
CAMSHIFT[17] | Metoda založená na vzdálenosti v kombinaci s parametrizovanou polynomiální expanzí | https://web.archive.org/web/20140109151911/http://www-vendruscolo.ch.cam.ac.uk/camshift/camshift.php |
SHIFTX2[4] | Hybrid - metoda strojového učení využívající atomové parametry a kombinace s poloklasickými výpočty (SHIFTX +). Nakonec použití pravidel souboru s predikcí založenou na sekvenční homologii (SHIFTY +) | http://www.shiftx2.ca |
Porovnání výkonu moderních programů predikce chemických posunů proteinů
Tato tabulka (obrázek 2) uvádí korelační koeficienty mezi experimentálně pozorovanými chemickými posuny páteře a vypočítanými / predikovanými posuny páteře pro různé prediktory chemických posunů s použitím identické testovací sady 61 testovacích proteinů.
Pokrytí a rychlost
Různé metody mají různé úrovně pokrytí a rychlosti výpočtu. Některé metody pouze počítají nebo předpovídají chemické posuny atomů páteře (6 typů atomů). Někteří počítají chemické posuny pro páteř a určité atomy postranního řetězce (pouze C a N) a další jsou schopni vypočítat posuny pro všechny atomy (40 typů atomů). Pro zdokonalení chemického posunu existuje potřeba rychlého výpočtu, protože během molekulární dynamiky nebo simulovaného žíhání jsou generovány tisíce struktur a jejich chemické posuny musí být vypočítány stejně rychle.
Program | Počet předpokládaných typů atomů | Rychlost (sekundy / 100 zbytků) |
---|---|---|
SHIFTX | 27 | 0.59 |
SPARTA | 6 (pouze páteř) | 17.92 |
SPARTA + | 6 (pouze páteř) | 2.47 |
CamShift | 6 (pouze páteř) | 0.91 |
ŘAZENÍ | 31 | 3.66 |
PROSHIFT | 40 | 12.82 |
SHIFTX2 | 40 | 2.10 |
Všechny výpočtové rychlostní testy pro SPARTA, SPARTA +, SHIFTS, CamShift, SHIFTX a SHIFTX2 byly provedeny na stejném počítači s použitím stejné sady proteinů. Rychlost výpočtu hlášená pro PROSHIFT je založena na míře odezvy jeho webového serveru.[4]
Viz také
Reference
- ^ A b C d E F G h i j k Wishart, DS (únor 2011). "Interpretace údajů o chemickém posunu bílkovin". Pokrok ve spektroskopii nukleární magnetické rezonance. 58 (1–2): 62–87. doi:10.1016 / j.pnmrs.2010.07.004. PMID 21241884.
- ^ A b C Neal, S; Nip AM; Zhang H; Wishart DS (červenec 2003). "Rychlý a přesný výpočet chemických posunů proteinů 1H, 13C a 15 N". Journal of Biomolecular NMR. 26 (3): 215–240. doi:10.1023 / A: 1023812930288. PMID 12766419.
- ^ A b Wishart, DS; Watson, M.S .; Boyko, R.F .; Sykes, B.D. (Prosinec 1997). "Automatická předpověď chemického posunu 1H a 13C pomocí BioMagResBank". Journal of Biomolecular NMR. 10 (4): 329–336. doi:10.1023 / A: 1018373822088. PMID 9460240.
- ^ A b C d E F Han, Beomsoo; Yifeng Liu; Simon Ginzinger; David Wishart (květen 2011). „SHIFTX2: významně vylepšená predikce chemického posunu bílkovin“. Journal of Biomolecular NMR. 50 (1): 43–57. doi:10.1007 / s10858-011-9478-4. PMC 3085061. PMID 21448735.
- ^ Williamson, MP; Asakura, T (červenec 1997). Chemické posuny bílkovin. Metody v molekulární biologii. 60. str.53–69. doi:10.1385/0-89603-309-0:53. ISBN 978-0-89603-309-2. PMID 9276246.
- ^ Case, DA (říjen 1998). "Využití chemických posunů a jejich anizotropií při určování biomolekulární struktury". Aktuální názor na strukturní biologii. 8 (5): 624–630. doi:10.1016 / S0959-440X (98) 80155-3. PMID 9818268.
- ^ Case, DA (duben 2000). "Interpretace chemických posunů a vazebných konstant v makromolekulách". Aktuální názor na strukturní biologii. 10 (2): 197–203. doi:10.1016 / S0959-440X (00) 00068-3. PMID 10753812.
- ^ Wishart, DS; Case, DA (2001). Využití chemických posunů při stanovení makromolekulární struktury. Metody v enzymologii. 338. s. 3–34. doi:10.1016 / s0076-6879 (02) 38214-4. ISBN 9780121822392. PMID 11460554.
- ^ Seavey, B.R .; Farr, E.A.; Westler, W.M. & Markley, J.L. (1991). "Relační databáze pro NMR data sekvenčně specifického proteinu". Journal of Biomolecular NMR. 1 (3): 217–236. doi:10.1007 / BF01875516. PMID 1841696.
- ^ Zhang, H; Neal, S. & Wishart, D.S. (březen 2003). „RefDB: Databáze rovnoměrně odkazovaných chemických posunů proteinů“. J. Biomol. NMR. 25 (3): 173–195. doi:10.1023 / A: 1022836027055. PMID 12652131.
- ^ Iwadate, M; Asakura T; Williamson MP (1999). "C-alfa a C-beta uhlík-13 chemické posuny v proteinech z empirické databáze". J Biomol NMR. 13 (3): 199–211. doi:10.1023 / A: 1008376710086. PMID 10212983.
- ^ Xu, XP; Případ DA (2001). "Automatická předpověď chemických posunů 15N, 13Calpha, 13Cbeta a 13C 'v proteinech pomocí funkční databáze hustoty". J Biomol NMR. 21 (4): 321–333. doi:10.1023 / A: 1013324104681. PMID 11824752.
- ^ Vila, JA; Arnautova YA; Martin OA (2009). „Server 13Calpha odvozený z kvantové mechaniky (CheShift) pro ověření struktury proteinů“. Proc Natl Acad Sci USA. 106 (40): 16972–16977. Bibcode:2009PNAS..10616972V. doi:10.1073 / pnas.0908833106. PMC 2761357. PMID 19805131.
- ^ Meiler, J (2003). "PROSHIFT: predikce chemického posunu proteinu pomocí umělých neuronových sítí". J Biomol NMR. 26 (1): 25–37. doi:10.1023 / A: 1023060720156. PMID 12766400.
- ^ Shen, Y; Bax A (2007). "Předpovědi chemických posunů páteře v proteinu z vyhledávání databáze torzního úhlu a sekvenční homologie". J Biomol NMR. 38 (4): 289–302. doi:10.1007 / s10858-007-9166-6. PMID 17610132.
- ^ Shen, Yang; Ad Bax (2010). „SPARTA +: mírné zlepšení empirické predikce chemického posunu NMR pomocí umělé neuronové sítě“. J Biomol NMR. 48 (1): 13–22. doi:10.1007 / s10858-010-9433-9. PMC 2935510. PMID 20628786.
- ^ Kohlhoff, KJ; Robustelli P; Cavalli A; Salvatella X; Vendruscolo M (2009). "Rychlé a přesné předpovědi proteinových NMR chemických posunů z meziatomových vzdáleností". J Am Chem Soc. 131 (39): 13894–13895. doi:10.1021 / ja903772t. PMID 19739624.