Kořenová střední odchylka atomových pozic - Root-mean-square deviation of atomic positions
v bioinformatika, odchylka střední kvadratické hodnoty atomových pozic (nebo jednoduše odchylka od odmocniny, RMSD) je míra průměrné vzdálenosti mezi atomy (obvykle atomy páteře) překrývá bílkoviny. Všimněte si, že výpočet RMSD lze použít na jiné neproteinové molekuly, jako jsou malé organické molekuly.[1] Při studiu globulárních proteinových konformací se obvykle měří podobnost v trojrozměrné struktuře pomocí RMSD atomových souřadnic Ca po optimální superpozici tuhého těla.
Když dynamický systém kolísá kolem určité dobře definované průměrné polohy, lze RMSD z průměru v čase označovat jako RMSF nebo fluktuace střední odmocniny. Velikost této fluktuace lze měřit například pomocí Mössbauerova spektroskopie nebo nukleární magnetická rezonance a může poskytnout důležité fyzické informace. The Lindemannův index je metoda umístění RMSF v kontextu parametrů systému.
Široce používaným způsobem srovnání struktur biomolekul nebo pevných těles je překládat a otáčet jednu strukturu vzhledem k druhé, aby se minimalizovala RMSD. Coutsias, et al. představil jednoduchou derivaci založenou na čtveřice, pro optimální transformaci tělesa (rotace-překlad), která minimalizuje RMSD mezi dvěma sadami vektorů.[2] Dokázali, že metoda čtveřice je ekvivalentní se známou metodou Kabschův algoritmus.[3] Řešení, které poskytl Kabsch, je instancí řešení d-dimenzionálního problému, který zavedli Hurley a Cattell.[4] The čtveřice řešení pro výpočet optimální rotace bylo zveřejněno v příloze článku Petitjeana.[5] Tento čtveřice Řešení a výpočet optimální izometrie v d-dimenzionálním případě byly rozšířeny na nekonečné množiny a na spojitý případ v příloze A jiného článku Petitjeana.[6]
Rovnice
kde δi je vzdálenost mezi atomy i a buď referenční struktura nebo střední poloha N ekvivalentní atomy. Toto se často počítá pro těžké atomy páteře C, N, Ó, a Cα nebo někdy jen Cα atomy.
Normálně se provádí rigidní superpozice, která minimalizuje RMSD, a toto minimum se vrátí. Vzhledem k tomu, dvě sady bodů a , je RMSD definována takto:
Hodnota RMSD je vyjádřena v jednotkách délky. Nejčastěji používaná jednotka v strukturní biologie je Ångström (Å), která se rovná 10−10 m.
Použití
Typicky se RMSD používá jako kvantitativní měřítko podobnosti mezi dvěma nebo více proteinovými strukturami. Například CASP predikce proteinové struktury soutěž využívá RMSD jako jedno ze svých hodnocení toho, jak dobře se předložená struktura shoduje se známou cílovou strukturou. Čím nižší RMSD, tím lepší je model ve srovnání s cílovou strukturou.
Také někteří vědci, kteří studují skládání bílkovin pomocí počítačových simulací použijte RMSD jako a souřadnice reakce kvantifikovat, kde je protein mezi složeným stavem a rozloženým stavem.
Studium RMSD pro malé organické molekuly (běžně nazývané ligandy když se vážou na makromolekuly, jako jsou proteiny, je studována) je v kontextu běžné dokování,[1] stejně jako v jiných metodách ke studiu konfigurace ligandů po navázání na makromolekuly. Všimněte si, že v případě ligandů (na rozdíl od proteinů, jak je popsáno výše), jejich struktury před výpočtem RMSD nejčastěji nejsou superponovány.
RMSD je také jednou z několika metrik, které byly navrženy pro kvantifikaci evoluční podobnosti mezi proteiny, stejně jako kvality seřazení sekvencí.[7] [8]
Viz také
- Kořenová střední kvadratická odchylka
- Kořenová střední fluktuace čtverce
- Čtveřice - slouží k optimalizaci výpočtů RMSD
- Kabschův algoritmus - algoritmus používaný k minimalizaci RMSD tím, že se nejprve najde nejlepší rotace[3]
- GDT - jiné měřítko srovnání struktury
- TM-skóre - jiné měřítko srovnání struktury
- Nejdelší souvislý segment (LCS) - Odlišné opatření pro srovnání struktury
- Globální výpočet vzdálenosti (GDC_sc, GDC_all) - Opatření pro srovnání struktury, která k posouzení podobnosti používají informace o celém modelu (nejen α-uhlík)
- Místní globální zarovnání (LGA) - Program pro srovnání struktury proteinů a opatření pro srovnání struktury
Reference
- ^ A b „Molekulární ukotvení, odhad volných energií vazby a semi-empirické silové pole AutoDocku“. Web Sebastiana Raschky. 2014-06-26. Citováno 2016-06-07.
- ^ Coutsias EA, Seok C, Dill KA (2004). Msgstr "Použití čtveřic k výpočtu RMSD". J Comput Chem. 25 (15): 1849–1857. doi:10.1002 / jcc.20110. PMID 15376254.
- ^ A b Kabsch W (1976). Msgstr "Řešení pro nejlepší rotaci vztahující se ke dvěma sadám vektorů". Acta Crystallographica. 32 (5): 922–923. doi:10.1107 / S0567739476001873.
- ^ Hurley JR, Cattell RB (1962). „Program Procrustes: Produkce přímé rotace pro testování předpokládané struktury faktorů“. Behaviorální věda. 7 (2): 258–262. doi:10,1002 / bs.3830070216.
- ^ Petitjean M (1999). „Kvantitativní chirality kvantitativní chirality a kvantitativní symetrie na kvadratickém čtverci“ (PDF). Journal of Mathematical Physics. 40 (9): 4587–4595. doi:10.1063/1.532988.
- ^ Petitjean M (2002). "Chirální směsi" (PDF). Journal of Mathematical Physics. 43 (8): 185–192. doi:10.1063/1.1484559.
- ^ Jewett AI, Huang CC, Ferrin TE (2003). „MINRMS: efektivní algoritmus pro stanovení podobnosti proteinové struktury pomocí kořenové střední hodnoty na druhou (PDF). Bioinformatika. 19 (5): 625–634. doi:10.1093 / bioinformatika / btg035. PMID 12651721.CS1 maint: více jmen: seznam autorů (odkaz)
- ^ Armougom F, Moretti S, Keduas V, Notredame C (2006). „IRMSD: místní míra přesnosti zarovnání sekvence pomocí strukturálních informací (PDF). Bioinformatika. 22 (14): e35–39. doi:10.1093 / bioinformatika / btl218. PMID 16873492.
Další čtení
- Shibuya T (2009). "Hledání proteinových 3-D struktur v lineárním čase." Proc. 13. výroční mezinárodní konference o výzkumu ve výpočetní molekulární biologii (RECOMB 2009), LNCS 5541:1–15.
- Damm KL, Carlson HA (2006). „Gaussova vážená superpozice RMSD proteinů: strukturní srovnání flexibilních proteinů a předpokládaných proteinových struktur“. Biophys J.. 90 (12): 4558–4573. doi:10.1529 / biophysj.105.066654. PMC 1471868. PMID 16565070.
- Kneller GR (2005). „Komentář k„ Použití čtveřic k výpočtu RMSD “[J. Comp. Chem. 25, 1849 (2004)]". J Comput Chem. 26 (15): 1660–1662. doi:10.1002 / jcc.20296. PMID 16175580.
- Theobald DL (2005). "Rychlý výpočet RMSD pomocí kvartémového charakteristického polynomu". Acta Crystallogr A. 61 (Pt 4): 478–480. doi:10.1107 / S0108767305015266. PMID 15973002.
- Maiorov VN, Crippen GM (1994). „Význam odchylky root-mean-square při porovnávání trojrozměrných struktur globulárních proteinů“ (PDF). J Mol Biol. 235 (2): 625–634. doi:10.1006 / jmbi.1994.1017. hdl:2027.42/31835. PMID 8289285.
externí odkazy
- Měření molekulární vzdálenosti —Výukový program, jak vypočítat RMSD
- RMSD —Další výukový program, jak vypočítat RMSD s ukázkovým kódem
- Shoda sekundární struktury (SSM) - nástroj pro srovnání struktury proteinů. Používá RMSD.
- GDT, LCS a LGA - různá opatření ke srovnání struktury. Popis a služby.
- SuperPose - server pro superpozici proteinů. Používá RMSD.
- překrýt - strukturální vyrovnání založené na párování sekundární struktury. Projektem CCP4. Používá RMSD.
- A Krajta skript je k dispozici na https://github.com/charnley/rmsd
- Alternativní Krajta skript je k dispozici na https://github.com/jewettaij/superpose3d