Funkce bodování pro dokování - Scoring functions for docking
Dokovací glosář |
---|
|
Upravit |
V polích výpočetní chemie a molekulární modelování, bodovací funkce jsou matematické funkce slouží k přibližné předpovědi vazba afinita mezi dvěma molekulami poté, co byly ukotven. Nejčastěji je jedna z molekul a malá organická sloučenina jako a lék a druhý je biologický cíl drogy, jako je a protein receptor.[1] Byly také vyvinuty skórovací funkce, které předpovídají sílu mezimolekulární interakce mezi dvěma proteiny[2] nebo mezi bílkovinami a DNA.[3]
Užitečnost
Skóre funkce jsou široce používány v objev drog a další molekulární modelování aplikace. Tyto zahrnují:[4]
- Virtuální projekce z malá molekula databáze kandidátských ligandů k identifikaci nových malých molekul, které se vážou na požadovaný proteinový cíl, a proto jsou užitečnými výchozími body objev drog[5]
- De novo design (design „od nuly“) nových malých molekul, které se vážou na proteinový cíl[6]
- Optimalizace potenciálu screeningových zásahů k optimalizaci jejich afinity a selektivity[7]
Potenciálně spolehlivější, ale výpočetně náročnější alternativou k bodovacím funkcím jsou narušení volné energie výpočty.[8]
Předpoklady
Skórovací funkce jsou normálně parametrizovány (nebo trénovány) proti datovému souboru skládajícímu se z experimentálně stanovených vazebných afinit mezi molekulárními druhy podobnými druhům, které si jeden přeje předpovědět.
Pro aktuálně používané metody zaměřené na předpovídání afinit ligandy u proteinů musí být nejprve známé nebo předvídatelné:
- Protein terciární struktura - uspořádání atomů proteinu v trojrozměrném prostoru. Proteinové struktury mohou být stanoveny experimentálními technikami, jako je např Rentgenová krystalografie nebo fáze řešení NMR metody nebo předpovídané homologické modelování.
- Ligand aktivní konformace - trojrozměrný tvar ligandu po navázání na protein
- Režim vazby - orientace dvou vazebných partnerů v komplexu vůči sobě navzájem
Výše uvedené informace poskytují trojrozměrnou strukturu komplexu. Na základě této struktury může skórovací funkce poté pomocí jedné z níže uvedených metod odhadnout sílu asociace mezi dvěma molekulami v komplexu. Nakonec může být použita samotná skórovací funkce, která pomůže předpovědět jak vazebný režim, tak aktivní konformaci malé molekuly v komplexu, nebo alternativně může být v rámci dokovacího běhu použita jednodušší a výpočetně rychlejší funkce.
Třídy
Existují čtyři obecné třídy bodovacích funkcí:[9][10][11]
- Silové pole - afinity se odhadují sečtením síly mezimolekulárních van der Waals a elektrostatický interakce mezi všemi atomy dvou molekul v komplexu pomocí a silové pole. Intramolekulární energie (označované také jako kmenová energie ) obou závazných partnerů jsou také často zahrnuti. Nakonec, protože k vazbě obvykle dochází v přítomnosti vody, je desolvation energie ligandu a proteinu se někdy berou v úvahu při použití implicitní solvatace metody jako GBSA nebo PBSA.[12]
- Empirický - na základě počítání počtu různých typů interakcí mezi dvěma závaznými partnery.[6] Počítání může být založeno na počtu ligandových a receptorových atomů ve vzájemném kontaktu nebo na základě výpočtu změny v povrch přístupný rozpouštědlům (ΔSASA) v komplexu ve srovnání s nekomplexovaným ligandem a proteinem. Koeficienty bodovací funkce se obvykle hodí pomocí vícenásobná lineární regrese metody. Tyto podmínky interakce funkce mohou zahrnovat například:
- hydrofobní - hydrofobní kontakty (příznivé),
- hydrofobní - hydrofilní kontakty (nepříznivé) (Účty za nesplněné vodíkové vazby, které jsou důležitým entalpickým příspěvkem k vazbě.[13] Jedna ztracená vodíková vazba může představovat 1–2 řády vazebné afinity.[14]),
- počet Vodíkové vazby (příznivý příspěvek k afinitě, zvláště pokud je chráněn před rozpouštědlem, pokud je rozpouštědlo vystaveno bez příspěvku),
- počet otočných vazeb imobilizovaných při tvorbě komplexu (nepříznivé konformační entropie příspěvek).
- Znalostní - na základě statistických pozorování mezimolekulárních blízkých kontaktů ve velkých 3D databázích (např Cambridge strukturální databáze nebo Proteinová datová banka ), které se používají k odvození statistický "potenciály střední síly "Tato metoda je založena na předpokladu, že blízké intermolekulární interakce mezi určitými typy atomů nebo funkčních skupin, ke kterým dochází častěji, než by člověk očekával při náhodném rozdělení, budou pravděpodobně energeticky příznivé, a proto příznivě přispívají k vazebné afinitě."[15]
- Strojové učení - Na rozdíl od těchto klasických skórovacích funkcí se skórovací funkce strojového učení vyznačují tím, že nepředpokládají předem stanovenou funkční formu vztahu mezi vazebnou afinitou a strukturálními rysy popisujícími komplex protein-ligand.[16] Tímto způsobem je funkční forma odvozena přímo z dat. Důsledně bylo zjištěno, že skórovací funkce strojového učení překonávají klasické skórovací funkce při predikci vazebné afinity různých komplexů protein-ligand.[17][18] To platí také pro komplexy specifické pro cíl,[19][20] výhoda je závislá na cíli a hlavně závisí na objemu relevantních dostupných údajů.[11][21] Pokud je věnována náležitá péče, funkce bodování strojového učení provádějí přinejmenším stejně jako klasické funkce bodování souvisejícího problému virtuálního screeningu založeného na struktuře.[22][23][24][25][26][27] Tyto recenze poskytují širší přehled o funkcích bodování strojového učení pro návrh léků na základě struktury.[11][28][29][30]
První tři typy, silové pole, empirické a založené na znalostech, se běžně označují jako klasické skórovací funkce a jsou charakteristické tím, že se předpokládá, že jejich příspěvky k vazbě jsou lineárně kombinovány. Kvůli tomuto omezení nemohou klasické skórovací funkce využívat velké množství tréninkových dat.[31]
Upřesnění
Protože různé skórovací funkce jsou relativně kolineární, nemusí konsensuální skórovací funkce významně zlepšit přesnost.[32] Toto tvrzení šlo poněkud proti převládajícímu názoru v této oblasti, protože předchozí studie naznačovaly, že konsensuální bodování je prospěšné.[33]
Dokonalá skórovací funkce by dokázala předpovědět vazebnou volnou energii mezi ligandem a jeho cílem. Ale ve skutečnosti výpočetní metody i výpočetní zdroje omezují tento cíl. Nejčastěji se tedy volí metody, které minimalizují počet falešně pozitivních a falešně negativních ligandů. V případech, kdy je k dispozici experimentální tréninkový soubor dat vazebných konstant a struktur, byla vyvinuta jednoduchá metoda pro zdokonalení skórovací funkce používané v molekulárním dokování.[34]
Reference
- ^ Jain AN (říjen 2006). "Skórovací funkce pro dokování protein-ligand". Současná věda o proteinech a peptidech. 7 (5): 407–20. doi:10.2174/138920306778559395. PMID 17073693.
- ^ Lensink MF, Méndez R, Wodak SJ (prosinec 2007). "Dokování a hodnocení proteinových komplexů: CAPRI 3. vydání". Proteiny. 69 (4): 704–18. doi:10,1002 / prot. 21804. PMID 17918726.
- ^ Robertson TA, Varani G (únor 2007). "All-atom, vzdálenost-závislý bodovací funkce pro predikci interakcí protein-DNA ze struktury". Proteiny. 66 (2): 359–74. doi:10,1002 / prot. 21162. PMID 17078093.
- ^ Rajamani R, Good AC (květen 2007). „Pozice v žebříčku při zjišťování a optimalizaci vedení na základě struktury: současné trendy ve vývoji funkce bodování“. Aktuální názor na objev a vývoj drog. 10 (3): 308–15. PMID 17554857.
- ^ Seifert MH, Kraus J, Kramer B (květen 2007). "Virtuální vysokovýkonný screening molekulárních databází". Aktuální názor na objev a vývoj drog. 10 (3): 298–307. PMID 17554856.
- ^ A b Böhm HJ (červenec 1998). „Predikce vazebných konstant proteinových ligandů: rychlá metoda pro stanovení priorit zásahů získaných z programů de novo design nebo 3D prohledávání databází“. Journal of Computer-Aided Molecular Design. 12 (4): 309–23. Bibcode:1998JCAMD..12..309B. doi:10.1023 / A: 1007999920146. PMID 9777490. S2CID 7474036.
- ^ Joseph-McCarthy D, Baber JC, Feyfant E, Thompson DC, Humblet C (květen 2007). "Optimalizace olova prostřednictvím vysoce výkonného molekulárního dokování". Aktuální názor na objev a vývoj drog. 10 (3): 264–74. PMID 17554852.
- ^ Foloppe N, Hubbard R (2006). „Směrem k prediktivnímu návrhu ligandu s výpočetními metodami založenými na volné energii?“. Současná léčivá chemie. 13 (29): 3583–608. doi:10.2174/092986706779026165. PMID 17168725.
- ^ Fenu LA, Lewis RA, Good AC, Bodkin M, Essex JW (2007). „Kapitola 9: Bodovací funkce: Od volných energií vazby k obohacení ve virtuálním screeningu“. In Dhoti H, Leach AR (eds.). Strukturovaný objev drog. Dordrecht: Springer. str. 223–246. ISBN 978-1-4020-4407-6.
- ^ Sotriffer C, Matter H (2011). „Kapitola 7.3: Třídy bodovacích funkcí“. In Sotriffer C (ed.). Virtuální screening: Zásady, výzvy a praktické pokyny. 48. John Wiley & Sons, Inc. ISBN 978-3-527-63334-0.
- ^ A b C Ain QU, Aleksandrova A, Roessler FD, Ballester PJ (2015-11-01). „Funkce bodování strojového učení pro zlepšení predikce vazebné afinity na základě struktury a virtuálního screeningu“. Wiley Interdisciplinary Reviews: Computational Molecular Science. 5 (6): 405–424. doi:10,1002 / wcms.1225. PMC 4832270. PMID 27110292.
- ^ Genheden S, Ryde U (květen 2015). „Metody MM / PBSA a MM / GBSA pro odhad afinit vázání ligandů“. Znalecké stanovisko k objevu drog. 10 (5): 449–61. doi:10.1517/17460441.2015.1032936. PMC 4487606. PMID 25835573.
- ^ Schneider N, Lange G, Hindle S, Klein R, Rarey M (leden 2013). "Důsledný popis HYdrogenové vazby a DEhydratace energií v komplexech protein-ligand: metody za funkcí HYDE skórování". Journal of Computer-Aided Molecular Design. 27 (1): 15–29. Bibcode:2013JCAMD..27 ... 15S. doi:10.1007 / s10822-012-9626-2. PMID 23269578. S2CID 1545277.
- ^ Lange G, Lesuisse D, Deprez P, Schoot B, Loenze P, Bénard D, Marquette JP, Broto P, Sarubbi E, Mandine E (listopad 2003). „Požadavky na specifickou vazbu fragmentů inhibitoru s nízkou afinitou k doméně SH2 (pp60) Src jsou identické s požadavky na vazbu s vysokou afinitou k inhibitorům plné délky“. Journal of Medicinal Chemistry. 46 (24): 5184–95. doi:10.1021 / jm020970s. PMID 14613321.
- ^ Muegge I (říjen 2006). "Znovu navštíveno bodování PMF". Journal of Medicinal Chemistry. 49 (20): 5895–902. doi:10.1021 / jm050038s. PMID 17004705.
- ^ Ballester PJ, Mitchell JB (květen 2010). „Přístup strojového učení k předpovídání vazebné afinity protein-ligand s aplikacemi pro molekulární dokování“. Bioinformatika. 26 (9): 1169–75. doi:10.1093 / bioinformatika / btq112. PMC 3524828. PMID 20236947.
- ^ Li H, Leung KS, Wong MH, Ballester PJ (únor 2015). „Zlepšení aplikace AutoDock Vina pomocí náhodného lesa: Rostoucí přesnost vazebné predikce afinity efektivním využíváním větších datových sad“. Molekulární informatika. 34 (2–3): 115–26. doi:10.1002 / minf.201400132. PMID 27490034.
- ^ Ashtawy HM, Mahapatra NR (01.04.2015). „Srovnávací hodnocení prediktivních přesností konvenčních a bodovacích funkcí strojového učení pro predikci afinity vázající protein a ligand“. Transakce IEEE / ACM na výpočetní biologii a bioinformatiku. 12 (2): 335–47. doi:10.1109 / TCBB.2014.2351824. PMID 26357221.
- ^ Zhan W, Li D, Che J, Zhang L, Yang B, Hu Y, Liu T, Dong X (březen 2014). „Integrace dokovacích skóre, interakčních profilů a molekulárních deskriptorů ke zlepšení přesnosti molekulárního dokování: směrem k objevu nových inhibitorů Akt1“. European Journal of Medicinal Chemistry. 75: 11–20. doi:10.1016 / j.ejmech.2014.01.019. PMID 24508830.
- ^ Kinnings SL, Liu N, Tonge PJ, Jackson RM, Xie L, Bourne PE (únor 2011). „Metoda založená na strojovém učení ke zlepšení funkcí bodování v doku a její aplikace na opětovné použití drog“. Journal of Chemical Information and Modeling. 51 (2): 408–19. doi:10.1021 / ci100369f. PMC 3076728. PMID 21291174.
- ^ Li H, Sze K-H, Lu G, Ballester PJ (2020-02-05). „Funkce bodování strojového učení pro optimalizaci olova drog na základě struktury“. Wiley Interdisciplinary Reviews: Computational Molecular Science. 10 (5). doi:10,1002 / wcms.1465.
- ^ Li L, Wang B, Meroueh SO (září 2011). „Podpora vektorového skóre regrese komplexů receptor-ligand pro pořadí a virtuální screening chemických knihoven“. Journal of Chemical Information and Modeling. 51 (9): 2132–8. doi:10.1021 / ci200078f. PMC 3209528. PMID 21728360.
- ^ Durrant JD, Friedman AJ, Rogers KE, McCammon JA (červenec 2013). „Porovnání funkcí hodnocení neuronových sítí a nejnovějších poznatků: aplikace k běžnému screeningu knihoven“. Journal of Chemical Information and Modeling. 53 (7): 1726–35. doi:10.1021 / ci400042y. PMC 3735370. PMID 23734946.
- ^ Ding B, Wang J, Li N, Wang W (leden 2013). "Charakterizace vazby malých molekul. I. Přesná identifikace silných inhibitorů při virtuálním screeningu". Journal of Chemical Information and Modeling. 53 (1): 114–22. doi:10,1021 / ci300508m. PMC 3584174. PMID 23259763.
- ^ Wójcikowski M, Ballester PJ, Siedlecki P (duben 2017). „Performance of machine-learning scoring functions in structure-based virtual screening“. Vědecké zprávy. 7: 46710. Bibcode:2017NatSR ... 746710W. doi:10.1038 / srep46710. PMC 5404222. PMID 28440302.
- ^ Ragoza M, Hochuli J, Idrobo E, Sunseri J, Koes DR (duben 2017). „Protein-ligandové hodnocení pomocí konvolučních neuronových sítí“. Journal of Chemical Information and Modeling. 57 (4): 942–957. arXiv:1612.02751. doi:10.1021 / acs.jcim.6b00740. PMC 5479431. PMID 28368587.
- ^ Li H, Peng J, Leung Y, Leung KS, Wong MH, Lu G, Ballester PJ (březen 2018). „Dopad struktury proteinů a podobnosti sekvencí na přesnost bodovacích funkcí strojového učení pro vazebnou predikci afinity“. Biomolekuly. 8 (1): 12. doi:10,3390 / biom8010012. PMC 5871981. PMID 29538331.
- ^ Shen C, Ding J, Wang Z, Cao D, Ding X, Hou T (2019-06-27). „Od strojového učení k hlubokému učení: pokroky v bodovacích funkcích pro dokování protein-ligand“. Wiley Interdisciplinary Reviews: Computational Molecular Science. 10. doi:10,1002 / wcms.1429.
- ^ Yang X, Wang Y, Byrne R, Schneider G, Yang S (2019-07-11). „Koncepty umělé inteligence pro objevování drog pomocí počítače“. Chemické recenze. 119 (18): 10520–10594. doi:10.1021 / acs.chemrev.8b00728. PMID 31294972.
- ^ Li H, Sze K-H, Lu G, Ballester PJ (2020-04-22). "Funkce bodování strojového učení pro virtuální screening na základě struktury". Wiley Interdisciplinary Reviews: Computational Molecular Science. doi:10,1002 / wcms.1478.
- ^ Li H, Peng J, Sidorov P, Leung Y, Leung KS, Wong MH, Lu G, Ballester PJ (březen 2019). "Klasické skórovací funkce pro dokování nemohou využívat velké objemy strukturálních a interakčních dat". Bioinformatika. Oxford, Anglie. 35 (20): 3989–3995. doi:10.1093 / bioinformatika / btz183. PMID 30873528.
- ^ Englebienne P, Moitessier N (červen 2009). „Dokovací ligandy do flexibilních a solvatovaných makromolekul. 4. Jsou oblíbené skórovací funkce přesné pro tuto třídu proteinů?“. Journal of Chemical Information and Modeling. 49 (6): 1568–80. doi:10.1021 / ci8004308. PMID 19445499.
- ^ Oda A, Tsuchida K, Takakura T, Yamaotsu N, Hirono S (2006). „Srovnání konsensuálních strategií pro hodnocení výpočetních modelů komplexů protein-ligand“. Journal of Chemical Information and Modeling. 46 (1): 380–91. doi:10.1021 / ci050283k. PMID 16426072.
- ^ Hellgren M, Carlsson J, Ostberg LJ, Staab CA, Persson B, Höög JO (září 2010). "Obohacení ligandů molekulárními doky a následná charakterizace pro lidskou alkohol dehydrogenázu 3". Buněčné a molekulární biologické vědy. 67 (17): 3005–15. doi:10.1007 / s00018-010-0370-2. PMID 20405162. S2CID 2391130.