Výzva SAMPL - SAMPL Challenge
VZOREK (Statistické hodnocení modelování proteinů a ligandů) je sada pro celou komunitu slepé výzvy zaměřené na pokročilé výpočetní techniky jako standardní prediktivní nástroje v systému Windows racionální design léků.[1][2][3][4][5] Široká škála biologicky relevantních systémů s různými velikostmi a úrovněmi složitosti včetně bílkoviny, hostitel – host Pro testování nejnovějších metod modelování a silových polí v SAMPL byly vybrány komplexy a malé molekuly podobné lékům. Nová experimentální data, jako např vazebná afinita a energie bez hydratace, jsou zadrženy účastníkům až do termínu předpovědi předpovědi, aby to byla pravda prediktivní síla lze odhalit několik metod. Nejnovější výzva SAMPL5 obsahuje dvě kategorie predikce: vazebnou afinitu systémů host-host a distribuční koeficienty molekul podobných léku mezi vodou a cyklohexanem.[6][7] Od roku 2008 přitahuje řada výzev SAMPL široký zájem vědců působících v oblasti počítačově podporovaný design léčiv (CADD) po celém světě a jeho výsledkem je více než 100 publikací, přičemž mnoho z nich je vysoce citovaných.[8][9][10] Mezi aktuální organizátory SAMPL patří prof. John Chodera z Memorial Sloan Kettering Cancer Center, prof. Michael K. Gilson z University of California, San Diego, prof. David Mobley z University of California, Irvine a prof. Michael Shirts, z University of California. Colorado, Boulder.[11]
Význam projektu
Úkolem SAMPL je urychlit pokrok ve vývoji kvantitativních a přesných nástrojů pro objevování léčiv poskytnutím prospektivní validace a důsledného srovnání výpočetních metod a silových polí. Počítačem podporované metody navrhování léčiv byly v průběhu času značně vylepšeny, spolu s rychlým růstem vysoce výkonných výpočetních schopností. Jejich použitelnost ve farmaceutickém průmyslu je však stále velmi omezená kvůli nedostatečné přesnosti. Metody postrádající potenciální validace ve velkém měřítku mají tendenci trpět přesahováním již existujících experimentálních dat. Abychom to překonali, byly výzvy SAMPL organizovány jako slepé testy: pokaždé, když jsou nové datové sady pečlivě navrženy a shromážděny z akademických nebo průmyslových výzkumných laboratoří, a měření jsou vydána krátce po termínu předložení predikce. Vědci pak mohou porovnat tyto vysoce kvalitní, perspektivní experimentální údaje s předloženými odhady. Klíčový důraz je kladen na získané zkušenosti, což umožňuje účastníkům budoucích výzev těžit z vylepšení modelování provedených na základě dřívějších výzev.
SAMPL se historicky zaměřoval na vlastnosti systémů host-host a malé molekuly podobné drogám. Tyto jednoduše modelové systémy vyžadují k simulaci podstatně méně výpočetních zdrojů ve srovnání s proteinovými systémy, a umožňují tak mnohem rychlejší konvergenci. Díky pečlivému návrhu lze mezitím tyto modelové systémy použít k zaměření na jednu konkrétní nebo podmnožinu simulačních výzev.[12] Minulé výzvy SAMPL host - host, energie bez hydratace a log D odhalily omezení v generalizovaných silových polích,[13][14] usnadnil vývoj solventních modelů,[15][16] a zdůraznil význam správného zacházení s protonačními stavy a účinky solí.[17][18]
Účast
Registrace a účast na výzvách SAMPL je zdarma. Počínaje SAMPL7 byla data účasti na výzvě zveřejněna na Web SAMPL,[19] stejně jako Stránka GitHub pro konkrétní výzvu. Pokyny, vstupní soubory a výsledky byly poté poskytovány prostřednictvím GitHubu (dřívější výzvy poskytovaly obsah primárně prostřednictvím D3R pro SAMPL4-5 a jinými prostředky pro dřívější SAMPLy). Účastníkům bylo umožněno zadávat více předpovědí prostřednictvím webových stránek D3R, a to buď anonymně, nebo s příslušným výzkumem. Od výzvy SAMPL2 byli všichni účastníci pozváni na semináře SAMPL a předkládali rukopisy popisující jejich výsledky. Po procesu vzájemného hodnocení byly výsledné práce spolu s přehledovými pracemi, které shrnují všechna předkládající data, publikovány ve zvláštních číslech Journal of Computer-Aided Molecular Design.[20]
Financování
Projekt SAMPL byl nedávno financován NIH (grant GM124270-01A1), na období září 2018 až srpna 2022, aby bylo možné navrhnout budoucí výzvy SAMPL, které povedou k pokroku v oblastech, které jsou pro modelování nejvíce potřebné.[9][10] Za tímto úsilím stojí David L. Mobley (UC Irvine) a spoluřešitelé John D. Chodera (MSKCC), Bruce C. Gibb (Tulane) a Lyle Isaacs (Maryland). V současné době probíhají výzvy a workshopy ve spolupráci s NIH Zdroj dat o designu léčiv, ale to se pravděpodobně časem změní, protože financování těchto dvou projektů není spojeno.
Financování rovněž umožnilo rozšíření rozsahu SAMPL; prostřednictvím SAMPL6 byla jeho role považována za primárně zaměřenou na fyzikální vlastnosti, přičemž D3R zvládal výzvy protein-ligand. Financované úsilí však rozšířilo své zaměření na systémy, které povedou ke zlepšení v modelování, včetně potenciálně vhodných systémů protein-ligand. To je stále v kontrastu s D3R, který se spoléhá na darované datové sady farmaceutického zájmu, zatímco výzvy SAMPL jsou speciálně navrženy tak, aby se zaměřily na konkrétní výzvy modelování.
Dějiny
Dřívější výzvy SAMPL
První cvičení SAMPL, SAMPL0 (2008)[21] se zaměřil na předpovědi solvatací volných energií 17 malých molekul. Výzkumná skupina v Stanfordská Univerzita a vědci v OpenEye Scientific Software provedl výpočty. Navzdory neformálnímu formátu položil SAMPL0 základy pro následující výzvy SAMPL.
SAMPL1 (2009)[22] a SAMPL2 výzvy (2010)[1] byly organizovány společností OpenEye a nadále se zaměřovaly na předpovídání solvatací volných energií malých molekul podobných drogám. Byly také provedeny pokusy předpovědět vazebné afinity, vazebné pózy a tautomerní poměry. Obě výzvy přilákaly významnou účast výpočetních vědců a vědců v akademické sféře a průmyslu.
SAMPL3 a SAMPL4
Zaslepené datové sady pro vazebné afinity host-host byly představeny poprvé v SAMPL3 (2011-2012),[3] spolu s energiemi bez solvatace pro malé molekuly a daty vazebné afinity pro 500 fragmentů podobných tyrosinových inhibitorů. Tři hostitelské molekuly byly všechny z cucurbituril rodina. Výzva SAMPL3 obdržela 103 příspěvků od 23 výzkumných skupin po celém světě.[2]
Na rozdíl od předchozích tří událostí SAMPL, cvičení SAMPL4 (2013-2014)[4][5] byl koordinován akademickými vědci s logistickou podporou OpenEye. Datové sady v SAMPL4 sestávaly z vazebných afinit pro systémy host-host a Inhibitory HIV integrázy, stejně jako energie malých molekul bez hydratace. Mezi hostitelské molekuly patřil cucurbit [7] uril (CB7) a okta-kyselina. Hydratační výzva SAMPL4 zahrnovala 49 podání od 19 skupin. Ve srovnání s SAMPL3 také významně vzrostla účast výzvy host - host. Workshop se konal na Stanford University v září 2013.
VZOREK 5
Výzvy protein-ligand byly odděleny od SAMPL v SAMPL5 (2015-2016)[6][7] a byly distribuovány jako nové Velké výzvy zdroje údajů o designu léčiv (D3R).[23] SAMPL5 umožňoval účastníkům předpovídat vazebné afinity tří sad systémů host-host: acyklický derivát CB7 a dva hostitelé z rodiny okta-kyselin. Účastníci byli také vyzváni, aby předložili předpovědi o vázání entalpií. Byla testována široká škála výpočetních metod, včetně hustota funkční teorie (DFT), molekulární dynamika, dokování a metadynamika. The distribuční koeficient byly poprvé představeny předpovědi, které obdržely celkem 76 příspěvků od 18 výzkumných skupin nebo vědců pro soubor 53 malých molekul. Workshop se konal v březnu 2016 v University of California, San Diego v rámci workshopu D3R. Nejvýkonnější metody ve výzvě host-host přinesly povzbudivé, ale nedokonalé korelace s experimentálními daty, doprovázené velkými, systematickými posuny v porovnání s experimentem.[24][25]
SAMPL6
Testovací systémy SAMPL6 zahrnují cucurbit [8] uril, okta-kyselinu, tetra-endo-methyl-okta-kyselinu a řadu malých fragmentů podobných molekul. Host-host, konformační vzorkování a výzvy predikce pKa SAMPL6 jsou nyní uzavřeny. Workshop SAMPL6 proběhl společně s workshopem D3R ve dnech 22. a 23. února 2018 v Scripps Institution of Oceanography, La Jolla, CA (https://drugdesigndata.org//about/d3r-2018-workshop) a nedávné Speciální vydání SAMPL z Journal of Computer Aided Molecular Design uvedli mnoho výsledků. Výzva SAMPL6 část II zaměřená na malé rozdělovací koeficient oktanol-voda sada predikcí a po ní následoval virtuální workshop 16. května 2019 a společný workshop D3R / SAMPL v San Diegu 22. - 23. srpna 2019, bezprostředně před národním zasedáním ACS v San Diegu. Ke zveřejnění výsledků je plánováno speciální vydání nebo speciální sekce JCAMD. Vstupy SAMPL6 a (jak jsou dokončeny komponenty výzvy, výsledky) jsou k dispozici na webu Úložiště SAMPL6 GitHub.
VZORK7
SAMPL7 opět zahrnoval výzvy host-host a výzvu fyzických vlastností. Rovněž byla zahrnuta výzva vázání protein-ligand na fragmentech PHIPA. Vazba host-host zaměřená na několik malých molekul vázajících se na okta-kyselinu a exo-okta-kyselinu; vazba dvou sloučenin na řadu derivátů cyklodextrinu; a navázání řady malých molekul na sponkovitého hosta známého jako TrimerTrip. Proběhl virtuální workshop SAMPL7 a je k dispozici online. Výzva fyzikálních vlastností SAMPL7 právě probíhá. Plány osobního workshopu EuroSAMPL na podzim 2020 byly vykolejeny programem COVID-19 a workshop probíhá prakticky. Vstupy SAMPL7 a (jak jsou dokončeny komponenty výzvy, výsledky) jsou k dispozici na webu Úložiště SAMPL6 GitHub.
VZORK8
První fáze SAMPL8 se zaměřuje na vazebné předpovědi užívání drog mezi hostitelem a hostem na CB8, jak je podrobně uvedeno na Úložiště SAMPL8 GitHub. Zbývající komponenty SAMPL8 se stále plánují.
Zvláštní vydání SAMPL
Budoucí výzvy
SAMPL je připraven pokračovat ve svém zaměření na predikci fyzických vlastností, včetně hodnot logP a logD, predikce pKa, vazby host-host a dalších vlastností, stejně jako rozšíření o komponentu protein-ligand.[9] Plánuje se, že některá data budou shromažďována přímo spoluřešiteli SAMPL (Chodera, Gibb a Isaacs), ale navrhují se také průmyslová partnerství a stáže.[9]
Viz také
Reference
- ^ A b Geballe, Matthew T .; Skillman, A. Geoffrey; Nicholls, Anthony; Guthrie, J. Peter; Taylor, Peter J. (09.05.2010). "Výzva pro slepou predikci SAMPL2: úvod a přehled". Journal of Computer-Aided Molecular Design. 24 (4): 259–279. doi:10.1007 / s10822-010-9350-8. ISSN 0920-654X. PMID 20455007.
- ^ A b Skillman, A. Geoffrey (2012-05-24). „SAMPL3: zaslepená předpověď vazebných afinit host-host, energie bez hydratace a inhibitory trypsinu“. Journal of Computer-Aided Molecular Design. 26 (5): 473–474. doi:10.1007 / s10822-012-9580-z. ISSN 0920-654X. PMID 22622621.
- ^ A b Muddana, Hari S .; Varnado, C. Daniel; Bielawski, Christopher W .; Urbach, Adam R .; Isaacs, Lyle; Geballe, Matthew T .; Gilson, Michael K. (2012-02-25). „Slepá předpověď vazeb mezi hostitelem a hosty: nová výzva SAMPL3“. Journal of Computer-Aided Molecular Design. 26 (5): 475–487. doi:10.1007 / s10822-012-9554-1. ISSN 0920-654X. PMC 3383923. PMID 22366955.
- ^ A b Muddana, Hari S .; Fenley, Andrew T .; Mobley, David L .; Gilson, Michael K. (06.03.2014). „Výzva slepého predikce hostitele a hosta SAMPL4: přehled“. Journal of Computer-Aided Molecular Design. 28 (4): 305–317. doi:10.1007 / s10822-014-9735-1. ISSN 0920-654X. PMC 4053502. PMID 24599514.
- ^ A b Mobley, David L .; Wymer, Karisa L .; Lim, Nathan M .; Guthrie, J. Peter (11.03.2014). „Slepá předpověď solvatace volných energií z výzvy SAMPL4“. Journal of Computer-Aided Molecular Design. 28 (3): 135–150. doi:10.1007 / s10822-014-9718-2. ISSN 0920-654X. PMC 4006301. PMID 24615156.
- ^ A b Yin, Jian; Henriksen, Niel M .; Slochower, David R .; Shirts, Michael R .; Chiu, Michael W .; Mobley, David L .; Gilson, Michael K. (2016-09-22). „Přehled výzvy hostitele SAMPL5: Děláme si lépe?“. Journal of Computer-Aided Molecular Design. 31 (1): 1–19. doi:10.1007 / s10822-016-9974-4. ISSN 0920-654X. PMC 5241188. PMID 27658802.
- ^ A b Bannan, Caitlin C .; Burley, Kalistyn H .; Chiu, Michael; Shirts, Michael R .; Gilson, Michael K .; Mobley, David L. (2016-09-27). „Slepá predikce koeficientů distribuce cyklohexan – voda z výzvy SAMPL5“. Journal of Computer-Aided Molecular Design. 30 (11): 927–944. doi:10.1007 / s10822-016-9954-8. ISSN 0920-654X. PMC 5209301. PMID 27677750.
- ^ L, Mobley, David; D, Chodera, John; K, Gilson, Michael (2017-06-21). „Výsledky průzkumu Roadmap 2017 pro komunitu výzev statistického hodnocení modelování proteinů a ligandů (SAMPL)“. ES stipendium.
- ^ A b C d Mobley, David L .; Chodera, John D .; Isaacs, Lyle; Gibb, Bruce C. (2016). „Pokrok v prediktivním modelování prostřednictvím cíleného vývoje modelových systémů pro podporu nových inovací modelování“. Zenodo. doi:10,5281 / zenodo.163963.
- ^ A b Mobley, David L. (10.10.2016). „Pokrok v prediktivním modelování prostřednictvím cíleného vývoje modelových systémů pro podporu nových inovací modelování“. eScholarship.
- ^ „D3R | SAMPL“.
- ^ Mobley, David L .; Gilson, Michael K. (08.12.2016). "Predikce vázání volných energií: Hranice a měřítka". bioRxiv 10.1101/074625.
- ^ Muddana, Hari S .; Gilson, Michael K. (2012-01-25). „Predikce vazebných vazeb hostitele a hosta SAMPL3: hodnocení přesnosti zobecněných silových polí“. Journal of Computer-Aided Molecular Design. 26 (5): 517–525. doi:10.1007 / s10822-012-9544-3. ISSN 0920-654X. PMC 3383906. PMID 22274835.
- ^ Mobley, David L .; Liu, Shaui; Cerutti, David S .; Swope, William C .; Rice, Julia E. (2011-12-24). „Alchemical prediction of hydratation free energies for SAMPL“. Journal of Computer-Aided Molecular Design. 26 (5): 551–562. doi:10.1007 / s10822-011-9528-8. ISSN 0920-654X. PMC 3583515. PMID 22198475.
- ^ Pal, Rajat Kumar; Haider, Kamran; Kaur, Divya; Flynn, William; Xia, Junchao; Levy, Ronald M .; Taran, Tetiana; Wickstrom, Lauren; Kurtzman, Tom; Gallicchio, Emilio (30. 9. 2016). „Kombinovaná léčba hydratace a dynamických účinků pro modelování termodynamiky vazby host-host: zaslepená výzva SAMPL5“. Journal of Computer-Aided Molecular Design. 31 (1): 29–44. doi:10.1007 / s10822-016-9956-6. ISSN 0920-654X. PMC 5477994. PMID 27696239.
- ^ Brini, Emiliano; Paranahewage, S. Shanaka; Fennell, Christopher J .; Dill, Ken A. (2016-09-08). „Přizpůsobení poloexplicitního modelu solvatace solvatace pro odhad dělení voda-cyklohexan s molekulami SAMPL5“. Journal of Computer-Aided Molecular Design. 30 (11): 1067–1077. doi:10.1007 / s10822-016-9961-9. ISSN 0920-654X. PMC 5261860. PMID 27632227.
- ^ Jistě, Rebecca; Antony, Jens; Grimme, Stefan (2014-03-27). „Slepá předpověď vazebných afinit pro nabité supramolekulární systémy host – host: úspěchy a nedostatky DFT-D3“. The Journal of Physical Chemistry B. 118 (12): 3431–3440. doi:10.1021 / jp411616b. ISSN 1520-6106. PMID 24588346.
- ^ Klamt, Andreas; Eckert, Frank; Reinisch, Jens; Wichmann, Karin (26. 7. 2016). "Predikce koeficientů distribuce cyklohexan-voda s COSMO-RS na datové sadě SAMPL5". Journal of Computer-Aided Molecular Design. 30 (11): 959–967. doi:10.1007 / s10822-016-9927-r. ISSN 0920-654X. PMID 27460058.
- ^ „SAMPL | Výzvy“. samplchallenges.github.io. Citováno 2020-07-03.
- ^ „Journal of Computer-Aided Molecular Design - All Volumes & Issues - Springer“. link.springer.com. Citováno 2017-01-12.
- ^ Nicholls, Anthony; Mobley, David L .; Guthrie, J. Peter; Chodera, John D .; Bayly, Christopher I .; Cooper, Matthew D .; Pande, Vijay S. (2008-02-01). „Predikce energií volných pro řešení malých molekul: neformální slepý test pro výpočetní chemii“. Journal of Medicinal Chemistry. 51 (4): 769–779. doi:10.1021 / jm070549 +. ISSN 0022-2623. PMID 18215013.
- ^ Guthrie, J. Peter (2009-04-09). „Slepá výzva pro výpočetní energie bez řešení: Úvod a přehled“. The Journal of Physical Chemistry B. 113 (14): 4501–4507. doi:10.1021 / jp806724u. ISSN 1520-6106. PMID 19338360.
- ^ Gathiaka, Symon; Liu, Shuai; Chiu, Michael; Yang, Huanwang; Stuckey, Jeanne A .; Kang, ty Na; Delproposto, Jim; Kubish, Ginger; Dunbar, James B. (2016-09-30). „D3R grand challenge 2015: Evaluation of protein-ligand pose and affinity predictions“. Journal of Computer-Aided Molecular Design. 30 (9): 651–668. doi:10.1007 / s10822-016-9946-8. ISSN 0920-654X. PMC 5562487. PMID 27696240.
- ^ Yin, Jian; Henriksen, Niel M .; Slochower, David R .; Gilson, Michael K. (2016-09-16). „Výzva hostitele a hosta SAMPL5: výpočet vazebných volných energií a entalpií z explicitních simulací rozpouštědel metodou attach-pull-release (APR)“. Journal of Computer-Aided Molecular Design. 31 (1): 133–145. doi:10.1007 / s10822-016-9970-8. ISSN 0920-654X. PMC 5241238. PMID 27638809.
- ^ Bosisio, Stefano; Mey, Antonia S. J. S .; Michel, Julien (08.08.2016). „Zaslepené předpovědi standardních volných energií hostitele a hosta vazby ve výzvě SAMPL5“. Journal of Computer-Aided Molecular Design. 31 (1): 61–70. doi:10.1007 / s10822-016-9933-0. ISSN 0920-654X. PMID 27503495.