CASP - CASP

Kritické hodnocení predikce proteinové strukturynebo CASP, je celosvětový experiment pro celou komunitu predikce proteinové struktury koná se každé dva roky od roku 1994.[1] CASP poskytuje výzkumným skupinám příležitost objektivně otestovat jejich metody predikce struktury a poskytuje nezávislé hodnocení nejnovějšího stavu modelování proteinové struktury výzkumné komunitě a uživatelům softwaru. Přestože primárním cílem CASP je pomoci pokročit v metodách identifikace protein Díky trojrozměrné struktuře aminokyselinové sekvence mnozí považují experiment spíše za „mistrovství světa“ v této oblasti vědy. Více než 100 výzkumných skupin z celého světa se pravidelně účastní CASP a není neobvyklé, že celé skupiny pozastaví svůj další výzkum na měsíce, zatímco se soustředí na přípravu svých serverů na experiment a na provádění podrobných předpovědí.
Výběr cílových proteinů
Aby bylo zajištěno, že žádný prediktor nemůže mít předchozí informace o struktuře proteinu, která by mu poskytla výhodu, je důležité, aby byl experiment prováděn dvojitě zaslepeným způsobem: Ani prediktory, ani organizátoři a hodnotitelé tyto struktury neznají cílových proteinů v době, kdy jsou stanoveny předpovědi. Cíle pro predikci struktury jsou struktury, které brzy vyřeší Rentgenová krystalografie nebo NMR spektroskopie nebo struktury, které byly právě vyřešeny (hlavně jednou z centra strukturní genomiky ) a jsou přidrženy Proteinová datová banka. Pokud se zjistí, že daná sekvence souvisí běžným sestupem s proteinovou sekvencí známé struktury (nazývanou templát), srovnávací modelování proteinů lze použít k předpovědi terciární struktura. Šablony najdete pomocí zarovnání sekvence metody (např. VÝBUCH nebo HHsearch ) nebo navlékání bílkovin metody, které jsou lepší při hledání vzdáleně souvisejících šablon. V opačném případě, de novo predikce proteinové struktury musí být aplikován (např. Rosetta), což je mnohem méně spolehlivé, ale někdy může přinést modely se správným násobkem (obvykle u proteinů s méně než 100 - 150 aminokyselinami). Skutečně nové záhyby se mezi cíli stávají poměrně vzácnými,[2][3] čímž je tato kategorie menší, než je žádoucí.
Hodnocení
Primární metoda hodnocení[4] je srovnání predikovaného modelu α-uhlík pozice s těmi v cílové struktuře. Porovnání je vizuálně znázorněno kumulativními grafy vzdáleností mezi dvojicemi ekvivalentů α-uhlík v zarovnání modelu a struktury, jak je znázorněno na obrázku (dokonalý model by zůstal na nule po celé délce), a je mu přiřazeno číselné skóre GDT-TS (globální test vzdálenosti - celkové skóre) popisující procento dobře modelovaných zbytků v modelu s ohledem na cíl.[5] Zdarma modelování (bez šablon nebo de novo) hodnotitelé hodnotí také vizuálně, protože numerické skóre nefunguje ani v nejobtížnějších případech při hledání volné podobnosti.[6] Vysoce přesné předpovědi založené na šabloně byly v CASP7 hodnoceny podle toho, zda fungovaly pro fázovou substituci cílové krystalové struktury pomocí molekulární náhrady.[7] s úspěchy následoval později,[8] a podle plného modelu (nejen α-uhlík ) kvalita modelu a full-model se shodují s cílem v CASP8.[9]
Vyhodnocení výsledků se provádí v následujících kategoriích predikce:
- terciární struktura predikce (všechny CASP)
- predikce sekundární struktury (zrušeno po CASP5)
- předpověď strukturní komplexy (Pouze CASP2; samostatný experiment - CAPRI - pokračuje v tomto tématu)
- predikce kontaktu zbytek-zbytek (počínaje CASP4)
- neuspořádané oblasti předpověď (počínaje CASP5)
- doména hraniční predikce (CASP6 – CASP8)
- funkce předpověď (počínaje CASP6)
- hodnocení kvality modelu (od CASP7)
- upřesnění modelu (počínaje CASP7)
- vysoce přesná předpověď založená na šabloně (počínaje CASP7)
Kategorie predikce terciární struktury byla dále rozdělena na
- homologické modelování
- rozpoznání skládání (také nazývané navlékání bílkovin; Toto je nesprávné, protože threading je metoda)
- de novo predikce struktury, nyní označovaná jako „New Fold“, protože mnoho metod aplikuje vyhodnocení nebo skórování funkcí, které jsou ovlivněny znalostmi nativních proteinových struktur, jako je umělá neurální síť.
Počínaje CASP7 byly kategorie předefinovány tak, aby odrážely vývoj metod. Kategorie „Modelování založené na šabloně“ zahrnuje všechny dřívější srovnávací modelování, modely založené na homologním skládání a některé analogické modely skládání. Kategorie „šablony bez modelování (FM)“ zahrnuje modely proteinů s dříve neviditelnými záhyby a tvrdé analogické modely založené na záhybech. Vzhledem k omezenému počtu cílů bez šablon (jsou poměrně vzácné) byl v roce 2011 představen tzv. CASP ROLL. Tento kontinuální (průběžný) experiment CASP si klade za cíl přísnější vyhodnocení metod předpovědi bez šablon prostřednictvím hodnocení většího počtu cílů mimo běžnou predikční sezónu CASP. Na rozdíl od LiveBench a EVA, tento experiment je v duchu slepé predikce CASP, tj. všechny předpovědi jsou prováděny na dosud neznámých strukturách.[10]
Výsledky CASP jsou publikovány ve zvláštních přílohách vědeckého časopisu Proteiny, které jsou všechny přístupné prostřednictvím webových stránek CASP.[11] Hlavní článek v každém z těchto doplňků popisuje specifika experimentu[12][13]zatímco závěrečný článek hodnotí pokrok v oboru.[14][15]
CASP13
V prosinci 2018 se CASP13 dostal na titulní stránky, když vyhrál AlphaFold, an umělá inteligence program vytvořil DeepMind.[16]
CASP14
V listopadu 2020 byla vylepšena verze 2 AlphaFold vyhrál CASP14,[17][18] se skóre téměř 90 na 100bodové stupnici přesnosti predikce.[19]
Viz také
Reference
- ^ Moult, J .; et al. (1995). „Rozsáhlý experiment k hodnocení metod predikce proteinové struktury“. Proteiny. 23 (3): ii – iv. doi:10,1002 / prot. 340230303. PMID 8710822. S2CID 11216440.
- ^ Tress, M .; et al. (2009). "Definice a klasifikace cílové domény v CASP8". Proteiny. 77 (Suppl 9): 10–17. doi:10,1002 / prot. 22497. PMC 2805415. PMID 19603487.
- ^ Zhang Y, Skolnick J (2005). „Problém predikce proteinové struktury lze vyřešit pomocí aktuální knihovny PDB“. Proc Natl Acad Sci USA. 102 (4): 1029–1034. Bibcode:2005PNAS..102.1029Z. doi:10.1073 / pnas.0407152101. PMC 545829. PMID 15653774.
- ^ Cozzetto, D .; et al. (2009). „Hodnocení modelů založených na šablonách v CASP8 se standardními měřítky“. Proteiny. 77 (Suppl 9): 18–28. doi:10,1002 / prot.22561. PMC 4589151. PMID 19731382.
- ^ Zemla A (2003). „LGA: Metoda pro zjištění 3D podobností v proteinových strukturách“. Výzkum nukleových kyselin. 31 (13): 3370–3374. doi:10.1093 / nar / gkg 571. PMC 168977. PMID 12824330.
- ^ Ben-David, M .; et al. (2009). "Hodnocení predikcí struktury CASP8 pro cíle bez šablon". Proteiny. 77 (Suppl 9): 50–65. doi:10,1002 / prot.22591. PMID 19774550. S2CID 16517118.
- ^ Read, R.J .; Chavali, G. (2007). "Hodnocení predikcí CASP7 v kategorii vysoce přesného modelování založeného na šabloně". Proteiny: struktura, funkce a bioinformatika. 69 (Suppl 8): 27–37. doi:10,1002 / prot.21662. PMID 17894351. S2CID 33172629.
- ^ Qian, B .; et al. (2007). „Predikce struktury s vysokým rozlišením a problém krystalografické fáze“. Příroda. 450 (7167): 259–264. Bibcode:2007 Natur.450..259Q. doi:10.1038 / nature06249. PMC 2504711. PMID 17934447.
- ^ Keedy, D.A .; Williams, CJ; Headd, JJ; Arendall, WB; Chen, VB; Kapral, GJ; Gillespie, RA; Block, JN; Zemla, A; Richardson, DC; Richardson, JS (2009). „Dalších 90% bílkovin: Hodnocení nad rámec α-uhlíku pro modely založené na šabloně CASP8 a vysoce přesné modely“. Proteiny. 77 (Suppl 9): 29–49. doi:10,1002 / prot.22551. PMC 2877634. PMID 19731372.
- ^ Kryshtafovych, A; Monastyrskyy, B; Fidelis, K (2014). „Infrastruktura predikčního centra CASP a hodnotící opatření v CASP10 a CASP ROLL“. Proteiny: struktura, funkce a bioinformatika. 82 Suppl 2: 7–13. doi:10,1002 / prot.24399. PMC 4396618. PMID 24038551.
- ^ „CASP řízení“.
- ^ Moult, J .; et al. (2007). „Kritické hodnocení metod predikce proteinové struktury - kolo VII.“. Proteiny. 69 (Suppl 8): 3–9. doi:10,1002 / prot. 21767. PMC 2653632. PMID 17918729.
- ^ Moult, J .; et al. (2009). "Kritické hodnocení metod predikce proteinové struktury - kolo VIII." Proteiny. 77 (Suppl 9): 1–4. doi:10,1002 / prot.22589. PMID 19774620. S2CID 9704851.
- ^ Kryshtafovych, A .; et al. (2007). "Pokrok z CASP6 na CASP7". Proteiny: struktura, funkce a bioinformatika. 69 (Suppl 8): 194–207. doi:10,1002 / prot.21769. PMID 17918728. S2CID 40200832.
- ^ Kryshtafovych, A .; et al. (2009). „Výsledky CASP8 v kontextu předchozích experimentů“. Proteiny. 77 (Suppl 9): 217–228. doi:10,1002 / prot.22562. PMC 5479686. PMID 19722266.
- ^ Ukázka, Ian (2. prosince 2018). „Google DeepMind předpovídá 3D tvary proteinů“. Opatrovník. Citováno 19. července 2019.
- ^ „AlphaFold: řešení 50 let staré velké výzvy v biologii“. Deepmind. Citováno 30. listopadu 2020.
- ^ „Technologie skládání proteinů DeepMind vyřešila 50 let starou velkou výzvu biologie“. Recenze technologie MIT. Citováno 30. listopadu 2020.
- ^ „To všechno změní“: AI DeepMind dělá obrovský skok v řešení proteinových struktur
externí odkazy
Pořadí výsledků
Automatická hodnocení pro CASP13 (2018)
Automatická hodnocení pro CASP12 (2016)
Automatická hodnocení pro CASP11 (2014)
Automatická hodnocení pro CASP10 (2012)
- Oficiální hodnocení pouze pro servery (127 cílů)
- Oficiální hodnocení pro lidi a servery (71 cílů)
- Hodnocení podle Zhang Lab
Automatická hodnocení pro CASP9 (2010)
- Oficiální hodnocení pouze pro servery (147 cílů)
- Oficiální hodnocení pro lidi a servery (78 cílů)
- Hodnocení podle Grishin Lab (pouze pro server)
- Hodnocení podle laboratoře Grishin (pro člověka a servery)
- Hodnocení podle Zhang Lab
- Hodnocení podle Cheng Lab
Automatická hodnocení pro CASP8 (2008)
- Oficiální hodnocení pouze pro servery
- Oficiální hodnocení pro lidi a servery
- Hodnocení podle Zhang Lab
- Hodnocení podle Grishin Lab
- Hodnocení laboratoře McGuffin
- Hodnocení podle Cheng Lab
Automatická hodnocení pro CASP7 (2006)