I-TASSER - I-TASSER
![]() Potrubí I-TASSER pro predikci struktury a funkce proteinů. | |
Vývojáři | Laboratoř Yang Zhang |
---|---|
webová stránka | zhanglab |
I-TASSER (Játerativní Tzávitování ASSEmbly Refinement) je a bioinformatika metoda pro predikci trojrozměrného strukturního modelu proteinových molekul z aminokyselinových sekvencí.[1] Detekuje šablony struktury z Proteinová datová banka technikou zvanou rozložení (nebo závitování ). Modely struktury plné délky jsou konstruovány opětovným sestavením strukturních fragmentů ze šablon vláken pomocí výměna replik Simulace Monte Carlo. I-TASSER je jedním z nejúspěšnějších predikce proteinové struktury metody v celé komunitě CASP experimenty.
I-TASSER byl rozšířen o předpovědi funkce proteinů založené na struktuře, která poskytuje anotace ligand vazebné místo, genová ontologie a enzymová provize strukturálním porovnáním strukturních modelů cílového proteinu se známými proteiny v databázích proteinových funkcí.[2][3] Má integrovaný online server v Laboratoř Yang Zhang na Michiganská univerzita, Ann Arbor umožňující uživatelům zadávat sekvence a získávat předpovědi struktury a funkcí. Samostatný balíček I-TASSER je k dispozici ke stažení na Web společnosti I-TASSER.
Pořadí v CASP
I-TASSER (jako „Zhang-Server“) byl trvale zařazován mezi nejlepší metody CASP, celospolečenský experiment, který má srovnávat nejlepší metody predikce struktury v oblasti skládání bílkovin a predikce proteinové struktury. CASP se koná každé dva roky od roku 1994.[4]
- Č. 1 v CASP7 (2006) [5]
- Č. 1 v CASP8 (2008): Oficiální hodnocení CASP8 (164 cílů)
- Č. 2 v CASP9 (2010): Oficiální hodnocení CASP9 (147 cílů)
- Č. 1 v CASP10 (2012): Oficiální hodnocení CASP10 (127 cílů)
- Č. 1 v CASP11 (2014): Oficiální hodnocení CASP11 (126 cílů)
- Č. 1 v CASP12 (2016): Oficiální hodnocení CASP12 (96 cílů)
- Č. 1 v CASP13 (2018): Oficiální hodnocení CASP13 (112 cílů)
Metoda a potrubí
I-TASSER je metoda založená na šabloně pro predikci struktury a funkce proteinu.[1] Potrubí se skládá ze šesti po sobě jdoucích kroků:
- 1, Predikce sekundární struktury pomocí PSSpred
- 2, Detekce šablon pomocí LOMETS[6]
- 3, Sestavení fragmentové struktury pomocí simulace repliky Monte Carlo s replikou[7]
- 4, Výběr modelu seskupením strukturovaných návnad pomocí SPICKERU[8]
- 5, Zdokonalování struktury na atomové úrovni pomocí fragmentované simulace molekulární dynamiky (FG-MD)[9] nebo ModRefiner[10]
- 6, Anotace funkce biologie založené na struktuře pomocí COACH[11]
On-line server
Server I-TASSER umožňuje uživatelům automaticky generovat proteinové struktury a předpovědi funkcí.
- Vstup
- Povinné:
- Aminokyselinová sekvence s délkou od 10 do 1 500 zbytků
- Volitelné (uživatel může poskytnout volitelně omezení a šablony, které usnadní modelování I-TASSER):
- Kontaktujte omezení
- Mapy vzdálenosti
- Zahrnutí speciálních šablon
- Vyloučení speciálních šablon
- Sekundární struktury
- Povinné:
- Výstup
- Predikce struktury:
- Predikce sekundární struktury
- Predikce dostupnosti rozpouštědla
- Top 10 zarovnání závitů od LOMETS
- Top 5 atomových modelů plné délky (seřazeno podle hustoty klastrů)
- Top 10 proteinů v PDB, které jsou strukturálně nejblíže předpovídaným modelům
- Odhadovaná přesnost předpovězených modelů (včetně skóre spolehlivosti všech modelů, předpokládaného TM-skóre a RMSD pro první model a chyby podle reziduí všech modelů)
- Odhad B-faktoru
- Predikce funkce:
- Klasifikace enzymů (EC) a skóre spolehlivosti
- Podmínky genové ontologie (GO) a skóre spolehlivosti
- Místa vázající ligand a skóre spolehlivosti
- Obrázek předpovězených vazebných míst pro ligand
- Predikce struktury:
Samostatné apartmá
Sada I-TASSER Suite je stahovatelný balíček samostatných počítačových programů vyvinutý laboratoří Yang Zhang pro predikci a upřesnění struktury proteinů a anotace proteinové funkce založené na struktuře.[12] Prostřednictvím licence I-TASSER mají vědci přístup k následujícím samostatným programům:
- I-TASSER: Samostatný balíček I-TASSER pro predikci a zdokonalování proteinové 3D struktury.
- COACH: Program anotace funkcí založený na COFACTOR, TM-SITE a S-SITE.
- KOFAKTOR: Program pro vazebné místo pro ligand, predikce EC čísla a GO termínu.
- TM-SITE: Přístup založený na struktuře pro predikci místa vázajícího ligand.
- S-SITE: Přístup založený na sekvenci pro predikci místa vázajícího ligand.
- LOMETS: Sada lokálně nainstalovaných podprocesů pro rozpoznávání skládání proteinů meta-serveru.
- MUSTER: Řetězcový program pro identifikaci šablon z neredundantní knihovny proteinové struktury.
- SPICKER: Shlukovací program k identifikaci téměř nativního modelu proteinu ze strukturních návnad.
- HAAD: Program pro rychlé přidávání atomů vodíku do proteinových struktur těžkých atomů.
- EDTSurf: Program pro konstrukci trojúhelníkových povrchů molekul bílkovin.
- ModRefiner: Program pro konstrukci a zdokonalení proteinových modelů na atomové úrovni ze stop C-alfa.
- NW-align: Robustní program pro srovnání proteinové sekvence se sekvencí pomocí Needleman-Wunschův algoritmus.
- PSSpred: Vysoce přesný program pro predikci sekundární struktury proteinů.
- Knihovna: Knihovna strukturálních a funkčních šablon I-TASSER každý týden aktualizována a volně přístupná uživatelům I-TASSER.
Dokumenty nápovědy
- Pokyny ke stažení a instalaci sady I-TASSER Suite najdete na Soubor README.txt.
Reference
- ^ A b Roy A, Kucukural A, Zhang Y (2010). „I-TASSER: jednotná platforma pro automatickou predikci struktury a funkce proteinů“. Přírodní protokoly. 5 (4): 725–738. doi:10.1038 / nprot.2010.5. PMC 2849174. PMID 20360767.
- ^ Roy A, Yang J, Zhang Y (2012). „KOFAKTOR: Přesný srovnávací algoritmus pro anotaci funkce proteinu založené na struktuře“. Výzkum nukleových kyselin. 40 (Problém s webovým serverem): W471 – W477. doi:10.1093 / nar / gks372. PMC 3394312. PMID 22570420.
- ^ Zhang C, Freddolino PL, Zhang Y (2017). „KOFAKTOR: lepší predikce funkce proteinu kombinací struktury, sekvence a informací o interakci protein-protein“. Výzkum nukleových kyselin. 45 (W1): W291 – W299. doi:10.1093 / nar / gkx366. PMC 5793808. PMID 28472402.
- ^ Moult, J; et al. (1995). „Rozsáhlý experiment k hodnocení metod predikce proteinové struktury“ (PDF). Proteiny. 23 (3): ii – iv. doi:10,1002 / prot. 340230303. PMID 8710822.
- ^ Battey, JN; et al. (2007). Msgstr "Automatizované předpovědi serveru v CASP7". Proteiny. 69 (Suppl 8): 68–82. doi:10,1002 / prot.21761. PMID 17894354.
- ^ Wu S, Zhang Y (2007). „LOMETS: Místní server meta-threading pro predikci struktury proteinů“. Výzkum nukleových kyselin. 35 (10): 3375–3382. doi:10.1093 / nar / gkm251. PMC 1904280. PMID 17478507.
- ^ Swendsen RH, Wang JS (1986). "Replika Monte Carlo simulace rotujících brýlí". Dopisy o fyzické kontrole. 57 (21): 2607–2609. doi:10.1103 / fyzrevlett.57.2607. PMID 10033814.
- ^ Zhang Y, Skolnick J (2004). „SPICKER: Shlukovací přístup k identifikaci téměř nativních proteinových záhybů“. Journal of Computational Chemistry. 25 (6): 865–871. doi:10.1002 / jcc.20011. PMID 15011258.
- ^ Zhang J, Liang Y, Zhang Y (2011). „Zdokonalování struktury proteinů na atomové úrovni pomocí vzorkování konformace molekulární dynamiky řízené fragmenty“. Struktura. 19 (12): 1784–1795. doi:10.1016 / j.str.2011.09.022. PMC 3240822. PMID 22153501.
- ^ Xu D, Zhang Y (2011). „Zlepšení fyzického realismu a strukturální přesnosti proteinových modelů pomocí dvoustupňové minimalizace energie na atomové úrovni“. Biofyzikální deník. 101 (10): 2525–2534. doi:10.1016 / j.bpj.2011.10.024. PMC 3218324. PMID 22098752.
- ^ Yang J, Roy A, Zhang Y (2013). „Rozpoznávání vazebného místa protein-ligand pomocí komplementárního vazebně specifického srovnání substruktury a zarovnání sekvenčního profilu“. Bioinformatika. 29 (20): 2588–2595. doi:10.1093 / bioinformatika / btt447. PMC 3789548. PMID 23975762.
- ^ Yang J, Roy A, Zhang Y (2015). „Sada I-TASSER: Predikce struktury a funkce proteinů“. Přírodní metody. 12 (1): 7–8. doi:10.1038 / nmeth.3213. PMC 4428668. PMID 25549265.