I-TASSER - I-TASSER

I-TASSER
Potrubí I-TASSER pro predikci struktury a funkce proteinů.
Potrubí I-TASSER pro predikci struktury a funkce proteinů.
VývojářiLaboratoř Yang Zhang
webová stránkazhanglab.ccmb.med.umich.edu/ I-TASSER/

I-TASSER (terativní Tzávitování ASSEmbly Refinement) je a bioinformatika metoda pro predikci trojrozměrného strukturního modelu proteinových molekul z aminokyselinových sekvencí.[1] Detekuje šablony struktury z Proteinová datová banka technikou zvanou rozložení (nebo závitování ). Modely struktury plné délky jsou konstruovány opětovným sestavením strukturních fragmentů ze šablon vláken pomocí výměna replik Simulace Monte Carlo. I-TASSER je jedním z nejúspěšnějších predikce proteinové struktury metody v celé komunitě CASP experimenty.

I-TASSER byl rozšířen o předpovědi funkce proteinů založené na struktuře, která poskytuje anotace ligand vazebné místo, genová ontologie a enzymová provize strukturálním porovnáním strukturních modelů cílového proteinu se známými proteiny v databázích proteinových funkcí.[2][3] Má integrovaný online server v Laboratoř Yang Zhang na Michiganská univerzita, Ann Arbor umožňující uživatelům zadávat sekvence a získávat předpovědi struktury a funkcí. Samostatný balíček I-TASSER je k dispozici ke stažení na Web společnosti I-TASSER.

Pořadí v CASP

I-TASSER (jako „Zhang-Server“) byl trvale zařazován mezi nejlepší metody CASP, celospolečenský experiment, který má srovnávat nejlepší metody predikce struktury v oblasti skládání bílkovin a predikce proteinové struktury. CASP se koná každé dva roky od roku 1994.[4]

Metoda a potrubí

I-TASSER je metoda založená na šabloně pro predikci struktury a funkce proteinu.[1] Potrubí se skládá ze šesti po sobě jdoucích kroků:

  • 1, Predikce sekundární struktury pomocí PSSpred
  • 2, Detekce šablon pomocí LOMETS[6]
  • 3, Sestavení fragmentové struktury pomocí simulace repliky Monte Carlo s replikou[7]
  • 4, Výběr modelu seskupením strukturovaných návnad pomocí SPICKERU[8]
  • 5, Zdokonalování struktury na atomové úrovni pomocí fragmentované simulace molekulární dynamiky (FG-MD)[9] nebo ModRefiner[10]
  • 6, Anotace funkce biologie založené na struktuře pomocí COACH[11]

On-line server

Server I-TASSER umožňuje uživatelům automaticky generovat proteinové struktury a předpovědi funkcí.

  • Vstup
    • Povinné:
      • Aminokyselinová sekvence s délkou od 10 do 1 500 zbytků
    • Volitelné (uživatel může poskytnout volitelně omezení a šablony, které usnadní modelování I-TASSER):
      • Kontaktujte omezení
      • Mapy vzdálenosti
      • Zahrnutí speciálních šablon
      • Vyloučení speciálních šablon
      • Sekundární struktury
  • Výstup
    • Predikce struktury:
      • Predikce sekundární struktury
      • Predikce dostupnosti rozpouštědla
      • Top 10 zarovnání závitů od LOMETS
      • Top 5 atomových modelů plné délky (seřazeno podle hustoty klastrů)
      • Top 10 proteinů v PDB, které jsou strukturálně nejblíže předpovídaným modelům
      • Odhadovaná přesnost předpovězených modelů (včetně skóre spolehlivosti všech modelů, předpokládaného TM-skóre a RMSD pro první model a chyby podle reziduí všech modelů)
      • Odhad B-faktoru
    • Predikce funkce:
      • Klasifikace enzymů (EC) a skóre spolehlivosti
      • Podmínky genové ontologie (GO) a skóre spolehlivosti
      • Místa vázající ligand a skóre spolehlivosti
      • Obrázek předpovězených vazebných míst pro ligand

Samostatné apartmá

Sada I-TASSER Suite je stahovatelný balíček samostatných počítačových programů vyvinutý laboratoří Yang Zhang pro predikci a upřesnění struktury proteinů a anotace proteinové funkce založené na struktuře.[12] Prostřednictvím licence I-TASSER mají vědci přístup k následujícím samostatným programům:

  • I-TASSER: Samostatný balíček I-TASSER pro predikci a zdokonalování proteinové 3D struktury.
  • COACH: Program anotace funkcí založený na COFACTOR, TM-SITE a S-SITE.
  • KOFAKTOR: Program pro vazebné místo pro ligand, predikce EC čísla a GO termínu.
  • TM-SITE: Přístup založený na struktuře pro predikci místa vázajícího ligand.
  • S-SITE: Přístup založený na sekvenci pro predikci místa vázajícího ligand.
  • LOMETS: Sada lokálně nainstalovaných podprocesů pro rozpoznávání skládání proteinů meta-serveru.
  • MUSTER: Řetězcový program pro identifikaci šablon z neredundantní knihovny proteinové struktury.
  • SPICKER: Shlukovací program k identifikaci téměř nativního modelu proteinu ze strukturních návnad.
  • HAAD: Program pro rychlé přidávání atomů vodíku do proteinových struktur těžkých atomů.
  • EDTSurf: Program pro konstrukci trojúhelníkových povrchů molekul bílkovin.
  • ModRefiner: Program pro konstrukci a zdokonalení proteinových modelů na atomové úrovni ze stop C-alfa.
  • NW-align: Robustní program pro srovnání proteinové sekvence se sekvencí pomocí Needleman-Wunschův algoritmus.
  • PSSpred: Vysoce přesný program pro predikci sekundární struktury proteinů.
  • Knihovna: Knihovna strukturálních a funkčních šablon I-TASSER každý týden aktualizována a volně přístupná uživatelům I-TASSER.

Dokumenty nápovědy

Reference

  1. ^ A b Roy A, Kucukural A, Zhang Y (2010). „I-TASSER: jednotná platforma pro automatickou predikci struktury a funkce proteinů“. Přírodní protokoly. 5 (4): 725–738. doi:10.1038 / nprot.2010.5. PMC  2849174. PMID  20360767.
  2. ^ Roy A, Yang J, Zhang Y (2012). „KOFAKTOR: Přesný srovnávací algoritmus pro anotaci funkce proteinu založené na struktuře“. Výzkum nukleových kyselin. 40 (Problém s webovým serverem): W471 – W477. doi:10.1093 / nar / gks372. PMC  3394312. PMID  22570420.
  3. ^ Zhang C, Freddolino PL, Zhang Y (2017). „KOFAKTOR: lepší predikce funkce proteinu kombinací struktury, sekvence a informací o interakci protein-protein“. Výzkum nukleových kyselin. 45 (W1): W291 – W299. doi:10.1093 / nar / gkx366. PMC  5793808. PMID  28472402.
  4. ^ Moult, J; et al. (1995). „Rozsáhlý experiment k hodnocení metod predikce proteinové struktury“ (PDF). Proteiny. 23 (3): ii – iv. doi:10,1002 / prot. 340230303. PMID  8710822.
  5. ^ Battey, JN; et al. (2007). Msgstr "Automatizované předpovědi serveru v CASP7". Proteiny. 69 (Suppl 8): 68–82. doi:10,1002 / prot.21761. PMID  17894354.
  6. ^ Wu S, Zhang Y (2007). „LOMETS: Místní server meta-threading pro predikci struktury proteinů“. Výzkum nukleových kyselin. 35 (10): 3375–3382. doi:10.1093 / nar / gkm251. PMC  1904280. PMID  17478507.
  7. ^ Swendsen RH, Wang JS (1986). "Replika Monte Carlo simulace rotujících brýlí". Dopisy o fyzické kontrole. 57 (21): 2607–2609. doi:10.1103 / fyzrevlett.57.2607. PMID  10033814.
  8. ^ Zhang Y, Skolnick J (2004). „SPICKER: Shlukovací přístup k identifikaci téměř nativních proteinových záhybů“. Journal of Computational Chemistry. 25 (6): 865–871. doi:10.1002 / jcc.20011. PMID  15011258.
  9. ^ Zhang J, Liang Y, Zhang Y (2011). „Zdokonalování struktury proteinů na atomové úrovni pomocí vzorkování konformace molekulární dynamiky řízené fragmenty“. Struktura. 19 (12): 1784–1795. doi:10.1016 / j.str.2011.09.022. PMC  3240822. PMID  22153501.
  10. ^ Xu D, Zhang Y (2011). „Zlepšení fyzického realismu a strukturální přesnosti proteinových modelů pomocí dvoustupňové minimalizace energie na atomové úrovni“. Biofyzikální deník. 101 (10): 2525–2534. doi:10.1016 / j.bpj.2011.10.024. PMC  3218324. PMID  22098752.
  11. ^ Yang J, Roy A, Zhang Y (2013). „Rozpoznávání vazebného místa protein-ligand pomocí komplementárního vazebně specifického srovnání substruktury a zarovnání sekvenčního profilu“. Bioinformatika. 29 (20): 2588–2595. doi:10.1093 / bioinformatika / btt447. PMC  3789548. PMID  23975762.
  12. ^ Yang J, Roy A, Zhang Y (2015). „Sada I-TASSER: Predikce struktury a funkce proteinů“. Přírodní metody. 12 (1): 7–8. doi:10.1038 / nmeth.3213. PMC  4428668. PMID  25549265.

externí odkazy