RAPTOR (software) - RAPTOR (software) - Wikipedia

RAPTOR
Jmol.png
Původní autořiDr. Jinbo Xu
VývojářiBioinformatics Solutions Inc.
Stabilní uvolnění
4.2 / listopad 2008; Před 12 lety (2008-11)
Operační systémOkna, Linux
TypPredikce struktury proteinů
webová stránkabioinfor.com/ dravec

RAPTOR je software pro navlékání proteinů používaný pro predikce proteinové struktury. Byl nahrazen RaptorX, což je mnohem přesnější než RAPTOR.

Srovnání technik

Vláknování proteinů vs. modelování homologie

Vědci, kteří se pokoušejí vyřešit strukturu bílkovin, zahajují studium s pouhým více než proteinovým sledem. Počáteční kroky mohou zahrnovat provedení a PSI-BLAST nebo Lovec vzorů vyhledejte a vyhledejte podobné sekvence se známou strukturou v souboru Proteinová datová banka (PDB). Pokud existují vysoce podobné sekvence se známými strukturami, existuje vysoká pravděpodobnost, že struktura tohoto proteinu bude velmi podobná těm známým strukturám i funkcím. Pokud není nalezena žádná homologie, musí provést buď výzkumník Rentgenová krystalografie nebo spektroskopie nukleární magnetické rezonance (NMR), z nichž oba vyžadují značný čas a prostředky k získání struktury. Tam, kde jsou tyto techniky příliš nákladné, časově náročné nebo omezené, mohou vědci použít software pro navlékání proteinů, jako je RAPTOR, k vytvoření vysoce spolehlivého modelu proteinu.

Vlákna proteinů jsou účinnější než modelování homologie, zejména u proteinů, u kterých je detekovatelných jen málo homologů zarovnání sekvence. Obě tyto metody předpovídají proteinovou strukturu ze šablony. Vzhledem k proteinové sekvenci proteinové vlákno nejprve zarovná (vlákna) sekvenci s každou šablonou ve strukturní knihovně optimalizací skórovací funkce, která měří vhodnost zarovnání sekvenční struktury. Vybraná nejlepší šablona se používá k sestavení modelu struktury. Na rozdíl od homologního modelování, které vybírá templát čistě na základě informací o homologii (zarovnání sekvencí), skórovací funkce použitá při navlékání proteinů využívá jak homologii, tak informace o struktuře (zarovnání struktury sekvencí).

Pokud v sekvenci nebyla nalezena žádná významná homologie, modelování homologie nemusí v tomto případě poskytnout spolehlivou předpověď. Bez informací o homologii může proteinové vlákno stále používat informace o struktuře k vytvoření dobré predikce. Neúspěšné pokusy o získání dobré šablony pomocí BLASTu často vedou k tomu, že uživatelé zpracovávají výsledky prostřednictvím RAPTORU.

Celočíselné programování vs. dynamické programování

The celočíselné programování přístup k RAPTOR produkuje kvalitnější modely než jiné metody navlékání proteinů. Většina podprocesů používá software dynamické programování optimalizovat své funkce bodování při zarovnávání sekvence se šablonou. Dynamické programování je mnohem snazší implementovat než celočíselné programování; pokud však funkce bodování obsahuje párový kontaktní potenciál, dynamické programování nemůže takovou funkci bodování globálně optimalizovat a místo toho pouze vygeneruje místní optimální zarovnání.

Párové kontakty jsou velmi konzervované ve struktuře proteinu a jsou rozhodující pro přesnost predikce. Programování celého čísla může globálně optimalizovat bodovací funkci s párovým kontaktním potenciálem a vytvořit globální optimální zarovnání.

Součásti

Závitové motory

NoCore, NPCore a IP jsou tři různé podprocesy implementované v RAPTOR. NoCore a NPCore jsou založeny na dynamickém programování a rychlejší než IP. Rozdíl mezi nimi je v tom, že v NPCore je šablona analyzována do mnoha „základních“ oblastí. Jádro je strukturálně konzervovaný region. IP je jedinečný podprocesní stroj založený na celočíselném programování společnosti RAPTOR. Produkuje lepší vyrovnání a modely než ostatní dva podprocesy. Lidé mohou vždy začít s NoCore a NPCore. Pokud jejich předpovědi nejsou dost dobré, může být IP lepší volbou. Po spuštění všech tří metod může najít nejlepší předpověď jednoduchá shoda.

Modul 3D modelování struktury

Výchozí nástroj pro modelování 3D struktury používaný v RAPTOR je OWL. Modelování trojrozměrné struktury zahrnuje dva kroky. Prvním krokem je modelování smyček, které modeluje oblasti v cílové sekvenci, které se v šabloně mapují na nic. Poté, co jsou všechny smyčky modelovány a páteř je připravena, jsou k páteři připojeny boční řetězy a zabaleny. Pro modelování smyček se k vyplnění smyček a zabránění střetům používá algoritmus sestupu cyklických souřadnic. Pro balení postranních řetězců se používá algoritmus rozkladu stromů, který zabalí všechny postranní řetězce a zabrání jakýmkoli střetům. OWL je v RAPTORU automaticky volána pro generování 3D výstupu.

Pokud má výzkumný pracovník MODELLER, může také nastavit RAPTOR, aby automaticky volal MODELLER. RAPTOR může také generovat vstupní soubory ICM-Pro, s nimiž lidé spouštějí ICM-Pro sami.

Modul PSI-BLAST

Aby to byla komplexní sada nástrojů, PSI-BLAST je také součástí nástroje RAPTOR, který umožňuje lidem modelovat homologii. Lidé si mohou sami nastavit všechny potřebné parametry. Spuštění PSI-BLAST zahrnuje dva kroky. Prvním krokem je vygenerování sekvenčního profilu. Pro tento krok se používá neredundantní databáze NR. Dalším krokem je nechat PSI-BLAST prohledat cílovou sekvenci proti sekvencím z Protein Data Bank. Uživatelé mohou také pro každý krok zadat vlastní databázi.

Prohlížeč struktury proteinů

Existuje mnoho různých prohlížečů struktury. V RAPTORU Jmol se používá jako prohlížeč struktury pro zkoumání generované predikce.

Výstup

Po úloze threading / PSI-BLAST lze zobrazit seznam hodnocení všech šablon. U každé šablony mohou lidé zobrazit zarovnání, E-hodnota a mnoho dalších konkrétních skóre. Také funkční informace o šabloně a jejích SCOP klasifikace jsou uvedeny. Lze také zobrazit predikci matice a sekundární struktury sekvence PSM. Pokud byla šablona nahlášena více než jednou metodou, bude označena počtem případů, kdy byla nahlášena. To pomáhá určit nejlepší šablonu.

Výkon v CASP

CASP Kritické hodnocení technik pro predikci struktury proteinů je dvouletý experiment sponzorovaný NIH. CASP představuje olympijské hry komunity predikce proteinové struktury a byla založena v roce 1994.

RAPTOR se poprvé objevil v CAFASP 3 (CASP5) v roce 2002 a pro daný rok byl zařazen na první místo ve skupině jednotlivých serverů. Od té doby se RAPTOR aktivně účastnil každého CASP pro účely hodnocení a byl trvale zařazen do nejvyšší úrovně.

Nejnovější CASP8 běžel od května 2008 do srpna 2008. Na akci se zaregistrovalo více než 80 predikčních serverů a více než 100 lidských expertních skupin po celém světě, kde se účastníci pokoušejí předpovědět 3D strukturu z proteinové sekvence. Podle hodnocení od Zhangovy skupiny se RAPTOR umístil na 2. místě mezi všemi servery (meta server a jednotlivé servery). ROBETTA z Baker Lab je na 5. místě ve stejném žebříčku.

Nejlepší pět predikčních serverů v CASP8

HodnostPrediktorPoužité cíleTM-skóreMax. Dílčí skóreGDT skóreGHA skóre
1Zhang-Server171120.65108.78114.6985.55
2RAPTOR171116.13104.69110.7982.92
3pro-sp3-TASSER171116.05103.38109.9580.88
4Phyre_de_novo171115.35103.47110.0082.51
5BAKER-ROBETTA171115.12102.68109.2780.71

Reference

  • Xu J, Li M, Kim D, Xu Y (2003). „RAPTOR: Optimální proteinové vlákno lineárním programováním, úvodní téma“. J Bioinform Comput Biol. 1 (1): 95–117. doi:10.1142 / S0219720003000186. PMID  15290783.
  • Xu J, Li M (2003). "Hodnocení přístupu RAPTOR k lineárnímu programování v CAFASP3". Proteiny. 53 (Suppl 6): 579–584. doi:10.1002 / prot.10531. PMID  14579349.
  • Xu J, Li M, Lin G, Kim D, Xu Y (2003). "Vlákna bílkovin lineárním programováním". Pac Symp Biocomput: 264–275. PMID  12603034.
  • Xu J (2005). "Rozpoznání složení proteinu podle předpokládané přesnosti zarovnání". IEEE / ACM Trans. na Výpočetní biologie a bioinformatika.
  • Xu J (2005). "Rapid Protein Side-Chain Packing via Tree Decomposition". RECOMB.

externí odkazy