Predictprotein - Predictprotein
Původní autoři | Burkhard Rost |
---|---|
Vývojáři | Guy Yachdav Laszlo Kajan |
První vydání | 1992 |
Stabilní uvolnění | 1.0.88 |
Operační systém | Na bázi UNIX |
Typ | Bioinformatika |
Licence | GPLv2 |
webová stránka | www |
PredictProtein (PP) je automatická služba, která prohledává aktuální veřejné databáze sekvencí, vytváří zarovnání a předpovídá aspekty struktury a funkce proteinu. Uživatelé posílají proteinovou sekvenci a dostávají jeden soubor s výsledky z porovnání databází a predikčních metod. PP se připojil k internetu v roce 1992 na Evropská laboratoř molekulární biologie; od roku 1999 působí od Columbia University a v roce 2009 se přestěhovala do Technische Universität München. Ačkoli mnoho serverů implementovalo konkrétní aspekty, PP zůstává nejpoužívanějším veřejným serverem pro predikci struktury: bylo zpracováno více než 1,5 milionu požadavků od uživatelů ve 104 zemích; více než 13 000 uživatelů zadalo 10 nebo více různých dotazů. Webové stránky PP se zrcadlí v 17 zemích na 4 kontinentech. Systém je optimalizován tak, aby splňoval požadavky experimentátorů, kteří nemají zkušenosti s bioinformatikou. To znamenalo, že jsme se zaměřili na začlenění pouze vysoce kvalitních metod a pokusili jsme se shromáždit výsledky s vynecháním méně spolehlivých nebo méně důležitých metod.
Pokus o zjednodušení výstupu začleněním hierarchie prahových hodnot
Pokus „předem strávit“ co nejvíce informací ke zjednodušení interpretace výsledků je jedinečným pilířem PP. Například ve výchozím nastavení PP vrací pouze ty proteiny nalezené v databázi, u nichž je velmi pravděpodobné, že mají podobnou strukturu jako dotazovaný protein.[1] Konkrétní předpovědi, jako jsou ty pro membránové šroubovice, oblasti stočené cívky, signální peptidy a signály lokalizace jader, se nevracejí, pokud se zjistí, že jsou pod danými prahovými hodnotami pravděpodobnosti.
Každý požadavek spouští aplikaci více než 20 různých metod
Uživatelé obdrží jeden výstupní soubor s následujícími výsledky. Vyhledávání v databázi: podobné sekvence jsou hlášeny a zarovnány standardním párovým BLAST,[2] iterované vyhledávání PSI-BLAST.[3] Přestože párová vyhledávání BLAST jsou identická s těmi, která lze získat z webu NCBI, iterovaný PSI-BLAST se provádí na pečlivě filtrované databázi, aby se zabránilo hromadění falešných výsledků během iterace.[4][5] Standardní vyhledávání funkčních motivů v databázi PROSITE.[6] PP nyní také identifikuje domnělé hranice pro strukturální domény pomocí postupu CHOP. Metody predikce struktury: sekundární struktura, dostupnost rozpouštědla a membránové šroubovice předpovídané programy PHD a PROF,[7][8] membránové prameny předpovězené PROFtmb,[9] regiony coiled-coil od COILS,[10] a inter-residuální kontakty přes PROFcon,[11] regiony s nízkou složitostí jsou označeny SEG [12] a dlouhé regiony bez pravidelné sekundární struktury jsou identifikovány NORSp ,.[13][14] Programy PHD / PROF jsou k dispozici pouze prostřednictvím PP. Zvláštní způsob, jakým PP automaticky iteruje vyhledávání PSI-BLAST, a způsob, jakým se rozhodujeme, co zahrnout do sekvenčních rodin, je pro PP také jedinečný. Jednotlivé aspekty funkce, které jsou aktuálně vloženy výslovně do PP, nějak souvisí s subcelulární lokalizací: detekujeme signály nukleární lokalizace pomocí PredictNLS,[15][16] předpovídáme lokalizaci nezávisle na cílených signálech prostřednictvím LOCnet;[17] a homologie anotací k proteinům zapojeným do kontroly buněčného cyklu.[18]
Dostupnost
Webová služba
Webová služba PredictProtein je k dispozici na www.predictprotein.org. Uživatelé mohou odeslat aminokyselinovou sekvenci a na oplátku získat sadu automatických anotací pro zadanou sekvenci. Služba je podporována databází předem vypočítaných výsledků, které zrychlují dobu interakce.
Cloudové řešení
Cloudové řešení PredictProtein staví na otevřeném operačním systému Debian,[19] a poskytuje svou funkcionalitu jako sadu zdarma [20] Softwarové balíčky Debianu. Bio-Linux je operační systém pro bioinformatiku a výpočetní biologii. Jeho nejnovější vydání 7 poskytuje více než 500 bioinformatických programů na bázi Ubuntu Linux.[21] Ubuntu je derivát Debianu, operační systém založený na Debianu s vlastními doplňky. Cloud BioLinux je komplexní cloudové řešení, které je odvozeno od Bio-Linuxu a Ubuntu. Debianové deriváty mohou snadno sdílet balíčky mezi sebou. Například balíčky Debianu jsou automaticky začleněny do Ubuntu,[22] a jsou také použitelné v Cloud BioLinuxu (postup je popsán v [23]).
Viz také
Reference
- ^ Rost, B. (1999). "Soumraková zóna zarovnání proteinové sekvence". Proteinové inženýrství. 12 (2): 85–94. doi:10.1093 / protein / 12.2.85. PMID 10195279.
- ^ Altschul S.F. a Gish, W. (1996) Statistiky místního zarovnání. Methods Enzymol., 266, 460–480.
- ^ Altschul S., Madden, T., Shaffer, A., Zhang, J., Zhang, Z., Miller, W. a Lipman, D. (1997 Gapped Blast a PSI-Blast: nová generace programů pro vyhledávání proteinových databází. Nucleic Acids Res., 25, 3389–3402.
- ^ Przybylski D. a Rost, B. (2002) Zarovnání roste, predikce sekundární struktury se zlepšuje. Proteiny, 46, 195–205.
- ^ Jones D.T. (1999) Predikce sekundární struktury proteinů na základě polohově specifických skórovacích matic. J. Mol. Biol., 292, 195–202.
- ^ Hofmann K., Bucher, P., Falquet, L. a Bairoch, A. (1999) Databáze PROSITE, její stav v roce 1999. Nucleic Acids Res., 27, 215–219.
- ^ Rost B. (1996) PHD: předpovídání jednorozměrné proteinové struktury pomocí neuronových sítí založených na profilu. Methods Enzymol., 266, 525–539
- ^ Rost B. (2001) Predikce sekundární struktury proteinů stále roste. J. Struct. Biol., 134, 204–218.
- ^ Bigelow, H .; Rost, B. (2006). „PROFtmb: Webový server pro predikci bakteriálních transmembránových proteinů beta barelu“. Výzkum nukleových kyselin. 34 (Problém s webovým serverem): W186 – W188. doi:10.1093 / nar / gkl262. PMC 1538807. PMID 16844988.
- ^ Lupas A., Van Dyke, M. a Stock, J. (1991) Predikce stočených cívek z proteinových sekvencí. Science, 252, 1162–1164.
- ^ Punta, M .; Rost, B. (2005). „PROFcon: Nová predikce kontaktů na velké vzdálenosti“. Bioinformatika. 21 (13): 2960–2968. doi:10.1093 / bioinformatika / bti454. PMID 15890748.
- ^ Wootton J.C. a Federhen, S. (1996) Analýza kompozičně předpjatých oblastí v sekvenčních databázích. Methods Enzymol., 266, 554–571.
- ^ Liu J., Tan, H. a Rost, B. (2002) Loopy proteiny se zdají být v evoluci konzervované. J. Mol. Biol., 322, 53–64
- ^ Liu J. a Rost, B. (2003) NORSp: předpovědi dlouhých regionů bez pravidelné sekundární struktury. Nucleic Acids Res., 31, 3833–3835
- ^ Cokol M., Nair, R. a Rost, B. (2000) Hledání jaderných lokalizačních signálů. EMBO Rep., 1, 411–415.
- ^ Nair R., Carter, P. a Rost, B. (2003) NLSdb: databáze jaderných lokalizačních signálů. Nucleic Acids Res., 31, 397–399
- ^ Nair R. a Rost, B. (2003) Lepší predikce subcelulární lokalizace kombinací evolučních a strukturních informací. Proteiny, 53, 917–930
- ^ Wrzeszczynski K.O. a Rost, B. (2004) Katalogizace proteinů při kontrole buněčného cyklu. Methods Mol. Biol., 241, 219–233
- ^ Amor, J. J. a kol. Od prasat po pruhy: Cesta debianem. ve sborníku DebConf5 (Debian Annual Developers Meeting). 2005. Citeseer.
- ^ Pokyny pro svobodný software pro Debian (DFSG). Dostupný z: http://www.debian.org/social_contract#guidelines
- ^ Dawn Field, B.T., Tim Booth, Stewart Houten, Dan Swan, Nicolas Bertrand, Milo Thurston. Bio-Linux 7. 2012; Dostupný z: http://nebc.nerc.ac.uk/tools/bio-linux/bio-linux-7-info
- ^ NOVÉ balíčky prostřednictvím Debianu. Dostupný z: https://wiki.ubuntu.com/UbuntuDevelopment/NewPackages#NEW_packages_through_Debian
- ^ Krampis, K. a kol., Cloud BioLinux: předkonfigurované a bioinformatické výpočty na vyžádání pro komunitu genomiky. BMC Bioinformatics, 2012. 13: str. 42