Seznam softwaru pro detekci oblastí s nízkou složitostí v proteinech - List of software to detect low complexity regions in proteins
Výpočtové metody mohou studovat proteinové sekvence a identifikovat tak oblasti nízká složitost, které mohou mít určité vlastnosti týkající se jejich funkce a struktury.
název | Poslední aktualizace | Používání | Popis | Otevřený zdroj? | Odkaz |
---|---|---|---|---|---|
SAPS | 1992 | ke stažení / web | Popisuje několik statistik proteinových sekvencí pro hodnocení charakteristických charakteristik obsahu zbytků a uspořádání v primárních strukturách. | Ano | [1] |
SEG | 1993 | ke stažení | Jedná se o dvouprůchodový algoritmus: nejprve identifikuje LCR a poté provede lokální optimalizaci maskováním Xs LCR | Ano | [2] |
fLPS | 2017 | ke stažení / web | Může snadno zpracovat velmi velké datové soubory bílkovin, jaké mohou pocházet z metagenomických projektů. Je užitečné při hledání proteinů s podobnými CBR a při vytváření funkčních závěrů o CBR pro požadovaný protein | Ano | [3] |
OBSAZENÍ | 2000 | web | Identifikuje LCR pomocí dynamického programování. | Ne | [4] |
JEDNODUCHÝ | 2002 | ke stažení web | Usnadňuje kvantifikaci množství jednoduché sekvence v proteinech a určuje typ krátkých motivů, které ukazují shlukování nad určitou prahovou hodnotou. | Ano | [5] |
Oj.py | 2001 | na znamení | Nástroj pro vymezení proteinových domén s nízkou složitostí. | Ne | [6] |
DSR | 2003 | na znamení | Vypočítá složitost pomocí vzájemné složitosti. | Ne | [7] |
ScanCom | 2003 | na znamení | Vypočítá kompoziční složitost pomocí míry jazykové složitosti. | Ne | [8] |
KARTU | 2005 | na znamení | Na základě analýzy složitosti subsekvencí oddělených dvojicemi identických opakujících se subsekvencí. | Ne | [9] |
BIAS | 2006 | ke stažení / web | Využívá statistiku diskrétního skenování, která poskytuje vysoce přesnou korekci vícenásobného testu k výpočtu analytických odhadů významnosti každého segmentu s kompozičním předpětím. | Ano | [10] |
GBA | 2006 | na znamení | Algoritmus založený na grafu, který vytváří graf sekvence. | Ne | [11] |
SubSeqer | 2008 | web | Grafický přístup k detekci a identifikaci opakujících se prvků v sekvencích s nízkou složitostí. | Ne | [12] |
ANNIE | 2009 | web | Tato metoda vytváří automatizaci sekvenčního analytického procesu. | Ne | [13] |
Anotace LPS | 2011 | na znamení | Tento algoritmus definuje zkreslení kompozice prostřednictvím důkladného hledání subsekvencí s nejnižší pravděpodobností (LPS; Low Probability Sequences) a slouží jako pracovní plocha nástrojů, které jsou nyní k dispozici molekulárním biologům ke generování hypotéz a závěrů o proteinech, které zkoumají. | Ne | [14] |
LCReXXXplorer | 2015 | web | Webová platforma pro vyhledávání, vizualizaci a sdílení dat pro oblasti s nízkou složitostí v proteinových sekvencích. LCR-eXXXplorer nabízí nástroje pro zobrazování LCR ze znalostní báze UniProt / SwissProt v kombinaci s dalšími relevantními proteinovými funkcemi, předpokládanými nebo experimentálně ověřenými. Uživatelé také mohou provádět dotazy proti vlastní navržené databázi sekvencí / LCR. | Ne | [15] |
XNU | 1993 | ke stažení | Pro výpočet složitosti používá skórovací matici PAM120. | Ano | [16] |
Komplexní přehled o různých metodách a nástrojích najdete v části [17].
Kromě toho byl vyvinut webový meta-server s názvem PLAtform of TOols for LOw COmplexity (PlaToLoCo) pro vizualizaci a anotaci oblastí s nízkou složitostí v proteinech [18]. PlaToLoCo integruje a sbírá výstup pěti různých nejmodernějších nástrojů pro objevování LCR a poskytuje funkční anotace, jako je detekce domény, predikce transmembránových segmentů a výpočet frekvencí aminokyselin. Dále lze získat sjednocení nebo průsečík výsledků vyhledávání v posloupnosti dotazů.
Byl vyvinut webový server Neural Network s názvem LCR-hound, který předpovídá funkci prokaryotických a eukaryotických LCR na základě jejich obsahu aminokyselin nebo di-aminokyselin. [19].
Reference
- ^ Brendel V, Bucher P, Nourbakhsh IR, Blaisdell BE, Karlin S (15. března 1992). "Metody a algoritmy pro statistickou analýzu proteinových sekvencí". Proc Natl Acad Sci U S A. 89 (6): 2002–2006. doi:10.1073 / pnas.89.6.2002. PMC 48584. PMID 1549558.
- ^ Wootton JC, Federhen S (červen 2003). "Statistiky lokální složitosti v aminokyselinových sekvencích a databázích sekvencí". Počítače a chemie. 17 (2): 149–163. doi:10.1016 / 0097-8485 (93) 85006-X.
- ^ Harrison PM (13. listopadu 2017). „fLPS: Rychlý objev kompozičních předsudků pro proteinový vesmír“. BMC bioinformatika. 18 (1): 476. doi:10.1186 / s12859-017-1906-3. PMC 5684748. PMID 29132292.
- ^ Promponas VJ, Enright AJ, Tsoka S, Kreil DP, Leroy C, Hamodrakas S, Sander C, Ouzounis CA (říjen 2000). „CAST: iterační algoritmus pro analýzu složitosti sekvenčních traktů. Analýza složitosti sekvenčních traktů“. Bioinformatika. 16 (10): 915–922. doi:10.1093 / bioinformatika / 16.10.915. PMID 11120681.
- ^ Albà MM, Laskowski RA, Hancock JM (květen 2002). Msgstr "Detekce tajemně jednoduchých proteinových sekvencí pomocí algoritmu SIMPLE". Bioinformatika. 18 (5): 672–678. doi:10.1093 / bioinformatika / 18.5.672. PMID 12050063.
- ^ Wise MJ (2001). „0j.py: softwarový nástroj pro bílkoviny a proteinové domény s nízkou složitostí“. Bioinformatika. 17 (Suppl 1): S288 – S295. doi:10.1093 / bioinformatika / 17.suppl_1.s288. PMID 11473020.
- ^ Wan H, Li L, Federhen S, Wootton JC (2003). "Objevování jednoduchých regionů v biologických sekvencích spojených se schématy skórování". J Comput Biol. 10 (2): 171–185. doi:10.1089/106652703321825955. PMID 12804090.
- ^ Nandi T, Dash D, Ghai R, B-Rao C, Kannan K, Brahmachari SK, Ramakrishnan C, Ramachandran S (2003). "Nový algoritmus pro detekci oblastí s nízkou složitostí v proteinových sekvencích". J Biomol Struct Dyn. 20 (5): 657–668. doi:10.1080/07391102.2003.10506882. PMID 12643768.
- ^ Shin SW, Kim SM (15. ledna 2005). „Nové měřítko složitosti pro srovnávací analýzu proteinových sekvencí z úplných genomů“. Bioinformatika. 21 (2): 160–170. doi:10.1093 / bioinformatika / bth497. PMID 15333459.
- ^ Kuzněcov IB, Hwang S (1. května 2006). „Nová citlivá metoda pro detekci uživatelsky definovaného zkreslení kompozice v biologických sekvencích“. Bioinformatika. 22 (9): 1055–1063. doi:10.1093 / bioinformatika / btl049. PMID 16500936.
- ^ Li X, Kahveci T (15. prosince 2006). „Nový algoritmus pro identifikaci oblastí s nízkou složitostí v proteinové sekvenci“. Bioinformatika. 22 (24): 2980–2987. doi:10.1093 / bioinformatika / btl495. PMID 17018537.
- ^ He D, Parkinson J (1. dubna 2008). „SubSeqer: grafický přístup k detekci a identifikaci opakujících se prvků v sekvencích s nízkou složitostí“. Bioinformatika. 24 (7): 1016–1017. doi:10.1093 / bioinformatika / btn073. PMID 18304932.
- ^ Ooi HS, Kwo CY, Wildpaner M, Sirota FL, Eisenhaber B, Maurer-Stroh S, Wong WC, Schleiffer A, Eisenhaber F, Schneider G (červenec 2009). „ANNIE: integrovaná anotace proteinové sekvence de novo“. Nucleic Acids Res. 37 (Problém s webovým serverem): W435 – W440. doi:10.1093 / nar / gkp254. PMC 2703921. PMID 19389726.
- ^ Harbi D, Kumar M, Harrison PM (6. ledna 2011). „LPS-annotate: complete annotation of compositionally biasied areas in the protein knowledgebase“. Databáze (Oxford). 2011: baq031. doi:10.1093 / databáze / baq031. PMC 3017391. PMID 21216786.
- ^ Kirmitzoglou I, Promponas VJ (1. července 2015). „LCR-eXXXplorer: webová platforma pro vyhledávání, vizualizaci a sdílení dat pro oblasti s nízkou složitostí v proteinových sekvencích“. Bioinformatika. 31 (13): 2208–2210. doi:10.1093 / bioinformatika / btv115. PMC 4481844. PMID 25712690.
- ^ Claverie JM, státy D (červen 1993). "Metody vylepšení informací pro sekvenční analýzu ve velkém měřítku". Computers Chem. 17 (2): 191–201. doi:10.1016 / 0097-8485 (93) 85010-a.
- ^ Mier, Pablo; Paladin, Lisanna; Tamana, Stella; Petrosian, Sophia; Hajdu-Soltész, Borbála; Urbanek, Annika; Gruca, Aleksandra; Plewczynski, Dariusz; Grynberg, Marcin; Bernadó, Pau; Gáspári, Zoltán (2020-03-23). „Oddělení složitosti proteinů s nízkou složitostí“. Briefings in Bioinformatics. 21 (2): 458–472. doi:10.1093 / bib / bbz007. ISSN 1467-5463. PMC 7299295. PMID 30698641.
- ^ Jarnot, Patryk; Ziemska-Legiecka, Joanna; Dobson, Laszlo; Merski, Matthew; Mier, Pablo; Andrade-Navarro, Miguel A; Hancock, John M; Dosztányi, Zsuzsanna; Paladin, Lisanna; Necci, Marco; Piovesan, Damiano (02.07.2020). „PlaToLoCo: první webový meta-server pro vizualizaci a anotaci oblastí s nízkou složitostí v proteinech“. Výzkum nukleových kyselin. 48 (W1): W77 – W84. doi:10.1093 / nar / gkaa339. ISSN 0305-1048. PMC 7319588. PMID 32421769.
- ^ Ntountoumi, Chrysa; Vlastaridis, Panayotis; Mossialos, Dimitris; Stathopoulos, Constantinos; Iliopoulos, Ioannis; Promponas, Vasilios; Oliver, Stephen G; Amoutzias, Grigoris D (04.11.2019). „Oblasti s nízkou složitostí v proteinech prokaryot plní důležité funkční role a jsou vysoce konzervativní“. Výzkum nukleových kyselin. 47 (19): 9998–10009. doi:10.1093 / nar / gkz730. ISSN 0305-1048. PMC 6821194. PMID 31504783.