Seznam softwaru pro zarovnání sekvence - List of sequence alignment software
Tento seznam softwaru pro zarovnání sekvence je kompilace softwarových nástrojů a webových portálů používaných v páru zarovnání sekvence a vícenásobné zarovnání sekvence. Vidět software pro konstrukční vyrovnání pro strukturální vyrovnání bílkovin.
Pouze prohledávání databáze
název | Popis | Typ sekvence * | Autoři | Rok |
---|---|---|---|---|
VÝBUCH | Místní vyhledávání s rychlou heuristikou k-n-tice (základní nástroj pro vyhledávání místního zarovnání) | Oba | Altschul SF, Gish W., Miller W., Myers EW, Lipman DJ[1] | 1990 |
HPC-BLAST | Vícebodová a vícejádrová obálka BLAST kompatibilní s NCBI. Distribuován s nejnovější verzí BLAST, tento obal umožňuje paralelizaci algoritmu na moderních hybridních architekturách s mnoha uzly a mnoha jádry v každém uzlu. [2] | Protein | Burdyshaw CE, Sawyer S., Horton MD, Brook RG, Rekapalli B | 2017 |
CS-BLAST | Sekvenčně kontextově specifický BLAST, citlivější než BLAST, FASTA a SSEARCH. Poziční specifická iterační verze CSI-BLAST citlivější než PSI-BLAST | Protein | Angermueller C, Biegert A, Soeding J[3] | 2013 |
CUDASW ++ | GPU zrychlil algoritmus Smith Waterman pro více GPU se sdíleným hostitelem | Protein | Liu Y, Maskell DL a Schmidt B. | 2009/2010 |
DIAMANT | Zarovnávač BLASTX a BLASTP založený na dvojitém indexování | Protein | Buchfink B, Xie, C a Huson DH[4] | 2015 |
FASTA | Rychlé místní vyhledávání k-tuple heuristické, pomalejší, ale citlivější než BLAST | Oba | ||
GGSEARCH, GLSEARCH | Global: Global (GG), Global: Local (GL) alignment with statistics | Protein | ||
Genomový kouzelník | Software pro ultrarychlé vyhledávání lokálních motivů sekvence DNA a párové zarovnání pro data NGS (FASTA, FASTQ). | DNA | Hepperle D (www.sequentix.de) | 2020 |
Genoogle | Genoogle používá pro vyhledávání sekvencí DNA a proteinů techniky indexování a paralelního zpracování. Je vyvinut v Javě a open source. | Oba | Albrecht F | 2015 |
HMMER | Místní a globální vyhledávání pomocí profilů Skryté modely Markov, citlivější než PSI-BLAST | Oba | Durbin R., Eddy SR, Krogh A, Mitchison G.[5] | 1998 |
HH-suite | Párové srovnání profilových skrytých Markovových modelů; velmi citlivý | Protein | Söding J[6][7] | 2005/2012 |
IDF | Četnost inverzních dokumentů | Oba | ||
Pekelný | Profil SCFG Vyhledávání | RNA | Eddy S. | |
KLAST | Vysoce výkonný vyhledávací nástroj pro sekvenční podobnost pro obecné účely | Oba | 2009/2014 | |
LAMBDA | Vysoce výkonný lokální vyrovnávač kompatibilní s BLAST, ale mnohem rychlejší; podporuje SAM / BAM | Protein | Hannes Hauswedell, Jochen Singer, Knut Reinert[8] | 2014 |
MMseqs2 | Softwarová sada pro vyhledávání a shlukování obrovských sad sekvencí. Podobná citlivost na BLAST a PSI-BLAST, ale řádově rychlejší | Protein | Steinegger M, Mirdita M, Galiez C, Söding J[9] | 2017 |
POUŽITÍ | Ultrarychlý nástroj pro sekvenční analýzu | Oba | Edgar, R. C. (2010). „Vyhledávejte a shlukujte řády rychleji než BLAST“. Bioinformatika. 26 (19): 2460–2461. doi:10.1093 / bioinformatika / btq461. PMID 20709691. vydání | 2010 |
OSWALD | OpenCL Smith-Waterman na FPGA společnosti Altera pro velké databáze proteinů | Protein | Rucci E, García C, Botella G, De Giusti A, Naiouf M, Prieto-Matías M[10] | 2016 |
parasail | Rychlé vyhledávání Smith-Waterman pomocí paralelizace SIMD | Oba | Denně J | 2015 |
PSI-BLAST | Poziční specifická iterativní BLAST, místní vyhledávání s bodovací matice specifické pro danou pozici, mnohem citlivější než BLAST | Protein | Altschul SF, Madden TL, Schäffer AA, Zhang J, Zhang Z, Miller W., Lipman DJ[11] | 1997 |
PSI-Search | Kombinace vyhledávacího algoritmu Smith-Waterman s PSI-BLAST strategie konstrukce profilu k nalezení vzdáleně příbuzných proteinových sekvencí a prevence homologních chyb při příliš velkém rozšíření. | Protein | Li W, McWilliam H, Goujon M, Cowley A, Lopez R, Pearson WR[12] | 2012 |
ScalaBLAST | Vysoce paralelní škálovatelný BLAST | Oba | Oehmen a kol.[13] | 2011 |
Sequilab | Propojování a profilování údajů o seřazení sekvencí z výsledků NCBI-BLAST s hlavními servery / službami pro sekvenční analýzu | Nukleotid, peptid | 2010 | |
SAM | Místní a globální vyhledávání pomocí profilů Skryté modely Markov, citlivější než PSI-BLAST | Oba | Karplus K., Krogh A[14] | 1999 |
VYHLEDÁVÁNÍ | Hledání Smith-Waterman, pomalejší, ale citlivější než FASTA | Oba | ||
SWAPHI | První paralelizovaný algoritmus využívající vznikající Intel Xeon Phis k urychlení vyhledávání proteinové databáze Smith-Waterman | Protein | Liu Y a Schmidt B. | 2014 |
SWAPHI-LS | První paralelní algoritmus Smith-Waterman využívající klastry Intel Xeon Phi k urychlení zarovnání dlouhých sekvencí DNA | DNA | Liu Y, Tran TT, Lauenroth F, Schmidt B | 2014 |
PLAVKA | Implementace Smith-Waterman pro architektury Intel Multicore a Manycore | Protein | Rucci E, García C, Botella G, De Giusti A, Naiouf M a Prieto-Matías M[15] | 2015 |
SWIMM2.0 | Vylepšený Smith-Waterman na architekturách Intel Multicore a Manycore založených na vektorových rozšířeních AVX-512 | Protein | Rucci E, García C, Botella G, De Giusti A, Naiouf M a Prieto-Matías M[16] | 2018 |
VÝPAD | Rychlé vyhledávání Smith-Waterman pomocí paralelizace SIMD | Oba | Rognes T | 2011 |
*Typ sekvence: protein nebo nukleotid
Párové zarovnání
název | Popis | Typ sekvence * | Typ zarovnání ** | Autor | Rok |
---|---|---|---|---|---|
ACANA | Rychlé heuristické ukotvení založené na párovém zarovnání | Oba | Oba | Huang, Umbach, Li | 2005 |
AlignMe | Zarovnání pro sekvence membránových proteinů | Protein | Oba | M. Stamm, K. Khafizov, R. Staritzbichler, L.R. Pro ostatní | 2013 |
ALLALIGN | U molekul DNA, RNA a proteinů do 32 MB zarovná všechny sekvence velikosti K nebo větší. Podobné zarovnání jsou seskupeny pro analýzu. Automatický filtr opakovaných sekvencí. | Oba | Místní | E. Wachtel | 2017 |
Biovodič Biostrings :: pairwiseAlignment | Dynamické programování | Oba | Oba + končí zdarma | P. Aboyoun | 2008 |
BioPerl dpAlign | Dynamické programování | Oba | Oba + končí zdarma | Y. M. Chan | 2003 |
BLASTZ, LASTZ | Nasazené vzory | Nukleotid | Místní | Schwartz et al.[17][18] | 2004,2009 |
CUDAlign | Zarovnání sekvence DNA neomezené velikosti v jednom nebo více GPU | Nukleotid | Místní, SemiGlobal, Global | E. Sandes[19][20][21] | 2011-2015 |
DNADot | Webový nástroj pro bodové vykreslování | Nukleotid | Globální | R. Bowen | 1998 |
DNASTAR Lasergene Molecular Biology Suite | Software pro zarovnání sekvencí DNA, RNA, proteinu nebo DNA + proteinů pomocí párových a vícenásobných algoritmů pro zarovnání sekvencí, včetně MUSCLE, Mauve, MAFFT, Clustal Omega, Jotun Hein, Wilbur-Lipman, Martinez Needleman-Wunsch, Lipman-Pearson a Dotplot. | Oba | Oba | DNASTAR | 1993-2016 |
DOTLET | Java-dot dot-plot nástroj | Oba | Globální | M. Pagni a T. Junier | 1998 |
HODY | Zadní lokální rozšíření s popisným evolučním modelem | Nukleotid | Místní | A. K. Hudek a D. G. Brown | 2010 |
Překladač genomu Překladač genomu | Srovnejte soubory chromatogramu (.ab1, .scf) se sekvencí šablony, vyhledejte chyby a okamžitě je opravte. | Nukleotid | Místní | Genome Compiler Corporation | 2014 |
G-PAS | Dynamické programování založené na GPU se zpětným sledováním | Oba | Místní, SemiGlobal, Global | W. Frohmberg, M. Kierzynka a kol. | 2011 |
GapMis | Má párové zarovnání sekvence s jednou mezerou | Oba | SemiGlobal | K. Frousios, T. Flouri, C. S. Iliopoulos, K. Park, S. P. Pissis, G. Tischler | 2012 |
Genomový kouzelník | Software pro ultrarychlé vyhledávání lokálních motivů sekvence DNA a párové zarovnání pro data NGS (FASTA, FASTQ). | DNA | Místní, SemiGlobal, Global | Hepperle D (www.sequentix.de) | 2020 |
GGSEARCH, GLSEARCH | Global: Global (GG), Global: Local (GL) alignment with statistics | Protein | Globální v dotazu | W. Pearson | 2007 |
JAligner | Jáva open-source implementace Smith-Waterman | Oba | Místní | A. Moustafa | 2005 |
K * Sync | Zarovnání sekvence proteinu do struktury, které zahrnuje sekundární strukturu, zachování struktury, profily sekvence odvozené od struktury a skóre konsensuálního seřazení | Protein | Oba | D. Chivian a D. Baker[22] | 2003 |
LALIGN | Vícenásobná nepřekrývající se místní podobnost (stejný algoritmus jako SIM) | Oba | Místní nepřekrývající se | W. Pearson | 1991 (algoritmus) |
NW-align | Standardní algoritmus dynamického programování Needleman-Wunsch | Protein | Globální | Y Zhang | 2012 |
pomlouvat | modelování zarovnání; modeluje informační obsah sekvencí | Nukleotid | Oba | D. Powell, L. Allison a T. I. Dix | 2004 |
dohazovač | Waterman-Eggert místní zarovnání (na základě LALIGN) | Oba | Místní | I. Longden (upraveno podle W. Pearsona) | 1999 |
MCALIGN2 | explicitní modely indel evoluce | DNA | Globální | J. Wang et al. | 2006 |
Převlečený | příponový strom na základě | Nukleotid | Globální | S. Kurtz et al. | 2004 |
jehla | Needleman-Wunsch dynamické programování | Oba | SemiGlobal | A. Bleasby | 1999 |
Ngila | náklady na logaritmickou a afinní mezeru a explicitní modely vývoje indelu | Oba | Globální | R. Cartwright | 2007 |
NW | Needleman-Wunsch dynamické programování | Oba | Globální | A.C.R. Martin | 1990-2015 |
parasail | C / C ++ / Python / Java SIMD dynamická programovací knihovna pro SSE, AVX2 | Oba | Globální, bez konce, místní | J. Daily | 2015 |
Cesta | Smith-Waterman na protein zadní-překlad graf (detekuje posuny rámů na úrovni bílkovin) | Protein | Místní | M. Gîrdea et al.[23] | 2009 |
Lovec vzorů | Nasazený vzor | Nukleotid | Místní | B. Ma et al.[24][25] | 2002–2004 |
ProbA (také propA) | Stochastické vzorkování funkce oddílu pomocí dynamické programování | Oba | Globální | U. Mückstein | 2002 |
PyMOL | Příkaz „align“ zarovná sekvenci a použije ji na strukturu | Protein | Globální (podle výběru) | W. L. DeLano | 2007 |
REPuter | příponový strom na základě | Nukleotid | Místní | S. Kurtz et al. | 2001 |
SABERTOOTH | Zarovnání pomocí předpokládaných profilů připojení | Protein | Globální | F. Teichert, J. Minning, U. Bastolla a M. Porto | 2009 |
Satsuma | Paralelní zarovnání synteny celého genomu | DNA | Místní | M.G. Grabherr et al. | 2010 |
SEQALN | Různé dynamické programování | Oba | Místní nebo globální | SLEČNA. Waterman a P. Hardy | 1996 |
SIM, GAP, NAP, LAP | Místní podobnost s různým zacházením s mezerami | Oba | Místní nebo globální | X. Huang a W. Miller | 1990-6 |
SIM | Místní podobnost | Oba | Místní | X. Huang a W. Miller | 1991 |
SPA: Super párové vyrovnání | Rychlé párové globální zarovnání | Nukleotid | Globální | Shen, Yang, Yao, Hwang | 2002 |
VYHLEDÁVÁNÍ | Místní (Smith-Waterman ) sladění se statistikami | Protein | Místní | W. Pearson | 1981 (Algoritmus) |
Sekvenční studio | Java applet demonstrující různé algoritmy z[26] | Obecná sekvence | Místní a globální | A. Meskauskas | 1997 (referenční kniha) |
ROZDĚLOVAČ | Smith-Waterman Acceleration on Intel's FPGA with OpenCL for Long DNA Sequences | Nukleotid | Místní | E. Rucci[27][28] | 2017-2018 |
SWIFT oblek | Rychlé vyhledávání místního zarovnání | DNA | Místní | K. Rasmussen,[29] W. Gerlach | 2005,2008 |
nosítka | Optimalizováno pro paměť Needleman-Wunsch dynamické programování | Oba | Globální | I. Longden (upraveno G. G. Myersem a W. Millerem) | 1999 |
tranalign | Zarovnává sekvence nukleových kyselin dané přiřazením proteinu | Nukleotid | NA | G. Williams (upraveno z B. Pearsona) | 2002 |
UGENE | Opensource Smith-Waterman pro SSE / CUDA, opakovací vyhledávač založený na poli Suffix a dotplot | Oba | Oba | UniPro | 2010 |
voda | Smith-Waterman dynamické programování | Oba | Místní | A. Bleasby | 1999 |
wordmatch | k-tuple párová shoda | Oba | NA | I. Longden | 1998 |
YASS | Nasazené vzory | Nukleotid | Místní | L. Noe a G. Kucherov[30] | 2004 |
*Typ sekvence: protein nebo nukleotid **Typ zarovnání: místní nebo globální
Zarovnání více sekvencí
název | Popis | Typ sekvence * | Typ zarovnání ** | Autor | Rok | Licence |
---|---|---|---|---|---|---|
ABA | Zarovnání A-Bruijn | Protein | Globální | B. Raphael et al. | 2004 | Proprietární, freeware pro vzdělávání, výzkum, neziskové organizace |
ALE | ruční vyrovnání; nějaká softwarová pomoc | Nukleotidy | Místní | J. Blandy a K. Fogel | 1994 (nejnovější verze 2007) | Volný, uvolnit, GPL 2 |
ALLALIGN | U molekul DNA, RNA a proteinů do 32 MB srovnává všechny sekvence velikosti K nebo větší, MSA nebo v rámci jedné molekuly. Podobné zarovnání jsou seskupeny pro analýzu. Automatický filtr opakovaných sekvencí. | Oba | Místní | E. Wachtel | 2017 | Volný, uvolnit |
MAPA | Sekvence žíhání | Oba | Globální | A. Schwartz a L. Pachter | 2006 | |
anon. | rychlé a optimální zarovnání tří sekvencí pomocí nákladů na lineární mezery | Nukleotidy | Globální | D. Powell, L. Allison a T. I. Dix | 2000 | |
BAli-Phy | Strom + více zarovnání; pravděpodobnostní-Bayesian; společný odhad | Oba + kodony | Globální | BD Redelings a MA Suchard | 2005 (nejnovější verze 2018) | Volný, uvolnit, GPL |
Base-by-Base | Editor vícenásobných sekvencí založený na Javě s integrovanými analytickými nástroji | Oba | Místní nebo globální | R. Brodie et al. | 2004 | Proprietární, freeware, musí se zaregistrovat |
CHAOS, DIALIGN | Iterativní zarovnání | Oba | Místní (upřednostňováno) | M. Brudno a B. Morgenstern | 2003 | |
Clustal Ž | Postupné zarovnání | Oba | Místní nebo globální | Thompson et al. | 1994 | Volný, uvolnit, LGPL |
CodonCode Aligner | Vícenásobné zarovnání; Podpora ClustalW & Phrap | Nukleotidy | Místní nebo globální | P. Richterich et al. | 2003 (nejnovější verze 2009) | |
Kompas | Porovnání sekvence více proteinových sekvencí s hodnocením statistické významnosti | Protein | Globální | R.I. Sadreyev, et al. | 2009 | |
ROZLUŠTIT | Progresivní iterativní zarovnání | Oba | Globální | Erik S. Wright | 2014 | Volný, uvolnit, GPL |
DIALIGN-TX a DIALIGN-T | Metoda založená na segmentech | Oba | Místní (preferovaný) nebo globální | A.R. Subramanian | 2005 (nejnovější verze 2008) | |
Zarovnání DNA | Metoda založená na segmentech pro vnitrodruhové zarovnání | Oba | Místní (preferovaný) nebo globální | A. Roehl | 2005 (nejnovější verze 2008) | |
Assembler DNA Baser Sequence | Vícenásobné zarovnání; Plně automatické zarovnání sekvence; Automatická korekce nejednoznačnosti; Interní volající; Zarovnání sekvence příkazového řádku | Nukleotidy | Místní nebo globální | Heracle BioSoft SRL | 2006 (nejnovější verze 2018) | Komerční (některé moduly jsou freeware) |
DNADynamo | navázal DNA na protein vícenásobné zarovnání s SVAL, Clustal a Smith-Waterman | Oba | Místní nebo globální | DNADynamo | 2004 (nejnovější verze 2017) | |
DNASTAR Lasergene Molecular Biology Suite | Software pro srovnávání sekvencí DNA, RNA, proteinů nebo DNA + proteinů pomocí párových a vícenásobných algoritmů pro zarovnání sekvencí včetně MUSCLE, Mauve, MAFFT, Clustal Omega, Jotun Hein, Wilbur-Lipman, Martinez Needleman-Wunsch, Lipman-Pearson a Dotplot. | Oba | Místní nebo globální | DNASTAR | 1993-2016 | |
EDNA | Energetické vícenásobné sekvenční zarovnání pro weby vázající DNA | Nukleotidy | Místní nebo globální | Salama, RA. et al. | 2013 | |
FAMSA | Progresivní zarovnání pro extrémně velké rodiny proteinů (stovky tisíc členů) | Protein | Globální | Deorowicz a kol. | 2016 | |
FSA | Sekvence žíhání | Oba | Globální | R. K. Bradley a kol. | 2008 | |
Geniální | Progresivní iterační zarovnání; ClustalW plugin | Oba | Místní nebo globální | AJ. Drummond et al. | 2005 (nejnovější verze 2017) | |
Kalign | Postupné zarovnání | Oba | Globální | T. Lassmann | 2005 | |
MAFFT | Progresivní iterativní zarovnání | Oba | Místní nebo globální | K. Katoh et al. | 2005 | Volný, uvolnit, BSD |
MARNA | Multi-zarovnání RNA | RNA | Místní | S. Siebert et al. | 2005 | |
MAVID | Postupné zarovnání | Oba | Globální | N. Bray a L. Pachter | 2004 | |
MSA | Dynamické programování | Oba | Místní nebo globální | D.J. Lipman et al. | 1989 (upraveno 1995) | |
MSAProbs | Dynamické programování | Protein | Globální | Y. Liu, B. Schmidt, D. Maskell | 2010 | |
MULTALIN | Dynamické programování - shlukování | Oba | Místní nebo globální | F. Corpet | 1988 | |
Multi-LAGAN | Progresivní přizpůsobení dynamického programování | Oba | Globální | M. Brudno et al. | 2003 | |
SVAL | Progresivní iterativní zarovnání | Oba | Místní nebo globální | R. Edgar | 2004 | |
Opál | Progresivní iterativní zarovnání | Oba | Místní nebo globální | T. Wheeler a J. Kececioglu | 2007 (nejnovější stabilní 2013, nejnovější beta 2016) | |
Pekanový ořech | Pravděpodobnostní konzistence | DNA | Globální | B. Paten et al. | 2008 | |
Phylo | Lidský výpočetní rámec pro řešení komparativní genomiky vícenásobné zarovnání | Nukleotidy | Místní nebo globální | McGill Bioinformatics | 2010 | |
PMFastR | Progresivní uspořádání s vědomím struktury | RNA | Globální | D. DeBlasio, J Braund, S Zhang | 2009 | |
Pralinka | Progresivní iterativní konzistence homologie rozšířené zarovnání s předprofilem a predikcí sekundární struktury | Protein | Globální | J. Heringa | 1999 (nejnovější verze 2009) | |
PicXAA | Neprogresivní, maximální očekávané zarovnání přesnosti | Oba | Globální | S.M.E. Sahraeian a B.J. Yoon | 2010 | |
POA | Částečná objednávka / skrytý Markovův model | Protein | Místní nebo globální | C. Lee | 2002 | |
Probalign | Pravděpodobnostní / konzistence s pravděpodobností funkce oddílu | Protein | Globální | Roshan a Livesay | 2006 | Volný, uvolnit, veřejná doména |
ProbCons | Pravděpodobnostní / konzistence | Protein | Místní nebo globální | C. Do et al. | 2005 | Volný, uvolnit, veřejná doména |
PROMALS3D | Progresivní zarovnání / skrytý Markovův model / sekundární struktura / 3D struktura | Protein | Globální | J. Pei et al. | 2008 | |
PRRN / PRRP | Iterativní zarovnání (zejména upřesnění) | Protein | Místní nebo globální | Y. Totoki (na základě O. Gotoh) | 1991 a později | |
PSAlign | Zarovnání zachovává nehuristické | Oba | Místní nebo globální | S.H. Sze, Y. Lu, Q. Yang. | 2006 | |
RevTrans | Kombinuje zarovnání DNA a proteinů zpětným překladem vyrovnání proteinů na DNA. | DNA / Protein (speciální) | Místní nebo globální | Wernersson a Pedersen | 2003 (nejnovější verze 2005) | |
SÁGA | Zarovnání sekvence genetickým algoritmem | Protein | Místní nebo globální | C. Notredame et al. | 1996 (nová verze 1998) | |
SAM | Skrytý Markovův model | Protein | Místní nebo globální | A. Krogh et al. | 1994 (nejnovější verze 2002) | |
Těsnění | Ruční vyrovnání | Oba | Místní | A. Rambaut | 2002 | |
StatAlign | Bayesovský společný odhad sladění a fylogeneze (MCMC) | Oba | Globální | A. Novak et al. | 2008 | |
Stemloc | Vícenásobné zarovnání a predikce sekundární struktury | RNA | Místní nebo globální | I. Holmes | 2005 | Volný, uvolnit, GPL 3 (parte de ŠIPKA ) |
T-káva | Citlivější postupné zarovnání | Oba | Místní nebo globální | C. Notredame et al. | 2000 (nejnovější verze 2008) | Volný, uvolnit, GPL 2 |
UGENE | Podporuje vícenásobné zarovnání s SVAL, KAlign, Clustal a MAFFT pluginy | Oba | Místní nebo globální | Tým UGENE | 2010 (nejnovější verze 2020) | Volný, uvolnit, GPL 2 |
Přátelé | VectorFriends Aligner, SVAL plugin a Clustal W plugin | Oba | Místní nebo globální | Tým BioFriends | 2013 | Proprietární, freeware pro akademické použití |
GLProbs | Adaptivní párový skrytý Markovův přístup založený na modelu | Protein | Globální | Y. Ye et al. | 2013 |
*Typ sekvence: protein nebo nukleotid. **Typ zarovnání: místní nebo globální
Genomická analýza
název | Popis | Typ sekvence * | |
---|---|---|---|
OREL [31] | Ultrarychlý nástroj k nalezení relativních chybějících slov v genomových datech | Nukleotid | |
ACT (Artemis Comparison Tool) | Syntenní a komparativní genomika | Nukleotid | |
ZANÍCENÝ | Párové globální sladění s celými genomy | Nukleotid | |
BLAT | Zarovnání sekvencí cDNA s genomem. | Nukleotid | |
ROZLUŠTIT | Zarovnání přeskupených genomů pomocí 6 rámcového překladu | Nukleotid | |
FLAK | Zarovnání a analýza fuzzy celého genomu | Nukleotid | |
GMAP | Zarovnání sekvencí cDNA s genomem. Identifikuje spojovací místa spojení s vysokou přesností. | Nukleotid | |
Splign | Zarovnání sekvencí cDNA s genomem. Identifikuje spojovací místa spojení s vysokou přesností. Schopen rozpoznat a oddělit genové duplikace. | Nukleotid | |
Nafialovělý | Vícenásobné seřazení přeskupených genomů | Nukleotid | |
MGA | Zarovnávač více genomu | Nukleotid | |
Mulan | Lokální vícenásobné srovnání sekvencí o délce genomu | Nukleotid | |
Multiz | Vícenásobné vyrovnání genomů | Nukleotid | |
PLAST-ncRNA | Hledejte ncRNA v genomech podle místního zarovnání funkce oddílu | Nukleotid | |
Sequerome | Profilování dat zarovnání sekvence s hlavními servery / službami | Nukleotid, peptid | |
Sequilab | Profilování dat zarovnání sekvence z výsledků NCBI-BLAST pomocí hlavních serverových služeb | Nukleotid, peptid | |
Zamíchejte LAGAN | Pairwise glocal alignment of Complete genome regions | Nukleotid | |
SIBsim4, Sim4 | Program navržený pro srovnání exprimované sekvence DNA s genomovou sekvencí, což umožňuje introny | Nukleotid | |
SLAM | Nález genu, zarovnání, anotace (identifikace homologie člověk-myš) | Nukleotid | |
SRPRISM | Efektivní zarovnávač pro sestavení s výslovnými zárukami, zarovnání čtení bez spojů | Nukleotid |
*Typ sekvence: protein nebo nukleotid
Hledání motivu
název | Popis | Typ sekvence * |
---|---|---|
PMS | Hledání a objevování motivů | Oba |
FMM | Hledání a objevování motivů (lze získat také pozitivní a negativní sekvence jako vstup pro obohacené vyhledávání motivů) | Nukleotid |
BLOKY | Neztištěná identifikace motivu z databáze BLOCKS | Oba |
eMOTIF | Extrakce a identifikace kratších motivů | Oba |
Vzorník motivů Gibbs | Stochastická extrakce motivů statistickou pravděpodobností | Oba |
HMMTOP | Predikce transmembránových šroubovic a topologie proteinů | Protein |
I-stránky | Knihovna motivů místní struktury | Protein |
JCoils | Předpověď Navinutá cívka a Leucinový zip | Protein |
MEME /STOŽÁR | Objevování a hledání motivů | Oba |
CUDA-MEME | Algoritmus MEME (v4.4.0) s akcelerací GPU pro klastry GPU | Oba |
MERCI | Objevování a hledání diskriminačních motivů | Oba |
PHI-Blast | Nástroj pro vyhledávání a zarovnání motivů | Oba |
Fyloscan | Nástroj pro vyhledávání motivů | Nukleotid |
PRATT | Generování vzorů pro použití s ScanProsite | Protein |
ScanProsite | Nástroj pro vyhledávání databáze motivů | Protein |
TEIRESIAS | Extrakce motivů a vyhledávání v databázi | Oba |
ČEDIČ | Hledání více motivů a regulárních výrazů | Oba |
*Typ sekvence: protein nebo nukleotid
Benchmarking
název | Autoři |
---|---|
PFAM 30.0 (2016) | |
SMART (2015) | Letunic, Copley, Schmidt, Ciccarelli, Doerks, Schultz, Ponting, Bork |
BAliBASE 3 (2015) | Thompson, Plewniak, Poch |
Oxbench (2011) | Raghava, Searle, Audley, Barber, Barton |
Srovnávací test (2009) | Edgar |
HOMSTRAD (2005) | Mizuguchi |
PREFAB 4.0 (2005) | Edgar |
SABmark (2004) | Van Walle, Lasters, Wyns |
Zarovnejte diváky, editory
Prosím podívej se Seznam softwaru pro vizualizaci zarovnání.
Zarovnání sekvence krátkého čtení
název | Popis | možnost spárovaného konce | Použijte kvalitu FASTQ | Mezera | Vícevláknové | Licence | Odkaz | Rok |
---|---|---|---|---|---|---|---|---|
Arioc | Vypočítá Smith-Waterman mezery zarovnání a kvality mapování na jednom nebo více GPU. Podporuje zarovnání BS-seq. Zpracovává 100 000 až 500 000 čtení za sekundu (liší se podle dat, hardwaru a nakonfigurované citlivosti). | Ano | Ne | Ano | Ano | Volný, uvolnit, BSD | [32] | 2015 |
BarraCUDA | GPGPU zrychlilo Burrows-Wheelerova transformace (FM-index) program pro krátké čtení zarovnání založený na BWA, podporuje zarovnání indelů s mezerami a rozšířeními. | Ano | Ne | Ano | Ano, POSIX vlákna a CUDA | Volný, uvolnit, GPL | ||
BBMap | Používá krátké kmery k rychlé indexaci genomu; bez omezení velikosti nebo počtu lešení. Vyšší citlivost a specificita než srovnávače Burrows-Wheeler, s podobnou nebo vyšší rychlostí. Provádí globální zarovnání optimalizované pro afinní transformaci, které je pomalejší, ale přesnější než Smith-Waterman. Zpracovává data Illumina, 454, PacBio, Sanger a Ion Torrent. Svědomitý; schopný zpracovat dlouhé indely a RNA-sekv. Čistá Java; běží na jakékoli platformě. Používá Společný genomový institut. | Ano | Ano | Ano | Ano | Volný, uvolnit, BSD | 2010 | |
NEJLEPŠÍ | Explicitní kompromis času a přesnosti s předchozím odhadem přesnosti, podporovaný indexováním referenčních sekvencí. Optimálně komprimuje indexy. Zvládne miliardy krátkých čtení. Zvládne vkládání, mazání, SNP a barevné chyby (může mapovat čtení barevného prostoru ABI SOLiD). Provede úplné zarovnání Smith Waterman. | Ano, POSIX vlákna | Volný, uvolnit, GPL | [33] | 2009 | |||
BigBWA | Spustí Burrows-Wheeler Aligner -BWA na a Hadoop shluk. Podporuje algoritmy BWA-MEM, BWA-ALN a BWA-SW, které pracují se spárovanými a jednoduchými čteními. To znamená důležité zkrácení výpočetního času při spuštění v clusteru Hadoop, přidání škálovatelnosti a odolnosti proti chybám. | Ano | Ořezávání základen nízké kvality | Ano | Ano | Volný, uvolnit, GPL 3 | [34] | 2015 |
BLASTN | Program srovnávání nukleotidů BLAST, pomalý a nepřesný pro krátká čtení, a spíše než referenční genom používá databázi sekvencí (EST, Sangerova sekvence). | |||||||
BLAT | Vytvořil Jim Kent. Zvládne jeden nesoulad v počátečním kroku zarovnání. | Ano, klient-server | Proprietární, freeware pro akademické a nekomerční použití | [35] | 2002 | |||
Motýlek | Používá a Burrows-Wheelerova transformace vytvořit trvalý, opakovaně použitelný index genomu; 1,3 GB paměťová stopa pro lidský genom. Zarovná více než 25 milionů čteček Illumina za 1 hodinu CPU. Podporuje zásady zarovnání podobné typu Maq a SOAP | Ano | Ano | Ne | Ano, POSIX vlákna | Volný, uvolnit, Umělecký | [36] | 2009 |
BWA | Používá a Burrows-Wheelerova transformace vytvořit index genomu. Je to o něco pomalejší než Bowtie, ale umožňuje indelům vyrovnání. | Ano | Ořezávání základen nízké kvality | Ano | Ano | Volný, uvolnit, GPL | [37] | 2009 |
BWA-PSSM | Pravděpodobnostní krátký čtecí zarovnávač založený na použití polohovacích bodovacích matic (PSSM). Zarovnávač je přizpůsobitelný v tom smyslu, že může brát v úvahu skóre kvality čtení a modely zkreslení specifických pro data, jako jsou ty, které byly pozorovány ve starověké DNA, datech PAR-CLIP nebo genomech se zkreslenými nukleotidovými kompozicemi.[38] | Ano | Ano | Ano | Ano | Volný, uvolnit, GPL | [38] | 2014 |
CASHX | Kvantifikujte a spravujte velká množství krátce načtených sekvenčních dat. Kanál CASHX obsahuje sadu nástrojů, které lze použít společně nebo samostatně jako moduly. Tento algoritmus je velmi přesný pro perfektní zásahy do referenčního genomu. | Ne | Proprietární, freeware pro akademické a nekomerční použití | |||||
Průtrž mračen | Krátké čtení mapování pomocí Hadoop MapReduce | Ano, Hadoop MapReduce | Volný, uvolnit, Umělecký | |||||
CUDA-EC | Oprava chyby zarovnání krátkého čtení pomocí GPU. | Ano, GPU povoleno | ||||||
CUSHAW | CUDA kompatibilní zarovnávač krátkých čtení velkých genomů založený na Burrows-Wheelerově transformaci | Ano | Ano | Ne | Ano (GPU povoleno) | Volný, uvolnit, GPL | [39] | 2012 |
CUSHAW2 | Mezery mezi krátkým a dlouhým čtením založené na semenech maximální přesné shody. Tento zarovnávač podporuje zarovnání čtení základního prostoru (např. Z Illumina, 454, Ion Torrent a PacBio) a ABI SOLiD pro čtení barevného prostoru. | Ano | Ne | Ano | Ano | Volný, uvolnit, GPL | 2014 | |
CUSHAW2-GPU | Zarovnávač krátkého čtení CUSHAW2 s akcelerací GPU. | Ano | Ne | Ano | Ano | Volný, uvolnit, GPL | ||
CUSHAW3 | Citlivé a přesné zarovnání krátkého čtení v základním a barevném prostoru s hybridním výsevem | Ano | Ne | Ano | Ano | Volný, uvolnit, GPL | [40] | 2012 |
drFAST | Přečtěte si software pro zarovnání mapování, který implementuje lhostejnost mezipaměti, aby se minimalizovaly přenosy hlavní / mezipaměti, jako jsou mrFAST a mrsFAST, avšak navržené pro platformu sekvenování SOLiD (čte barevný prostor). Vrátí také všechna možná umístění map pro lepší objevení strukturálních variací. | Ano | Ano, pro strukturální variaci | Ano | Ne | Volný, uvolnit, BSD | ||
ELAND | Realizováno společností Illumina. Zahrnuje nezaseknuté zarovnání s konečnou délkou čtení. | |||||||
OREL | Rozšířená náhodná numerická alignEr pro přesné zarovnání čtení NGS. Může mapovat čtení zpracovaná hydrogensiřičitanem. | Ano | Ořezávání základen nízké kvality | Ano | Vícevláknové zpracování a podpora MPI | Volný, uvolnit, GPL 3 | ||
GASSST | Vyhledá globální zarovnání krátkých sekvencí DNA proti velkým bankám DNA | Multithreading | CeCILL licence verze 2. | [41] | 2011 | |||
KLENOT | Vysoce kvalitní seřizovací motor (vyčerpávající mapování se substitucemi a indels). Přesnější a několikrát rychlejší než BWA nebo Bowtie 1/2. Mnoho samostatných biologických aplikací (mapovač, split mapovač, mapovatelnost a další) je k dispozici. | Ano | Ano | Ano | Ano | Dvojí, freeware pro nekomerční použití; Zdroj GEM je momentálně nedostupný | [42] | 2012 |
Genalice MAP | Ultrarychlý a komplexní zarovnávač čtení NGS s vysokou přesností a malým úložným prostorem. | Ano | Ořezávání základen nízké kvality | Ano | Ano | Proprietární, komerční | ||
Geneious Assembler | Rychlý a přesný asembler překrytí se schopností zvládnout jakoukoli kombinaci technologie sekvenování, délku čtení, jakoukoli orientaci párování, s jakoukoli velikostí spaceru pro párování, s referenčním genomem nebo bez něj. | Ano | Proprietární, komerční | |||||
GensearchNGS | Kompletní rámec s uživatelsky přívětivým grafickým uživatelským rozhraním pro analýzu dat NGS. Integruje proprietární vysoce kvalitní algoritmus zarovnání a schopnost zásuvného modulu integrovat různé veřejné zarovnávače do rámce, který umožňuje importovat krátká čtení, zarovnat je, detekovat varianty a generovat zprávy. Je určen pro resekvenování projektů, zejména v diagnostickém prostředí. | Ano | Ne | Ano | Ano | Proprietární, komerční | ||
GMAP a GSNAP | Robustní, rychlé zarovnání s krátkým čtením. GMAP: delší čtení, s více indely a spoji (viz záznam výše v části Genomická analýza); GSNAP: kratší čtení, s jedním indelem nebo až dvěma spoji na čtení. Užitečné pro digitální genovou expresi, SNP a indel genotypování. Vyvinut Thomas Wu ve společnosti Genentech. Používá Národní centrum pro zdroje genomu (NCGR) v Alpheu. | Ano | Ano | Ano | Ano | Proprietární, freeware pro akademické a nekomerční použití | ||
GNUMAP | Přesně provádí mezerové zarovnání sekvenčních dat získaných ze sekvenčních strojů nové generace (konkrétně Solexa-Illumina) zpět do genomu jakékoli velikosti. Zahrnuje ořezávání adaptéru, volání SNP a analýzu sekvence bisulfitu. | Ano, podporuje také soubory Illumina * _int.txt a * _prb.txt se všemi 4 skóre kvality pro každou základnu | Vícevláknové zpracování a podpora MPI | [43] | 2009 | |||
Úl-šestihran | Používá a hash tabulka a Bloom Matrix pro vytvoření a filtrování potenciálních pozic na genomu. Pro vyšší efektivitu využívá křížovou podobnost mezi krátkými čteními a vyhýbá se přeskupení nejedinečných redundantních sekvencí. Je rychlejší než Bowtie a BWA a umožňuje indels a odlišná citlivá zarovnání virů, bakterií a konzervativnější eukaryotické zarovnání. | Ano | Ano | Ano | Ano | Proprietární, freeware pro akademické a nekomerční uživatele registrované v instanci nasazení HIVE | [44] | 2014 |
IMOS | Vylepšený Meta-aligner a Minimap2 On Spark. Distribuovaný zarovnávač s dlouhým čtením na platformě Apache Spark s lineární škálovatelností w.r.t. provedení jednoho uzlu. | Ano | Ano | Ano | Volný, uvolnit | |||
Isaac | Plně využívá veškerý výpočetní výkon dostupný v jednom uzlu serveru; proto se dobře rozšiřuje na širokou škálu hardwarových architektur a výkon zarovnání se zlepšuje s hardwarovými schopnostmi | Ano | Ano | Ano | Ano | Volný, uvolnit, GPL | ||
POSLEDNÍ | Používá adaptivní semena a efektivněji zvládá sekvence bohaté na opakování (např. Genomy). Například: dokáže sladit čtení s genomy bez opakovaného maskování, aniž by byl přemožen opakovanými zásahy. | Ano | Ano | Ano | Ne | Volný, uvolnit, GPL | [45] | 2011 |
MAQ | Ungapped alignment, který zohledňuje skóre kvality pro každou základnu. | Volný, uvolnit, GPL | ||||||
mrFAST, mrsFAST | Gapped (mrFAST) a ungapped (mrsFAST) software pro zarovnání, který implementuje zapomenutí mezipaměti, aby se minimalizoval přenos hlavní / mezipaměti. Jsou navrženy pro sekvenační platformu Illumina a mohou vracet všechna možná umístění map pro vylepšené objevování strukturálních variací. | Ano | Ano, pro strukturální variaci | Ano | Ne | Volný, uvolnit, BSD | ||
MAMINKA | MOM nebo mapování maximálního oligonukleotidu je nástroj pro porovnávání dotazů, který zachycuje shodu maximální délky v krátkém čtení. | Ano | ||||||
MOSAIK | Rychlý rozdělovač a referenční naváděcí asembler. Zarovná čtení pomocí pruhovaného Smith-Waterman algoritmus nasazený výsledky ze schématu hašování k-mer. Podporuje čtení v rozsahu od velmi krátkých po velmi dlouhé. | Ano | ||||||
MPscan | Rychlé zarovnání založené na filtrační strategii (žádné indexování, použití q-gramů a zpětně nedeterministické DAWG Vhodný) | [46] | 2009 | |||||
Novoalign & NovoalignCS | Čtení mezery mezi jedním a spárovaným koncem čte Illumina GA I & II, ABI Color space & ION Torrent. Vysoká citlivost a specificita s využitím základních kvalit ve všech krocích zarovnání. Zahrnuje ořezávání adaptéru, kalibraci kvality základny, zarovnání Bi-Seq a možnosti hlášení více zarovnání na čtení. Použití nejednoznačných kódů IUPAC jako reference pro běžné SNP může zlepšit odvolání SNP a odstranit alelické zkreslení. | Ano | Ano | Ano | Verze s více podprocesy a MPI jsou k dispozici s placenou licencí | Proprietární, freeware verze s jedním závitem pro akademické a nekomerční použití | ||
NextGENe | Vyvinuto pro použití biology provádějícími analýzu sekvenčních dat nové generace z Roche Genome Sequencer FLX, Illumina GA / HiSeq, SOLiD System společnosti Life Technologies Applied BioSystems, PacBio a Ion Torrent. | Ano | Ano | Ano | Ano | Proprietární, komerční | ||
NextGenMap | Flexibilní a rychle čitelný mapovací program (dvakrát rychlejší než BWA) dosahuje citlivosti mapování srovnatelnou se Stampy. Interně používá paměťově efektivní indexovou strukturu (hashovací tabulku) k ukládání pozic všech 13-mer přítomných v referenčním genomu. Mapovací oblasti, kde je vyžadováno párové zarovnání, jsou dynamicky určovány pro každé čtení. Používá rychlé pokyny SIMD (SSE) k urychlení výpočtů zarovnání na CPU. Pokud je k dispozici, zarovnání se počítá na GPU (pomocí OpenCL / CUDA), což dále snižuje dobu běhu o 20–50%. | Ano | Ne | Ano | Ano, POSIX vlákna, OpenCL /CUDA, SSE | Volný, uvolnit | [47] | 2013 |
Omixon Varianta Toolkit | Zahrnuje vysoce citlivé a vysoce přesné nástroje pro detekci SNP a indelů. Nabízí řešení pro mapování krátkých čtení NGS se střední vzdáleností (až 30% divergence sekvence) od referenčních genomů. Nepředstavuje žádná omezení velikosti reference, což v kombinaci s vysokou citlivostí dělá sadu nástrojů Variant vhodnou pro cílené projekty sekvenování a diagnostiku. | Ano | Ano | Ano | Ano | Proprietární, komerční | ||
PALMapper | Efektivně počítá spojované i neřízené zarovnání s vysokou přesností. Spoléhá se na strategii strojového učení v kombinaci s rychlým mapováním založeným na pásmovém algoritmu podobném Smith-Watermanovi, který na jednom CPU zarovná přibližně 7 milionů čtení za hodinu. Upřesňuje původně navržený přístup QPALMA. | Ano | Volný, uvolnit, GPL | |||||
Partek Flow | Pro použití biology a bioinformatiky. Podporuje zarovnání bez mezer, mezer a spojů spojů z jednoho a spárovaného čtení z Illumina, Life technologies Solid TM, Roche 454 a surových dat Ion Torrent (s informacemi o kvalitě nebo bez nich). Integruje výkonnou kontrolu kvality na úrovni FASTQ / Qual a na zarovnaných datech. Mezi další funkce patří ořezávání a filtrování nezpracovaných čtení, detekce SNP a InDel, kvantifikace mRNA a mikroRNA a detekce fúzního genu. | Ano | Ano | Ano | Je možné instalovat více procesorů, klient-server | Proprietární, komerční, zkušební verze zdarma | ||
SLOŽIT | Indexuje genom a poté rozšiřuje semena pomocí předem vypočítaného zarovnání slov. Funguje se základním prostorem, barevným prostorem (SOLID) a může srovnávat genomická a sestříhaná čtení RNA-seq. | Ano | Ano | Ano | Ano | Proprietární, freeware pro akademické a nekomerční použití | ||
PerM | Indexuje genom s periodickými semeny, aby rychle našel zarovnání s plnou citlivostí až se čtyřmi nesoulady. Může mapovat čtení Illumina a SOLiD. Na rozdíl od většiny mapovacích programů se rychlost zvyšuje pro delší délky čtení. | Ano | Volný, uvolnit, GPL | [48] | ||||
PRIMEX | Indexuje genom pomocí vyhledávací tabulky k-mer s plnou citlivostí až k nastavitelnému počtu neshod. Nejlepší je mapovat sekvence 15-60 bp na genom. | Ne | Ne | Ano | Ne, více procesů na jedno hledání | [1] | 2003 | |
QPalma | Může používat skóre kvality, délky intronů a předpovědi výpočtových spojovacích míst k provedení a provedení nezaujatého zarovnání. Může být vyškolen na specifika experimentu a genomu RNA-seq. Užitečné pro objevování spojovacích míst / intronů a pro vytváření genových modelů. (Rychlejší verzi najdete v PALMapper). | Ano, klient-server | Volný, uvolnit, GPL 2 | |||||
RazerS | Žádný limit délky čtení. Hamming nebo upravit mapování vzdálenosti s konfigurovatelnými chybami. Konfigurovatelná a předvídatelná citlivost (kompromis runtime / citlivost). Podporuje mapování čtení spárovaného konce. | Volný, uvolnit, LGPL | ||||||
SKUTEČNÉ, SKUTEČNÉ | REAL je efektivní, přesný a citlivý nástroj pro sladění krátkých čtení získaných ze sekvenování nové generace. Program zvládne enormní množství jednostranných čtení generovaných analyzátorem genomu Illumina / Solexa nové generace. cREAL je jednoduché rozšíření REAL pro přizpůsobení krátkých čtení získaných ze sekvenování příští generace do genomu s kruhovou strukturou. | Ano | Ano | Volný, uvolnit, GPL | ||||
RMAP | Může číst mapy s informacemi o pravděpodobnosti chyby nebo bez nich (skóre kvality) a podporuje mapování čtení se spárovaným koncem nebo s hydrogensiřičitanem. Neexistují žádná omezení ohledně délky čtení nebo počtu neshod. | Ano | Ano | Ano | Volný, uvolnit, GPL 3 | |||
rNA | Randomizovaný numerický zarovnávač pro přesné zarovnání čtení NGS | Ano | Ořezávání základen nízké kvality | Ano | Vícevláknové zpracování a podpora MPI | Volný, uvolnit, GPL 3 | ||
Vyšetřovatel RTG | Extrémně rychlý, tolerantní k vysokému počtu indelů a substitucí. Zahrnuje zarovnání celého čtení. Produkt obsahuje komplexní kanály pro detekci variant a metagenomickou analýzu s libovolnou kombinací dat Illumina, Complete Genomics a Roche 454. | Ano | Ano, pro variantní volání | Ano | Ano | Proprietární, freeware pro individuální použití zkoušejícího | ||
Segemehl | Zvládne vkládání, mazání, neshody; používá pole rozšířených přípon | Ano | Ne | Ano | Ano | Proprietární, freeware pro nekomerční použití | [49] | 2009 |
SeqMap | Až 5 smíšených substitucí a vložení-odstranění; různé možnosti ladění a vstupně-výstupní formáty | Proprietární, freeware pro akademické a nekomerční použití | ||||||
Shrec | Krátká oprava chyby čtení s a příponový strom datová struktura | Ano, Jáva | ||||||
SHRiMP | Indexuje referenční genom od verze 2. Používá masky ke generování možných klíčů. Může mapovat barevný prostor ABI SOLiD. | Ano | Ano | Ano | Ano, OpenMP | Zdarma, [[BSD licence | style = "background: # 9FF; color: black; vertical-align: middle; text-align: center;" class = "free table-free" | Free, BSD ]] derivát | 2009-2011 | |
Kluzák | Slider je aplikace pro výstup analyzátoru sekvence Illumina, která používá soubory "pravděpodobnosti" namísto souborů sekvencí jako vstup pro zarovnání k referenční sekvenci nebo sadě referenčních sekvencí. | Ano | Ano | Ne | Ne | [52][53] | 2009-2010 | |
SOAP, SOAP2, SOAP3, SOAP3-dp | SOAP: robustní s malým (1-3) počtem mezer a nesouladů. Zlepšení rychlosti oproti BLAT, používá hash tabulku s 12 písmeny. SOAP2: použití obousměrného BWT k vytvoření referenčního indexu a je mnohem rychlejší než první verze. SOAP3: Verze s akcelerací GPU, která dokáže najít všechna 4-nesouladná zarovnání za desítky sekund na jeden milion přečtení. SOAP3-dp, také zrychlený GPU, podporuje libovolný počet neshod a mezer podle skóre trestu za afinní mezeru. | Ano | Ne | Ano, SOAP3-dp | Ano, POSIX vlákna; SOAP3, SOAP3-dp potřebují GPU s CUDA Podpěra, podpora | Volný, uvolnit, GPL | [54][55] | |
SOCS | Pro technologie ABI SOLiD. Významné prodloužení času pro mapování čtení s neshodami (nebo chybami barev). Používá iterativní verzi algoritmu pro vyhledávání řetězců Rabin-Karp. | Ano | Volný, uvolnit, GPL | |||||
SparkBWA | Integruje Burrows-Wheeler Aligner —BWA na Apache Spark rámec běží na vrcholu Hadoop. Verze 0.2 z října 2016, podporuje algoritmy BWA-MEM, BWA-backtrack a BWA-ALN. Všechny fungují s čteními na jeden a na pár. | Ano | Ořezávání základen nízké kvality | Ano | Ano | Volný, uvolnit, GPL 3 | [56] | 2016 |
SSAHA, SSAHA2 | Rychle pro malý počet variant | Proprietární, freeware pro akademické a nekomerční použití | ||||||
Stampy | Pro Illumina čte. Vysoká specificita a citlivost pro čtení s indels, strukturálními variantami nebo mnoha SNP. Pomalá, ale rychlost se dramaticky zvýšila použitím BWA pro první průchod vyrovnání. | Ano | Ano | Ano | Ne | Proprietární, freeware pro akademické a nekomerční použití | [57] | 2010 |
Bouřka | Pro Illumina nebo ABI čte SOLiD, s SAM nativní výstup. Vysoce citlivý pro čtení s mnoha chybami, indels (plný od 0 do 15, jinak rozšířená podpora). Používá rozmístěná semena (jeden zásah) a velmi rychlá SSE -SSE2 -AVX2 -AVX-512 pásmový zarovnávací filtr. Pro čtení pouze s pevnou délkou autoři doporučují SHRiMP2 jinak. | Ne | Ano | Ano | Ano, OpenMP | Volný, uvolnit | [58] | 2010 |
Subread, Subjunc | Superrychlé a přesné zarovnávače čtení. Subread lze použít k mapování jak čtení gDNA-seq, tak RNA-seq. Subjunc detekuje spojení exon-exon a mapuje čtení RNA-seq. Zaměstnávají pojmenované paradigma mapování seed-and-vote. | Ano | Ano | Ano | Ano | Volný, uvolnit, GPL 3 | ||
Taipan | De-novo assembler pro Illuminu čte | Proprietární, freeware pro akademické a nekomerční použití | ||||||
UGENE | Visual interface both for Bowtie and BWA, and an embedded aligner | Ano | Ano | Ano | Ano | Volný, uvolnit, GPL | ||
VelociMapper | FPGA-accelerated reference sequence alignment mapping tool from TimeLogic. Rychlejší než Burrows-Wheeler transform -based algorithms like BWA and Bowtie. Supports up to 7 mismatches and/or indels with no performance penalty. Produces sensitive Smith-Waterman gapped alignments. | Ano | Ano | Ano | Ano | Proprietární, komerční | ||
XpressAlign | FPGA based sliding window short read aligner which exploits the embarrassingly parallel property of short read alignment. Performance scales linearly with number of transistors on a chip (i.e. performance guaranteed to double with each iteration of Moore's Law without modification to algorithm). Low power consumption is useful for datacentre equipment. Predictable runtime. Better price/performance than software sliding window aligners on current hardware, but not better than software BWT-based aligners currently. Can manage large numbers (>2) of mismatches. Will find all hit positions for all seeds. Single-FPGA experimental version, needs work to develop it into a multi-FPGA production version. | Proprietární, freeware for academic and noncommercial use | ||||||
ZVĚTŠENÍ | 100% sensitivity for a reads between 15-240 bp with practical mismatches. Velmi rychle. Support insertions and deletions. Works with Illumina & SOLiD instruments, not 454. | Yes (GUI), no (CLI) | Proprietární, komerční | [59] |
Viz také
Reference
- ^ Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ; Gish; Mlynář; Myers; Lipman (October 1990). Msgstr "Základní vyhledávací nástroj pro místní zarovnání". Journal of Molecular Biology. 215 (3): 403–10. doi:10.1016 / S0022-2836 (05) 80360-2. PMID 2231712.CS1 maint: více jmen: seznam autorů (odkaz)
- ^ HPC-BLAST code repository https://github.com/UTennessee-JICS/HPC-BLAST
- ^ Angermüller, C .; Biegert, A .; Söding, J. (prosinec 2012). „Diskriminační modelování pravděpodobností substituce aminokyselin podle konkrétního kontextu“. Bioinformatika. 28 (24): 3240–7. doi:10.1093 / bioinformatika / bts622. PMID 23080114.
- ^ Buchfink, Xie and Huson (2015). "Fast and sensitive protein alignment using DIAMOND". Přírodní metody. 12 (1): 59–60. doi:10.1038/nmeth.3176. PMID 25402007. S2CID 5346781.
- ^ Durbin, Richard; Eddy, Sean R .; Krogh, Anders; Mitchison, Graeme, eds. (1998). Biologická sekvenční analýza: pravděpodobnostní modely proteinů a nukleových kyselin. Cambridge, Velká Británie: Cambridge University Press. ISBN 978-0-521-62971-3.[stránka potřebná ]
- ^ Söding J (April 2005). "Detekce homologie proteinů porovnáním HMM-HMM". Bioinformatika. 21 (7): 951–60. doi:10.1093 / bioinformatika / bti125. PMID 15531603.
- ^ Remmert, Michael; Biegert, Andreas; Hauser, Andreas; Söding, Johannes (2011-12-25). "HHblits: lightning-fast iterative protein sequence searching by HMM-HMM alignment". Přírodní metody. 9 (2): 173–175. doi:10.1038/nmeth.1818. hdl:11858 / 00-001M-0000-0015-8D56-A. ISSN 1548-7105. PMID 22198341. S2CID 205420247.
- ^ Hauswedell H, Singer J, Reinert K (2014-09-01). "Lambda: the local aligner for massive biological data". Bioinformatika. 30 (17): 349–355. doi:10.1093/bioinformatics/btu439. PMC 4147892. PMID 25161219.
- ^ Steinegger, Martin; Soeding, Johannes (2017-10-16). "MMseqs2 enables sensitive protein sequence searching for the analysis of massive data sets". Přírodní biotechnologie. 35 (11): 1026–1028. doi:10.1038/nbt.3988. hdl:11858/00-001M-0000-002E-1967-3. PMID 29035372. S2CID 402352.
- ^ Rucci, Enzo; Garcia, Carlos; Botella, Guillermo; Giusti, Armando E. De; Naiouf, Marcelo; Prieto-Matias, Manuel (2016-06-30). "OSWALD: OpenCL Smith–Waterman on Altera's FPGA for Large Protein Databases". International Journal of High Performance Computing Applications. 32 (3): 337–350. doi:10.1177/1094342016654215. ISSN 1094-3420. S2CID 212680914.
- ^ Altschul SF, Madden TL, Schäffer AA, et al. (Září 1997). „Gapped BLAST and PSI-BLAST: a new generation of protein database search programs“. Výzkum nukleových kyselin. 25 (17): 3389–402. doi:10.1093 / nar / 25.17.3389. PMC 146917. PMID 9254694.
- ^ Li W, McWilliam H, Goujon M, et al. (Červen 2012). "PSI-Search: iterative HOE-reduced profile SSEARCH searching". Bioinformatika. 28 (12): 1650–1651. doi:10.1093/bioinformatics/bts240. PMC 3371869. PMID 22539666.
- ^ Oehmen, C.; Nieplocha, J. (August 2006). "ScalaBLAST: A scalable implementation of BLAST for high-performance data-intensive bioinformatics analysis". IEEE Transactions on Parallel & Distributed Systems. 17 (8): 740–749. doi:10.1109/TPDS.2006.112. S2CID 11122366.
- ^ Hughey, R .; Karplus, K .; Krogh, A. (2003). SAM: sequence alignment and modeling software system. Technical report UCSC-CRL-99-11 (Zpráva). University of California, Santa Cruz, CA.
- ^ Rucci, Enzo; García, Carlos; Botella, Guillermo; De Giusti, Armando; Naiouf, Marcelo; Prieto-Matías, Manuel (2015-12-25). "An energy-aware performance analysis of SWIMM: Smith–Waterman implementation on Intel's Multicore and Manycore architectures". Concurrency and Computation: Practice and Experience. 27 (18): 5517–5537. doi:10.1002/cpe.3598. ISSN 1532-0634. S2CID 42945406.
- ^ Rucci, Enzo; García, Carlos; Botella, Guillermo; De Giusti, Armando; Naiouf, Marcelo; Prieto-Matías, Manuel (2015-12-25). "SWIMM 2.0: enhanced Smith-Waterman on Intel's Multicore and Manycore architectures based on AVX-512 vector extensions". International Journal of Parallel Programming. 47 (2): 296–317. doi:10.1007/s10766-018-0585-7. ISSN 1573-7640. S2CID 49670113.
- ^ Schwartz S, Kent WJ, Smit A, Zhang Z, Baertsch R, Hardison RC, Haussler D, Miller W; Kent; Smit; Zhang; Baertsch; Hardison; Haussler; Miller (2003). "Human-mouse alignments with BLASTZ". Výzkum genomu. 13 (1): 103–107. doi:10.1101/gr.809403. PMC 430961. PMID 12529312.CS1 maint: více jmen: seznam autorů (odkaz)
- ^ Harris R S (2007). Improved pairwise alignment of genomic DNA (Teze).
- ^ Sandes, Edans F. de O.; de Melo, Alba Cristina M.A. (May 2013). "Retrieving Smith-Waterman Alignments with Optimizations for Megabase Biological Sequences Using GPU". IEEE Transactions on Parallel and Distributed Systems. 24 (5): 1009–1021. doi:10.1109/TPDS.2012.194.
- ^ Sandes, Edans F. de O.; Miranda, G.; De Melo, A.C.M.A.; Martorell, X.; Ayguade, E. (May 2014). CUDAlign 3.0: Parallel Biological Sequence Comparison in Large GPU Clusters. Cluster, Cloud and Grid Computing (CCGrid), 2014 14th IEEE/ACM International Symposium on. str. 160. doi:10.1109/CCGrid.2014.18.
- ^ Sandes, Edans F. de O.; Miranda, G.; De Melo, A.C.M.A.; Martorell, X.; Ayguade, E. (August 2014). Fine-grain Parallel Megabase Sequence Comparison with Multiple Heterogeneous GPUs. Proceedings of the 19th ACM SIGPLAN Symposium on Principles and Practice of Parallel Programming. 383–384. doi:10.1145/2555243.2555280.
- ^ Chivian, D; Baker, D (2006). "Homology modeling using parametric alignment ensemble generation with consensus and energy-based model selection". Výzkum nukleových kyselin. 34 (17): e112. doi:10.1093/nar/gkl480. PMC 1635247. PMID 16971460.
- ^ Girdea, M; Noe, L; Kucherov, G (January 2010). "Back-translation for discovering distant protein homologies in the presence of frameshift mutations". Algoritmy pro molekulární biologii. 5 (6): 6. doi:10.1186/1748-7188-5-6. PMC 2821327. PMID 20047662.
- ^ Ma, B.; Tromp, J .; Li, M. (2002). "PatternHunter: faster and more sensitive homology search". Bioinformatika. 18 (3): 440–445. doi:10.1093/bioinformatics/18.3.440. PMID 11934743.
- ^ Li, M .; Ma, B.; Kisman, D.; Tromp, J. (2004). "Patternhunter II: highly sensitive and fast homology search". Journal of Bioinformatics and Computational Biology. 2 (3): 417–439. CiteSeerX 10.1.1.1.2393. doi:10.1142/S0219720004000661. PMID 15359419.
- ^ Gusfield, Dan (1997). Algorithms on strings, trees and sequences. Cambridge univerzitní tisk. ISBN 978-0-521-58519-4.
- ^ Rucci, Enzo; Garcia, Carlos; Botella, Guillermo; Naiouf, Marcelo; De Giusti,Armando; Prieto-Matias, Manuel (2018). "SWIFOLD: Smith-Waterman implementation on FPGA with OpenCL for long DNA sequences". BMC Systems Biology. 12 (Suppl 5): 96. doi:10.1186/s12918-018-0614-6. PMC 6245597. PMID 30458766.
- ^ Rucci, Enzo; Garcia, Carlos; Botella, Guillermo; Naiouf, Marcelo; De Giusti,Armando; Prieto-Matias, Manuel. Accelerating Smith-Waterman Alignment of Long DNA Sequences with OpenCL on FPGA. 5th International Work-Conference on Bioinformatics and Biomedical Engineering. str. 500-511. doi:10.1007/978-3-319-56154-7_45.
- ^ Rasmussen K, Stoye J, Myers EW; Stoye; Myers (2006). "Efficient q-Gram Filters for Finding All epsilon-Matches over a Given Length". Journal of Computational Biology. 13 (2): 296–308. CiteSeerX 10.1.1.465.2084. doi:10.1089/cmb.2006.13.296. PMID 16597241.CS1 maint: více jmen: seznam autorů (odkaz)
- ^ Noe L, Kucherov G; Kucherov (2005). "YASS: enhancing the sensitivity of DNA similarity search". Výzkum nukleových kyselin. 33 (suppl_2): W540–W543. doi:10.1093/nar/gki478. PMC 1160238. PMID 15980530.
- ^ Pratas, Diogo; Silva, Jorge (2020). "Persistent minimal sequences of SARS-CoV-2". Bioinformatika. doi:10.1093/bioinformatics/btaa686. PMID 32730589.
- ^ Wilton, Richard; Budavari, Tamas; Langmead, Ben; Wheelan, Sarah J.; Salzberg, Steven L .; Szalay, Alexander S. (2015). „Arioc: vysokorychlostní zarovnání čtení s GPU zrychleným průzkumem prostoru pro vyhledávání semen a rozšíření“. PeerJ. 3: e808. doi:10,7717 / peerj.808. PMC 4358639. PMID 25780763.
- ^ Homer, Nils; Merriman, Barry; Nelson, Stanley F. (2009). "BFAST: An Alignment Tool for Large Scale Genome Resequencing". PLOS ONE. 4 (11): e7767. doi:10.1371/journal.pone.0007767. PMC 2770639. PMID 19907642.
- ^ Abuín, J.M.; Pichel, J.C.; Pena, T.F.; Amigo, J. (2015). "BigBWA: approaching the Burrows–Wheeler aligner to Big Data technologies". Bioinformatika. 31 (24): 4003–5. doi:10.1093/bioinformatics/btv506. PMID 26323715.
- ^ Kent, W. J. (2002). „BLAT --- BLAST-Like Alignment Tool“. Výzkum genomu. 12 (4): 656–664. doi:10,1101 / gr. 229202. ISSN 1088-9051. PMC 187518. PMID 11932250.
- ^ Langmead, Ben; Trapnell, Cole; Pop, Mihai; Salzberg, Steven L (2009). „Ultrarychlé a paměťově efektivní zarovnání krátkých sekvencí DNA do lidského genomu“. Genome Biology. 10 (3): R25. doi:10.1186 / gb-2009-10-3-r25. ISSN 1465-6906. PMC 2690996. PMID 19261174.
- ^ Li, H .; Durbin, R. (2009). „Rychlé a přesné zarovnání krátkého čtení s transformací Burrows-Wheeler“. Bioinformatika. 25 (14): 1754–1760. doi:10.1093 / bioinformatika / btp324. ISSN 1367-4803. PMC 2705234. PMID 19451168.
- ^ A b Kerpedjiev, Peter; Frellsen, Jes; Lindgreen, Stinus; Krogh, Anders (2014). "Adaptable probabilistic mapping of short reads using position specific scoring matrices". BMC bioinformatika. 15 (1): 100. doi:10.1186/1471-2105-15-100. ISSN 1471-2105. PMC 4021105. PMID 24717095.
- ^ Liu, Y .; Schmidt, B .; Maskell, D. L. (2012). "CUSHAW: a CUDA compatible short read aligner to large genomes based on the Burrows-Wheeler transform". Bioinformatika. 28 (14): 1830–1837. doi:10.1093/bioinformatics/bts276. ISSN 1367-4803. PMID 22576173.
- ^ Liu, Y .; Schmidt, B. (2012). "Long read alignment based on maximal exact match seeds". Bioinformatika. 28 (18): i318–i324. doi:10.1093/bioinformatics/bts414. ISSN 1367-4803. PMC 3436841. PMID 22962447.
- ^ Rizk, Guillaume; Lavenier, Dominique (2010). "GASSST: global alignment short sequence search tool". Bioinformatika. 26 (20): 2534–2540. doi:10.1093/bioinformatics/btq485. PMC 2951093. PMID 20739310.
- ^ Marco-Sola, Santiago; Sammeth, Michael; Guigó, Roderic; Ribeca, Paolo (2012). "The GEM mapper: fast, accurate and versatile alignment by filtration". Přírodní metody. 9 (12): 1185–1188. doi:10.1038/nmeth.2221. ISSN 1548-7091. PMID 23103880. S2CID 2004416.
- ^ Clement, N. L.; Snell, Q.; Clement, M. J.; Hollenhorst, P. C.; Purwar, J.; Graves, B. J.; Cairns, B. R.; Johnson, W. E. (2009). "The GNUMAP algorithm: unbiased probabilistic mapping of oligonucleotides from next-generation sequencing". Bioinformatika. 26 (1): 38–45. doi:10.1093/bioinformatics/btp614. ISSN 1367-4803. PMC 6276904. PMID 19861355.
- ^ Santana-Quintero, Luis; Dingerdissen, Hayley; Thierry-Mieg, Jean; Mazumder, Raja; Simonyan, Vahan (2014). "HIVE-Hexagon: High-Performance, Parallelized Sequence Alignment for Next-Generation Sequencing Data Analysis". PLOS ONE. 9 (6): 1754–1760. doi:10.1371/journal.pone.0099033. PMC 4053384. PMID 24918764.
- ^ Kielbasa, S.M.; Wan, R.; Sato, K .; Horton, P.; Frith, M.C. (2011). "Adaptive seeds tame genomic sequence comparison". Výzkum genomu. 21 (3): 487–493. doi:10.1101/gr.113985.110. PMC 3044862. PMID 21209072.
- ^ Rivals, Eric; Salmela, Leena; Kiiskinen, Petteri; Kalsi, Petri; Tarhio, Jorma (2009). mpscan: Fast Localisation of Multiple Reads in Genomes. Algorithms in Bioinformatics. Přednášky z informatiky. 5724. 246–260. CiteSeerX 10.1.1.156.928. doi:10.1007/978-3-642-04241-6_21. ISBN 978-3-642-04240-9.
- ^ Sedlazeck, Fritz J.; Rescheneder, Philipp; von Haeseler, Arndt (2013). "NextGenMap: fast and accurate read mapping in highly polymorphic genomes". Bioinformatika. 29 (21): 2790–2791. doi:10.1093/bioinformatics/btt468. PMID 23975764.
- ^ Chen, Yangho; Souaiaia, Tade; Chen, Ting (2009). "PerM: efficient mapping of short sequencing reads with periodic full sensitive spaced seeds". Bioinformatika. 25 (19): 2514–2521. doi:10.1093/bioinformatics/btp486. PMC 2752623. PMID 19675096.
- ^ Searls, David B.; Hoffmann, Steve; Otto, Christian; Kurtz, Stefan; Sharma, Cynthia M.; Khaitovich, Philipp; Vogel, Jörg; Stadler, Peter F.; Hackermüller, Jörg (2009). "Fast Mapping of Short Sequences with Mismatches, Insertions and Deletions Using Index Structures". PLOS výpočetní biologie. 5 (9): e1000502. doi:10.1371/journal.pcbi.1000502. ISSN 1553-7358. PMC 2730575. PMID 19750212.
- ^ Rumble, Stephen M.; Lacroute, Phil; Dalca, Adrian V.; Fiume, Marc; Sidow, Arend; Brudno, Michael (2009). "SHRiMP: Accurate Mapping of Short Color-space Reads". PLOS výpočetní biologie. 5 (5): e1000386. doi:10.1371/journal.pcbi.1000386. PMC 2678294. PMID 19461883.
- ^ David, Matei; Dzamba, Misko; Lister, Dan; Ilie, Lucian; Brudno, Michael (2011). "SHRiMP2: Sensitive yet Practical Short Read Mapping". Bioinformatika. 27 (7): 1011–1012. doi:10.1093/bioinformatics/btr046. PMID 21278192.
- ^ Malhis, Nawar; Butterfield, Yaron S. N.; Ester, Martin; Jones, Steven J. M. (2009). "Slider – Maximum use of probability information for alignment of short sequence reads and SNP detection". Bioinformatika. 25 (1): 6–13. doi:10.1093/bioinformatics/btn565. PMC 2638935. PMID 18974170.
- ^ Malhis, Nawar; Jones, Steven J. M. (2010). "High Quality SNP Calling Using Illumina Data at Shallow Coverage". Bioinformatika. 26 (8): 1029–1035. doi:10.1093/bioinformatics/btq092. PMID 20190250.
- ^ Li, R .; Li, Y .; Kristiansen, K .; Wang, J. (2008). "SOAP: short oligonucleotide alignment program". Bioinformatika. 24 (5): 713–714. doi:10.1093/bioinformatics/btn025. ISSN 1367-4803. PMID 18227114.
- ^ Li, R .; Yu, C .; Li, Y .; Lam, T.-W.; Yiu, S.-M.; Kristiansen, K .; Wang, J. (2009). "SOAP2: an improved ultrafast tool for short read alignment". Bioinformatika. 25 (15): 1966–1967. doi:10.1093/bioinformatics/btp336. ISSN 1367-4803. PMID 19497933.
- ^ Abuín, José M.; Pichel, Juan C.; Pena, Tomás F.; Amigo, Jorge (2016-05-16). "SparkBWA: Speeding Up the Alignment of High-Throughput DNA Sequencing Data". PLOS ONE. 11 (5): e0155461. doi:10.1371/journal.pone.0155461. ISSN 1932-6203. PMC 4868289. PMID 27182962.
- ^ Lunter, G .; Goodson, M. (2010). "Stampy: A statistical algorithm for sensitive and fast mapping of Illumina sequence reads". Výzkum genomu. 21 (6): 936–939. doi:10.1101/gr.111120.110. ISSN 1088-9051. PMC 3106326. PMID 20980556.
- ^ Noe, L.; Girdea, M.; Kucherov, G. (2010). "Designing efficient spaced seeds for SOLiD read mapping". Pokroky v bioinformatice. 2010: 708501. doi:10.1155/2010/708501. PMC 2945724. PMID 20936175.
- ^ Lin, H .; Zhang, Z .; Zhang, M.Q.; Ma, B.; Li, M. (2008). "ZOOM! Zillions of oligos mapped". Bioinformatika. 24 (21): 2431–2437. doi:10.1093/bioinformatics/btn416. PMC 2732274. PMID 18684737.