Seznam softwaru pro zarovnání sekvence - List of sequence alignment software

Tento seznam softwaru pro zarovnání sekvence je kompilace softwarových nástrojů a webových portálů používaných v páru zarovnání sekvence a vícenásobné zarovnání sekvence. Vidět software pro konstrukční vyrovnání pro strukturální vyrovnání bílkovin.

Pouze prohledávání databáze

název	Popis	Typ sekvence *	Autoři	Rok
VÝBUCH	Místní vyhledávání s rychlou heuristikou k-n-tice (základní nástroj pro vyhledávání místního zarovnání)	Oba	Altschul SF, Gish W., Miller W., Myers EW, Lipman DJ^[1]	1990
HPC-BLAST	Vícebodová a vícejádrová obálka BLAST kompatibilní s NCBI. Distribuován s nejnovější verzí BLAST, tento obal umožňuje paralelizaci algoritmu na moderních hybridních architekturách s mnoha uzly a mnoha jádry v každém uzlu. ^[2]	Protein	Burdyshaw CE, Sawyer S., Horton MD, Brook RG, Rekapalli B	2017
CS-BLAST	Sekvenčně kontextově specifický BLAST, citlivější než BLAST, FASTA a SSEARCH. Poziční specifická iterační verze CSI-BLAST citlivější než PSI-BLAST	Protein	Angermueller C, Biegert A, Soeding J^[3]	2013
CUDASW ++	GPU zrychlil algoritmus Smith Waterman pro více GPU se sdíleným hostitelem	Protein	Liu Y, Maskell DL a Schmidt B.	2009/2010
DIAMANT	Zarovnávač BLASTX a BLASTP založený na dvojitém indexování	Protein	Buchfink B, Xie, C a Huson DH^[4]	2015
FASTA	Rychlé místní vyhledávání k-tuple heuristické, pomalejší, ale citlivější než BLAST	Oba
GGSEARCH, GLSEARCH	Global: Global (GG), Global: Local (GL) alignment with statistics	Protein
Genomový kouzelník	Software pro ultrarychlé vyhledávání lokálních motivů sekvence DNA a párové zarovnání pro data NGS (FASTA, FASTQ).	DNA	Hepperle D (www.sequentix.de)	2020
Genoogle	Genoogle používá pro vyhledávání sekvencí DNA a proteinů techniky indexování a paralelního zpracování. Je vyvinut v Javě a open source.	Oba	Albrecht F	2015
HMMER	Místní a globální vyhledávání pomocí profilů Skryté modely Markov, citlivější než PSI-BLAST	Oba	Durbin R., Eddy SR, Krogh A, Mitchison G.^[5]	1998
HH-suite	Párové srovnání profilových skrytých Markovových modelů; velmi citlivý	Protein	Söding J^[6]^[7]	2005/2012
IDF	Četnost inverzních dokumentů	Oba
Pekelný	Profil SCFG Vyhledávání	RNA	Eddy S.
KLAST	Vysoce výkonný vyhledávací nástroj pro sekvenční podobnost pro obecné účely	Oba		2009/2014
LAMBDA	Vysoce výkonný lokální vyrovnávač kompatibilní s BLAST, ale mnohem rychlejší; podporuje SAM / BAM	Protein	Hannes Hauswedell, Jochen Singer, Knut Reinert^[8]	2014
MMseqs2	Softwarová sada pro vyhledávání a shlukování obrovských sad sekvencí. Podobná citlivost na BLAST a PSI-BLAST, ale řádově rychlejší	Protein	Steinegger M, Mirdita M, Galiez C, Söding J^[9]	2017
POUŽITÍ	Ultrarychlý nástroj pro sekvenční analýzu	Oba	Edgar, R. C. (2010). „Vyhledávejte a shlukujte řády rychleji než BLAST“. Bioinformatika. 26 (19): 2460–2461. doi:10.1093 / bioinformatika / btq461. PMID 20709691. vydání	2010
OSWALD	OpenCL Smith-Waterman na FPGA společnosti Altera pro velké databáze proteinů	Protein	Rucci E, García C, Botella G, De Giusti A, Naiouf M, Prieto-Matías M^[10]	2016
parasail	Rychlé vyhledávání Smith-Waterman pomocí paralelizace SIMD	Oba	Denně J	2015
PSI-BLAST	Poziční specifická iterativní BLAST, místní vyhledávání s bodovací matice specifické pro danou pozici, mnohem citlivější než BLAST	Protein	Altschul SF, Madden TL, Schäffer AA, Zhang J, Zhang Z, Miller W., Lipman DJ^[11]	1997
PSI-Search	Kombinace vyhledávacího algoritmu Smith-Waterman s PSI-BLAST strategie konstrukce profilu k nalezení vzdáleně příbuzných proteinových sekvencí a prevence homologních chyb při příliš velkém rozšíření.	Protein	Li W, McWilliam H, Goujon M, Cowley A, Lopez R, Pearson WR^[12]	2012
ScalaBLAST	Vysoce paralelní škálovatelný BLAST	Oba	Oehmen a kol.^[13]	2011
Sequilab	Propojování a profilování údajů o seřazení sekvencí z výsledků NCBI-BLAST s hlavními servery / službami pro sekvenční analýzu	Nukleotid, peptid		2010
SAM	Místní a globální vyhledávání pomocí profilů Skryté modely Markov, citlivější než PSI-BLAST	Oba	Karplus K., Krogh A^[14]	1999
VYHLEDÁVÁNÍ	Hledání Smith-Waterman, pomalejší, ale citlivější než FASTA	Oba
SWAPHI	První paralelizovaný algoritmus využívající vznikající Intel Xeon Phis k urychlení vyhledávání proteinové databáze Smith-Waterman	Protein	Liu Y a Schmidt B.	2014
SWAPHI-LS	První paralelní algoritmus Smith-Waterman využívající klastry Intel Xeon Phi k urychlení zarovnání dlouhých sekvencí DNA	DNA	Liu Y, Tran TT, Lauenroth F, Schmidt B	2014
PLAVKA	Implementace Smith-Waterman pro architektury Intel Multicore a Manycore	Protein	Rucci E, García C, Botella G, De Giusti A, Naiouf M a Prieto-Matías M^[15]	2015
SWIMM2.0	Vylepšený Smith-Waterman na architekturách Intel Multicore a Manycore založených na vektorových rozšířeních AVX-512	Protein	Rucci E, García C, Botella G, De Giusti A, Naiouf M a Prieto-Matías M^[16]	2018
VÝPAD	Rychlé vyhledávání Smith-Waterman pomocí paralelizace SIMD	Oba	Rognes T	2011

*Typ sekvence: protein nebo nukleotid

Párové zarovnání

název	Popis	Typ sekvence *	Typ zarovnání **	Autor	Rok
ACANA	Rychlé heuristické ukotvení založené na párovém zarovnání	Oba	Oba	Huang, Umbach, Li	2005
AlignMe	Zarovnání pro sekvence membránových proteinů	Protein	Oba	M. Stamm, K. Khafizov, R. Staritzbichler, L.R. Pro ostatní	2013
ALLALIGN	U molekul DNA, RNA a proteinů do 32 MB zarovná všechny sekvence velikosti K nebo větší. Podobné zarovnání jsou seskupeny pro analýzu. Automatický filtr opakovaných sekvencí.	Oba	Místní	E. Wachtel	2017
Biovodič Biostrings :: pairwiseAlignment	Dynamické programování	Oba	Oba + končí zdarma	P. Aboyoun	2008
BioPerl dpAlign	Dynamické programování	Oba	Oba + končí zdarma	Y. M. Chan	2003
BLASTZ, LASTZ	Nasazené vzory	Nukleotid	Místní	Schwartz et al.^[17]^[18]	2004,2009
CUDAlign	Zarovnání sekvence DNA neomezené velikosti v jednom nebo více GPU	Nukleotid	Místní, SemiGlobal, Global	E. Sandes^[19]^[20]^[21]	2011-2015
DNADot	Webový nástroj pro bodové vykreslování	Nukleotid	Globální	R. Bowen	1998
DNASTAR Lasergene Molecular Biology Suite	Software pro zarovnání sekvencí DNA, RNA, proteinu nebo DNA + proteinů pomocí párových a vícenásobných algoritmů pro zarovnání sekvencí, včetně MUSCLE, Mauve, MAFFT, Clustal Omega, Jotun Hein, Wilbur-Lipman, Martinez Needleman-Wunsch, Lipman-Pearson a Dotplot.	Oba	Oba	DNASTAR	1993-2016
DOTLET	Java-dot dot-plot nástroj	Oba	Globální	M. Pagni a T. Junier	1998
HODY	Zadní lokální rozšíření s popisným evolučním modelem	Nukleotid	Místní	A. K. Hudek a D. G. Brown	2010
Překladač genomu Překladač genomu	Srovnejte soubory chromatogramu (.ab1, .scf) se sekvencí šablony, vyhledejte chyby a okamžitě je opravte.	Nukleotid	Místní	Genome Compiler Corporation	2014
G-PAS	Dynamické programování založené na GPU se zpětným sledováním	Oba	Místní, SemiGlobal, Global	W. Frohmberg, M. Kierzynka a kol.	2011
GapMis	Má párové zarovnání sekvence s jednou mezerou	Oba	SemiGlobal	K. Frousios, T. Flouri, C. S. Iliopoulos, K. Park, S. P. Pissis, G. Tischler	2012
Genomový kouzelník	Software pro ultrarychlé vyhledávání lokálních motivů sekvence DNA a párové zarovnání pro data NGS (FASTA, FASTQ).	DNA	Místní, SemiGlobal, Global	Hepperle D (www.sequentix.de)	2020
GGSEARCH, GLSEARCH	Global: Global (GG), Global: Local (GL) alignment with statistics	Protein	Globální v dotazu	W. Pearson	2007
JAligner	Jáva open-source implementace Smith-Waterman	Oba	Místní	A. Moustafa	2005
K * Sync	Zarovnání sekvence proteinu do struktury, které zahrnuje sekundární strukturu, zachování struktury, profily sekvence odvozené od struktury a skóre konsensuálního seřazení	Protein	Oba	D. Chivian a D. Baker^[22]	2003
LALIGN	Vícenásobná nepřekrývající se místní podobnost (stejný algoritmus jako SIM)	Oba	Místní nepřekrývající se	W. Pearson	1991 (algoritmus)
NW-align	Standardní algoritmus dynamického programování Needleman-Wunsch	Protein	Globální	Y Zhang	2012
pomlouvat	modelování zarovnání; modeluje informační obsah sekvencí	Nukleotid	Oba	D. Powell, L. Allison a T. I. Dix	2004
dohazovač	Waterman-Eggert místní zarovnání (na základě LALIGN)	Oba	Místní	I. Longden (upraveno podle W. Pearsona)	1999
MCALIGN2	explicitní modely indel evoluce	DNA	Globální	J. Wang et al.	2006
Převlečený	příponový strom na základě	Nukleotid	Globální	S. Kurtz et al.	2004
jehla	Needleman-Wunsch dynamické programování	Oba	SemiGlobal	A. Bleasby	1999
Ngila	náklady na logaritmickou a afinní mezeru a explicitní modely vývoje indelu	Oba	Globální	R. Cartwright	2007
NW	Needleman-Wunsch dynamické programování	Oba	Globální	A.C.R. Martin	1990-2015
parasail	C / C ++ / Python / Java SIMD dynamická programovací knihovna pro SSE, AVX2	Oba	Globální, bez konce, místní	J. Daily	2015
Cesta	Smith-Waterman na protein zadní-překlad graf (detekuje posuny rámů na úrovni bílkovin)	Protein	Místní	M. Gîrdea et al.^[23]	2009
Lovec vzorů	Nasazený vzor	Nukleotid	Místní	B. Ma et al.^[24]^[25]	2002–2004
ProbA (také propA)	Stochastické vzorkování funkce oddílu pomocí dynamické programování	Oba	Globální	U. Mückstein	2002
PyMOL	Příkaz „align“ zarovná sekvenci a použije ji na strukturu	Protein	Globální (podle výběru)	W. L. DeLano	2007
REPuter	příponový strom na základě	Nukleotid	Místní	S. Kurtz et al.	2001
SABERTOOTH	Zarovnání pomocí předpokládaných profilů připojení	Protein	Globální	F. Teichert, J. Minning, U. Bastolla a M. Porto	2009
Satsuma	Paralelní zarovnání synteny celého genomu	DNA	Místní	M.G. Grabherr et al.	2010
SEQALN	Různé dynamické programování	Oba	Místní nebo globální	SLEČNA. Waterman a P. Hardy	1996
SIM, GAP, NAP, LAP	Místní podobnost s různým zacházením s mezerami	Oba	Místní nebo globální	X. Huang a W. Miller	1990-6
SIM	Místní podobnost	Oba	Místní	X. Huang a W. Miller	1991
SPA: Super párové vyrovnání	Rychlé párové globální zarovnání	Nukleotid	Globální	Shen, Yang, Yao, Hwang	2002
VYHLEDÁVÁNÍ	Místní (Smith-Waterman ) sladění se statistikami	Protein	Místní	W. Pearson	1981 (Algoritmus)
Sekvenční studio	Java applet demonstrující různé algoritmy z^[26]	Obecná sekvence	Místní a globální	A. Meskauskas	1997 (referenční kniha)
ROZDĚLOVAČ	Smith-Waterman Acceleration on Intel's FPGA with OpenCL for Long DNA Sequences	Nukleotid	Místní	E. Rucci^[27]^[28]	2017-2018
SWIFT oblek	Rychlé vyhledávání místního zarovnání	DNA	Místní	K. Rasmussen,^[29] W. Gerlach	2005,2008
nosítka	Optimalizováno pro paměť Needleman-Wunsch dynamické programování	Oba	Globální	I. Longden (upraveno G. G. Myersem a W. Millerem)	1999
tranalign	Zarovnává sekvence nukleových kyselin dané přiřazením proteinu	Nukleotid	NA	G. Williams (upraveno z B. Pearsona)	2002
UGENE	Opensource Smith-Waterman pro SSE / CUDA, opakovací vyhledávač založený na poli Suffix a dotplot	Oba	Oba	UniPro	2010
voda	Smith-Waterman dynamické programování	Oba	Místní	A. Bleasby	1999
wordmatch	k-tuple párová shoda	Oba	NA	I. Longden	1998
YASS	Nasazené vzory	Nukleotid	Místní	L. Noe a G. Kucherov^[30]	2004

*Typ sekvence: protein nebo nukleotid **Typ zarovnání: místní nebo globální

Zarovnání více sekvencí

název	Popis	Typ sekvence *	Typ zarovnání **	Autor	Rok	Licence
ABA	Zarovnání A-Bruijn	Protein	Globální	B. Raphael et al.	2004	Proprietární, freeware pro vzdělávání, výzkum, neziskové organizace
ALE	ruční vyrovnání; nějaká softwarová pomoc	Nukleotidy	Místní	J. Blandy a K. Fogel	1994 (nejnovější verze 2007)	Volný, uvolnit, GPL 2
ALLALIGN	U molekul DNA, RNA a proteinů do 32 MB srovnává všechny sekvence velikosti K nebo větší, MSA nebo v rámci jedné molekuly. Podobné zarovnání jsou seskupeny pro analýzu. Automatický filtr opakovaných sekvencí.	Oba	Místní	E. Wachtel	2017	Volný, uvolnit
MAPA	Sekvence žíhání	Oba	Globální	A. Schwartz a L. Pachter	2006
anon.	rychlé a optimální zarovnání tří sekvencí pomocí nákladů na lineární mezery	Nukleotidy	Globální	D. Powell, L. Allison a T. I. Dix	2000
BAli-Phy	Strom + více zarovnání; pravděpodobnostní-Bayesian; společný odhad	Oba + kodony	Globální	BD Redelings a MA Suchard	2005 (nejnovější verze 2018)	Volný, uvolnit, GPL
Base-by-Base	Editor vícenásobných sekvencí založený na Javě s integrovanými analytickými nástroji	Oba	Místní nebo globální	R. Brodie et al.	2004	Proprietární, freeware, musí se zaregistrovat
CHAOS, DIALIGN	Iterativní zarovnání	Oba	Místní (upřednostňováno)	M. Brudno a B. Morgenstern	2003
Clustal Ž	Postupné zarovnání	Oba	Místní nebo globální	Thompson et al.	1994	Volný, uvolnit, LGPL
CodonCode Aligner	Vícenásobné zarovnání; Podpora ClustalW & Phrap	Nukleotidy	Místní nebo globální	P. Richterich et al.	2003 (nejnovější verze 2009)
Kompas	Porovnání sekvence více proteinových sekvencí s hodnocením statistické významnosti	Protein	Globální	R.I. Sadreyev, et al.	2009
ROZLUŠTIT	Progresivní iterativní zarovnání	Oba	Globální	Erik S. Wright	2014	Volný, uvolnit, GPL
DIALIGN-TX a DIALIGN-T	Metoda založená na segmentech	Oba	Místní (preferovaný) nebo globální	A.R. Subramanian	2005 (nejnovější verze 2008)
Zarovnání DNA	Metoda založená na segmentech pro vnitrodruhové zarovnání	Oba	Místní (preferovaný) nebo globální	A. Roehl	2005 (nejnovější verze 2008)
Assembler DNA Baser Sequence	Vícenásobné zarovnání; Plně automatické zarovnání sekvence; Automatická korekce nejednoznačnosti; Interní volající; Zarovnání sekvence příkazového řádku	Nukleotidy	Místní nebo globální	Heracle BioSoft SRL	2006 (nejnovější verze 2018)	Komerční (některé moduly jsou freeware)
DNADynamo	navázal DNA na protein vícenásobné zarovnání s SVAL, Clustal a Smith-Waterman	Oba	Místní nebo globální	DNADynamo	2004 (nejnovější verze 2017)
DNASTAR Lasergene Molecular Biology Suite	Software pro srovnávání sekvencí DNA, RNA, proteinů nebo DNA + proteinů pomocí párových a vícenásobných algoritmů pro zarovnání sekvencí včetně MUSCLE, Mauve, MAFFT, Clustal Omega, Jotun Hein, Wilbur-Lipman, Martinez Needleman-Wunsch, Lipman-Pearson a Dotplot.	Oba	Místní nebo globální	DNASTAR	1993-2016
EDNA	Energetické vícenásobné sekvenční zarovnání pro weby vázající DNA	Nukleotidy	Místní nebo globální	Salama, RA. et al.	2013
FAMSA	Progresivní zarovnání pro extrémně velké rodiny proteinů (stovky tisíc členů)	Protein	Globální	Deorowicz a kol.	2016
FSA	Sekvence žíhání	Oba	Globální	R. K. Bradley a kol.	2008
Geniální	Progresivní iterační zarovnání; ClustalW plugin	Oba	Místní nebo globální	AJ. Drummond et al.	2005 (nejnovější verze 2017)
Kalign	Postupné zarovnání	Oba	Globální	T. Lassmann	2005
MAFFT	Progresivní iterativní zarovnání	Oba	Místní nebo globální	K. Katoh et al.	2005	Volný, uvolnit, BSD
MARNA	Multi-zarovnání RNA	RNA	Místní	S. Siebert et al.	2005
MAVID	Postupné zarovnání	Oba	Globální	N. Bray a L. Pachter	2004
MSA	Dynamické programování	Oba	Místní nebo globální	D.J. Lipman et al.	1989 (upraveno 1995)
MSAProbs	Dynamické programování	Protein	Globální	Y. Liu, B. Schmidt, D. Maskell	2010
MULTALIN	Dynamické programování - shlukování	Oba	Místní nebo globální	F. Corpet	1988
Multi-LAGAN	Progresivní přizpůsobení dynamického programování	Oba	Globální	M. Brudno et al.	2003
SVAL	Progresivní iterativní zarovnání	Oba	Místní nebo globální	R. Edgar	2004
Opál	Progresivní iterativní zarovnání	Oba	Místní nebo globální	T. Wheeler a J. Kececioglu	2007 (nejnovější stabilní 2013, nejnovější beta 2016)
Pekanový ořech	Pravděpodobnostní konzistence	DNA	Globální	B. Paten et al.	2008
Phylo	Lidský výpočetní rámec pro řešení komparativní genomiky vícenásobné zarovnání	Nukleotidy	Místní nebo globální	McGill Bioinformatics	2010
PMFastR	Progresivní uspořádání s vědomím struktury	RNA	Globální	D. DeBlasio, J Braund, S Zhang	2009
Pralinka	Progresivní iterativní konzistence homologie rozšířené zarovnání s předprofilem a predikcí sekundární struktury	Protein	Globální	J. Heringa	1999 (nejnovější verze 2009)
PicXAA	Neprogresivní, maximální očekávané zarovnání přesnosti	Oba	Globální	S.M.E. Sahraeian a B.J. Yoon	2010
POA	Částečná objednávka / skrytý Markovův model	Protein	Místní nebo globální	C. Lee	2002
Probalign	Pravděpodobnostní / konzistence s pravděpodobností funkce oddílu	Protein	Globální	Roshan a Livesay	2006	Volný, uvolnit, veřejná doména
ProbCons	Pravděpodobnostní / konzistence	Protein	Místní nebo globální	C. Do et al.	2005	Volný, uvolnit, veřejná doména
PROMALS3D	Progresivní zarovnání / skrytý Markovův model / sekundární struktura / 3D struktura	Protein	Globální	J. Pei et al.	2008
PRRN / PRRP	Iterativní zarovnání (zejména upřesnění)	Protein	Místní nebo globální	Y. Totoki (na základě O. Gotoh)	1991 a později
PSAlign	Zarovnání zachovává nehuristické	Oba	Místní nebo globální	S.H. Sze, Y. Lu, Q. Yang.	2006
RevTrans	Kombinuje zarovnání DNA a proteinů zpětným překladem vyrovnání proteinů na DNA.	DNA / Protein (speciální)	Místní nebo globální	Wernersson a Pedersen	2003 (nejnovější verze 2005)
SÁGA	Zarovnání sekvence genetickým algoritmem	Protein	Místní nebo globální	C. Notredame et al.	1996 (nová verze 1998)
SAM	Skrytý Markovův model	Protein	Místní nebo globální	A. Krogh et al.	1994 (nejnovější verze 2002)
Těsnění	Ruční vyrovnání	Oba	Místní	A. Rambaut	2002
StatAlign	Bayesovský společný odhad sladění a fylogeneze (MCMC)	Oba	Globální	A. Novak et al.	2008
Stemloc	Vícenásobné zarovnání a predikce sekundární struktury	RNA	Místní nebo globální	I. Holmes	2005	Volný, uvolnit, GPL 3 (parte de ŠIPKA )
T-káva	Citlivější postupné zarovnání	Oba	Místní nebo globální	C. Notredame et al.	2000 (nejnovější verze 2008)	Volný, uvolnit, GPL 2
UGENE	Podporuje vícenásobné zarovnání s SVAL, KAlign, Clustal a MAFFT pluginy	Oba	Místní nebo globální	Tým UGENE	2010 (nejnovější verze 2020)	Volný, uvolnit, GPL 2
Přátelé	VectorFriends Aligner, SVAL plugin a Clustal W plugin	Oba	Místní nebo globální	Tým BioFriends	2013	Proprietární, freeware pro akademické použití
GLProbs	Adaptivní párový skrytý Markovův přístup založený na modelu	Protein	Globální	Y. Ye et al.	2013

*Typ sekvence: protein nebo nukleotid. **Typ zarovnání: místní nebo globální

Genomická analýza

název	Popis	Typ sekvence *
OREL ^[31]	Ultrarychlý nástroj k nalezení relativních chybějících slov v genomových datech	Nukleotid
ACT (Artemis Comparison Tool)	Syntenní a komparativní genomika	Nukleotid
ZANÍCENÝ	Párové globální sladění s celými genomy	Nukleotid
BLAT	Zarovnání sekvencí cDNA s genomem.	Nukleotid
ROZLUŠTIT	Zarovnání přeskupených genomů pomocí 6 rámcového překladu	Nukleotid
FLAK	Zarovnání a analýza fuzzy celého genomu	Nukleotid
GMAP	Zarovnání sekvencí cDNA s genomem. Identifikuje spojovací místa spojení s vysokou přesností.	Nukleotid
Splign	Zarovnání sekvencí cDNA s genomem. Identifikuje spojovací místa spojení s vysokou přesností. Schopen rozpoznat a oddělit genové duplikace.	Nukleotid
Nafialovělý	Vícenásobné seřazení přeskupených genomů	Nukleotid
MGA	Zarovnávač více genomu	Nukleotid
Mulan	Lokální vícenásobné srovnání sekvencí o délce genomu	Nukleotid
Multiz	Vícenásobné vyrovnání genomů	Nukleotid
PLAST-ncRNA	Hledejte ncRNA v genomech podle místního zarovnání funkce oddílu	Nukleotid
Sequerome	Profilování dat zarovnání sekvence s hlavními servery / službami	Nukleotid, peptid
Sequilab	Profilování dat zarovnání sekvence z výsledků NCBI-BLAST pomocí hlavních serverových služeb	Nukleotid, peptid
Zamíchejte LAGAN	Pairwise glocal alignment of Complete genome regions	Nukleotid
SIBsim4, Sim4	Program navržený pro srovnání exprimované sekvence DNA s genomovou sekvencí, což umožňuje introny	Nukleotid
SLAM	Nález genu, zarovnání, anotace (identifikace homologie člověk-myš)	Nukleotid
SRPRISM	Efektivní zarovnávač pro sestavení s výslovnými zárukami, zarovnání čtení bez spojů	Nukleotid

*Typ sekvence: protein nebo nukleotid

Hledání motivu

název	Popis	Typ sekvence *
PMS	Hledání a objevování motivů	Oba
FMM	Hledání a objevování motivů (lze získat také pozitivní a negativní sekvence jako vstup pro obohacené vyhledávání motivů)	Nukleotid
BLOKY	Neztištěná identifikace motivu z databáze BLOCKS	Oba
eMOTIF	Extrakce a identifikace kratších motivů	Oba
Vzorník motivů Gibbs	Stochastická extrakce motivů statistickou pravděpodobností	Oba
HMMTOP	Predikce transmembránových šroubovic a topologie proteinů	Protein
I-stránky	Knihovna motivů místní struktury	Protein
JCoils	Předpověď Navinutá cívka a Leucinový zip	Protein
MEME /STOŽÁR	Objevování a hledání motivů	Oba
CUDA-MEME	Algoritmus MEME (v4.4.0) s akcelerací GPU pro klastry GPU	Oba
MERCI	Objevování a hledání diskriminačních motivů	Oba
PHI-Blast	Nástroj pro vyhledávání a zarovnání motivů	Oba
Fyloscan	Nástroj pro vyhledávání motivů	Nukleotid
PRATT	Generování vzorů pro použití s ScanProsite	Protein
ScanProsite	Nástroj pro vyhledávání databáze motivů	Protein
TEIRESIAS	Extrakce motivů a vyhledávání v databázi	Oba
ČEDIČ	Hledání více motivů a regulárních výrazů	Oba

*Typ sekvence: protein nebo nukleotid

Benchmarking

název	Autoři
PFAM 30.0 (2016)
SMART (2015)	Letunic, Copley, Schmidt, Ciccarelli, Doerks, Schultz, Ponting, Bork
BAliBASE 3 (2015)	Thompson, Plewniak, Poch
Oxbench (2011)	Raghava, Searle, Audley, Barber, Barton
Srovnávací test (2009)	Edgar
HOMSTRAD (2005)	Mizuguchi
PREFAB 4.0 (2005)	Edgar
SABmark (2004)	Van Walle, Lasters, Wyns

Zarovnejte diváky, editory

Prosím podívej se Seznam softwaru pro vizualizaci zarovnání.

Zarovnání sekvence krátkého čtení

název	Popis	možnost spárovaného konce	Použijte kvalitu FASTQ	Mezera	Vícevláknové	Licence	Odkaz	Rok
Arioc	Vypočítá Smith-Waterman mezery zarovnání a kvality mapování na jednom nebo více GPU. Podporuje zarovnání BS-seq. Zpracovává 100 000 až 500 000 čtení za sekundu (liší se podle dat, hardwaru a nakonfigurované citlivosti).	Ano	Ne	Ano	Ano	Volný, uvolnit, BSD	^[32]	2015
BarraCUDA	GPGPU zrychlilo Burrows-Wheelerova transformace (FM-index) program pro krátké čtení zarovnání založený na BWA, podporuje zarovnání indelů s mezerami a rozšířeními.	Ano	Ne	Ano	Ano, POSIX vlákna a CUDA	Volný, uvolnit, GPL
BBMap	Používá krátké kmery k rychlé indexaci genomu; bez omezení velikosti nebo počtu lešení. Vyšší citlivost a specificita než srovnávače Burrows-Wheeler, s podobnou nebo vyšší rychlostí. Provádí globální zarovnání optimalizované pro afinní transformaci, které je pomalejší, ale přesnější než Smith-Waterman. Zpracovává data Illumina, 454, PacBio, Sanger a Ion Torrent. Svědomitý; schopný zpracovat dlouhé indely a RNA-sekv. Čistá Java; běží na jakékoli platformě. Používá Společný genomový institut.	Ano	Ano	Ano	Ano	Volný, uvolnit, BSD		2010
NEJLEPŠÍ	Explicitní kompromis času a přesnosti s předchozím odhadem přesnosti, podporovaný indexováním referenčních sekvencí. Optimálně komprimuje indexy. Zvládne miliardy krátkých čtení. Zvládne vkládání, mazání, SNP a barevné chyby (může mapovat čtení barevného prostoru ABI SOLiD). Provede úplné zarovnání Smith Waterman.				Ano, POSIX vlákna	Volný, uvolnit, GPL	^[33]	2009
BigBWA	Spustí Burrows-Wheeler Aligner -BWA na a Hadoop shluk. Podporuje algoritmy BWA-MEM, BWA-ALN a BWA-SW, které pracují se spárovanými a jednoduchými čteními. To znamená důležité zkrácení výpočetního času při spuštění v clusteru Hadoop, přidání škálovatelnosti a odolnosti proti chybám.	Ano	Ořezávání základen nízké kvality	Ano	Ano	Volný, uvolnit, GPL 3	^[34]	2015
BLASTN	Program srovnávání nukleotidů BLAST, pomalý a nepřesný pro krátká čtení, a spíše než referenční genom používá databázi sekvencí (EST, Sangerova sekvence).
BLAT	Vytvořil Jim Kent. Zvládne jeden nesoulad v počátečním kroku zarovnání.				Ano, klient-server	Proprietární, freeware pro akademické a nekomerční použití	^[35]	2002
Motýlek	Používá a Burrows-Wheelerova transformace vytvořit trvalý, opakovaně použitelný index genomu; 1,3 GB paměťová stopa pro lidský genom. Zarovná více než 25 milionů čteček Illumina za 1 hodinu CPU. Podporuje zásady zarovnání podobné typu Maq a SOAP	Ano	Ano	Ne	Ano, POSIX vlákna	Volný, uvolnit, Umělecký	^[36]	2009
BWA	Používá a Burrows-Wheelerova transformace vytvořit index genomu. Je to o něco pomalejší než Bowtie, ale umožňuje indelům vyrovnání.	Ano	Ořezávání základen nízké kvality	Ano	Ano	Volný, uvolnit, GPL	^[37]	2009
BWA-PSSM	Pravděpodobnostní krátký čtecí zarovnávač založený na použití polohovacích bodovacích matic (PSSM). Zarovnávač je přizpůsobitelný v tom smyslu, že může brát v úvahu skóre kvality čtení a modely zkreslení specifických pro data, jako jsou ty, které byly pozorovány ve starověké DNA, datech PAR-CLIP nebo genomech se zkreslenými nukleotidovými kompozicemi.^[38]	Ano	Ano	Ano	Ano	Volný, uvolnit, GPL	^[38]	2014
CASHX	Kvantifikujte a spravujte velká množství krátce načtených sekvenčních dat. Kanál CASHX obsahuje sadu nástrojů, které lze použít společně nebo samostatně jako moduly. Tento algoritmus je velmi přesný pro perfektní zásahy do referenčního genomu.				Ne	Proprietární, freeware pro akademické a nekomerční použití
Průtrž mračen	Krátké čtení mapování pomocí Hadoop MapReduce				Ano, Hadoop MapReduce	Volný, uvolnit, Umělecký
CUDA-EC	Oprava chyby zarovnání krátkého čtení pomocí GPU.				Ano, GPU povoleno
CUSHAW	CUDA kompatibilní zarovnávač krátkých čtení velkých genomů založený na Burrows-Wheelerově transformaci	Ano	Ano	Ne	Ano (GPU povoleno)	Volný, uvolnit, GPL	^[39]	2012
CUSHAW2	Mezery mezi krátkým a dlouhým čtením založené na semenech maximální přesné shody. Tento zarovnávač podporuje zarovnání čtení základního prostoru (např. Z Illumina, 454, Ion Torrent a PacBio) a ABI SOLiD pro čtení barevného prostoru.	Ano	Ne	Ano	Ano	Volný, uvolnit, GPL		2014
CUSHAW2-GPU	Zarovnávač krátkého čtení CUSHAW2 s akcelerací GPU.	Ano	Ne	Ano	Ano	Volný, uvolnit, GPL
CUSHAW3	Citlivé a přesné zarovnání krátkého čtení v základním a barevném prostoru s hybridním výsevem	Ano	Ne	Ano	Ano	Volný, uvolnit, GPL	^[40]	2012
drFAST	Přečtěte si software pro zarovnání mapování, který implementuje lhostejnost mezipaměti, aby se minimalizovaly přenosy hlavní / mezipaměti, jako jsou mrFAST a mrsFAST, avšak navržené pro platformu sekvenování SOLiD (čte barevný prostor). Vrátí také všechna možná umístění map pro lepší objevení strukturálních variací.	Ano	Ano, pro strukturální variaci	Ano	Ne	Volný, uvolnit, BSD
ELAND	Realizováno společností Illumina. Zahrnuje nezaseknuté zarovnání s konečnou délkou čtení.
OREL	Rozšířená náhodná numerická alignEr pro přesné zarovnání čtení NGS. Může mapovat čtení zpracovaná hydrogensiřičitanem.	Ano	Ořezávání základen nízké kvality	Ano	Vícevláknové zpracování a podpora MPI	Volný, uvolnit, GPL 3
GASSST	Vyhledá globální zarovnání krátkých sekvencí DNA proti velkým bankám DNA				Multithreading	CeCILL licence verze 2.	^[41]	2011
KLENOT	Vysoce kvalitní seřizovací motor (vyčerpávající mapování se substitucemi a indels). Přesnější a několikrát rychlejší než BWA nebo Bowtie 1/2. Mnoho samostatných biologických aplikací (mapovač, split mapovač, mapovatelnost a další) je k dispozici.	Ano	Ano	Ano	Ano	Dvojí, freeware pro nekomerční použití; Zdroj GEM je momentálně nedostupný	^[42]	2012
Genalice MAP	Ultrarychlý a komplexní zarovnávač čtení NGS s vysokou přesností a malým úložným prostorem.	Ano	Ořezávání základen nízké kvality	Ano	Ano	Proprietární, komerční
Geneious Assembler	Rychlý a přesný asembler překrytí se schopností zvládnout jakoukoli kombinaci technologie sekvenování, délku čtení, jakoukoli orientaci párování, s jakoukoli velikostí spaceru pro párování, s referenčním genomem nebo bez něj.				Ano	Proprietární, komerční
GensearchNGS	Kompletní rámec s uživatelsky přívětivým grafickým uživatelským rozhraním pro analýzu dat NGS. Integruje proprietární vysoce kvalitní algoritmus zarovnání a schopnost zásuvného modulu integrovat různé veřejné zarovnávače do rámce, který umožňuje importovat krátká čtení, zarovnat je, detekovat varianty a generovat zprávy. Je určen pro resekvenování projektů, zejména v diagnostickém prostředí.	Ano	Ne	Ano	Ano	Proprietární, komerční
GMAP a GSNAP	Robustní, rychlé zarovnání s krátkým čtením. GMAP: delší čtení, s více indely a spoji (viz záznam výše v části Genomická analýza); GSNAP: kratší čtení, s jedním indelem nebo až dvěma spoji na čtení. Užitečné pro digitální genovou expresi, SNP a indel genotypování. Vyvinut Thomas Wu ve společnosti Genentech. Používá Národní centrum pro zdroje genomu (NCGR) v Alpheu.	Ano	Ano	Ano	Ano	Proprietární, freeware pro akademické a nekomerční použití
GNUMAP	Přesně provádí mezerové zarovnání sekvenčních dat získaných ze sekvenčních strojů nové generace (konkrétně Solexa-Illumina) zpět do genomu jakékoli velikosti. Zahrnuje ořezávání adaptéru, volání SNP a analýzu sekvence bisulfitu.		Ano, podporuje také soubory Illumina * _int.txt a * _prb.txt se všemi 4 skóre kvality pro každou základnu		Vícevláknové zpracování a podpora MPI		^[43]	2009
Úl-šestihran	Používá a hash tabulka a Bloom Matrix pro vytvoření a filtrování potenciálních pozic na genomu. Pro vyšší efektivitu využívá křížovou podobnost mezi krátkými čteními a vyhýbá se přeskupení nejedinečných redundantních sekvencí. Je rychlejší než Bowtie a BWA a umožňuje indels a odlišná citlivá zarovnání virů, bakterií a konzervativnější eukaryotické zarovnání.	Ano	Ano	Ano	Ano	Proprietární, freeware pro akademické a nekomerční uživatele registrované v instanci nasazení HIVE	^[44]	2014
IMOS	Vylepšený Meta-aligner a Minimap2 On Spark. Distribuovaný zarovnávač s dlouhým čtením na platformě Apache Spark s lineární škálovatelností w.r.t. provedení jednoho uzlu.		Ano	Ano	Ano	Volný, uvolnit
Isaac	Plně využívá veškerý výpočetní výkon dostupný v jednom uzlu serveru; proto se dobře rozšiřuje na širokou škálu hardwarových architektur a výkon zarovnání se zlepšuje s hardwarovými schopnostmi	Ano	Ano	Ano	Ano	Volný, uvolnit, GPL
POSLEDNÍ	Používá adaptivní semena a efektivněji zvládá sekvence bohaté na opakování (např. Genomy). Například: dokáže sladit čtení s genomy bez opakovaného maskování, aniž by byl přemožen opakovanými zásahy.	Ano	Ano	Ano	Ne	Volný, uvolnit, GPL	^[45]	2011
MAQ	Ungapped alignment, který zohledňuje skóre kvality pro každou základnu.					Volný, uvolnit, GPL
mrFAST, mrsFAST	Gapped (mrFAST) a ungapped (mrsFAST) software pro zarovnání, který implementuje zapomenutí mezipaměti, aby se minimalizoval přenos hlavní / mezipaměti. Jsou navrženy pro sekvenační platformu Illumina a mohou vracet všechna možná umístění map pro vylepšené objevování strukturálních variací.	Ano	Ano, pro strukturální variaci	Ano	Ne	Volný, uvolnit, BSD
MAMINKA	MOM nebo mapování maximálního oligonukleotidu je nástroj pro porovnávání dotazů, který zachycuje shodu maximální délky v krátkém čtení.				Ano
MOSAIK	Rychlý rozdělovač a referenční naváděcí asembler. Zarovná čtení pomocí pruhovaného Smith-Waterman algoritmus nasazený výsledky ze schématu hašování k-mer. Podporuje čtení v rozsahu od velmi krátkých po velmi dlouhé.				Ano
MPscan	Rychlé zarovnání založené na filtrační strategii (žádné indexování, použití q-gramů a zpětně nedeterministické DAWG Vhodný)						^[46]	2009
Novoalign & NovoalignCS	Čtení mezery mezi jedním a spárovaným koncem čte Illumina GA I & II, ABI Color space & ION Torrent. Vysoká citlivost a specificita s využitím základních kvalit ve všech krocích zarovnání. Zahrnuje ořezávání adaptéru, kalibraci kvality základny, zarovnání Bi-Seq a možnosti hlášení více zarovnání na čtení. Použití nejednoznačných kódů IUPAC jako reference pro běžné SNP může zlepšit odvolání SNP a odstranit alelické zkreslení.	Ano	Ano	Ano	Verze s více podprocesy a MPI jsou k dispozici s placenou licencí	Proprietární, freeware verze s jedním závitem pro akademické a nekomerční použití
NextGENe	Vyvinuto pro použití biology provádějícími analýzu sekvenčních dat nové generace z Roche Genome Sequencer FLX, Illumina GA / HiSeq, SOLiD System společnosti Life Technologies Applied BioSystems, PacBio a Ion Torrent.	Ano	Ano	Ano	Ano	Proprietární, komerční
NextGenMap	Flexibilní a rychle čitelný mapovací program (dvakrát rychlejší než BWA) dosahuje citlivosti mapování srovnatelnou se Stampy. Interně používá paměťově efektivní indexovou strukturu (hashovací tabulku) k ukládání pozic všech 13-mer přítomných v referenčním genomu. Mapovací oblasti, kde je vyžadováno párové zarovnání, jsou dynamicky určovány pro každé čtení. Používá rychlé pokyny SIMD (SSE) k urychlení výpočtů zarovnání na CPU. Pokud je k dispozici, zarovnání se počítá na GPU (pomocí OpenCL / CUDA), což dále snižuje dobu běhu o 20–50%.	Ano	Ne	Ano	Ano, POSIX vlákna, OpenCL /CUDA, SSE	Volný, uvolnit	^[47]	2013
Omixon Varianta Toolkit	Zahrnuje vysoce citlivé a vysoce přesné nástroje pro detekci SNP a indelů. Nabízí řešení pro mapování krátkých čtení NGS se střední vzdáleností (až 30% divergence sekvence) od referenčních genomů. Nepředstavuje žádná omezení velikosti reference, což v kombinaci s vysokou citlivostí dělá sadu nástrojů Variant vhodnou pro cílené projekty sekvenování a diagnostiku.	Ano	Ano	Ano	Ano	Proprietární, komerční
PALMapper	Efektivně počítá spojované i neřízené zarovnání s vysokou přesností. Spoléhá se na strategii strojového učení v kombinaci s rychlým mapováním založeným na pásmovém algoritmu podobném Smith-Watermanovi, který na jednom CPU zarovná přibližně 7 milionů čtení za hodinu. Upřesňuje původně navržený přístup QPALMA.				Ano	Volný, uvolnit, GPL
Partek Flow	Pro použití biology a bioinformatiky. Podporuje zarovnání bez mezer, mezer a spojů spojů z jednoho a spárovaného čtení z Illumina, Life technologies Solid TM, Roche 454 a surových dat Ion Torrent (s informacemi o kvalitě nebo bez nich). Integruje výkonnou kontrolu kvality na úrovni FASTQ / Qual a na zarovnaných datech. Mezi další funkce patří ořezávání a filtrování nezpracovaných čtení, detekce SNP a InDel, kvantifikace mRNA a mikroRNA a detekce fúzního genu.	Ano	Ano	Ano	Je možné instalovat více procesorů, klient-server	Proprietární, komerční, zkušební verze zdarma
SLOŽIT	Indexuje genom a poté rozšiřuje semena pomocí předem vypočítaného zarovnání slov. Funguje se základním prostorem, barevným prostorem (SOLID) a může srovnávat genomická a sestříhaná čtení RNA-seq.	Ano	Ano	Ano	Ano	Proprietární, freeware pro akademické a nekomerční použití
PerM	Indexuje genom s periodickými semeny, aby rychle našel zarovnání s plnou citlivostí až se čtyřmi nesoulady. Může mapovat čtení Illumina a SOLiD. Na rozdíl od většiny mapovacích programů se rychlost zvyšuje pro delší délky čtení.				Ano	Volný, uvolnit, GPL	^[48]
PRIMEX	Indexuje genom pomocí vyhledávací tabulky k-mer s plnou citlivostí až k nastavitelnému počtu neshod. Nejlepší je mapovat sekvence 15-60 bp na genom.	Ne	Ne	Ano	Ne, více procesů na jedno hledání		[1]	2003
QPalma	Může používat skóre kvality, délky intronů a předpovědi výpočtových spojovacích míst k provedení a provedení nezaujatého zarovnání. Může být vyškolen na specifika experimentu a genomu RNA-seq. Užitečné pro objevování spojovacích míst / intronů a pro vytváření genových modelů. (Rychlejší verzi najdete v PALMapper).				Ano, klient-server	Volný, uvolnit, GPL 2
RazerS	Žádný limit délky čtení. Hamming nebo upravit mapování vzdálenosti s konfigurovatelnými chybami. Konfigurovatelná a předvídatelná citlivost (kompromis runtime / citlivost). Podporuje mapování čtení spárovaného konce.					Volný, uvolnit, LGPL
SKUTEČNÉ, SKUTEČNÉ	REAL je efektivní, přesný a citlivý nástroj pro sladění krátkých čtení získaných ze sekvenování nové generace. Program zvládne enormní množství jednostranných čtení generovaných analyzátorem genomu Illumina / Solexa nové generace. cREAL je jednoduché rozšíření REAL pro přizpůsobení krátkých čtení získaných ze sekvenování příští generace do genomu s kruhovou strukturou.		Ano		Ano	Volný, uvolnit, GPL
RMAP	Může číst mapy s informacemi o pravděpodobnosti chyby nebo bez nich (skóre kvality) a podporuje mapování čtení se spárovaným koncem nebo s hydrogensiřičitanem. Neexistují žádná omezení ohledně délky čtení nebo počtu neshod.	Ano	Ano	Ano		Volný, uvolnit, GPL 3
rNA	Randomizovaný numerický zarovnávač pro přesné zarovnání čtení NGS	Ano	Ořezávání základen nízké kvality	Ano	Vícevláknové zpracování a podpora MPI	Volný, uvolnit, GPL 3
Vyšetřovatel RTG	Extrémně rychlý, tolerantní k vysokému počtu indelů a substitucí. Zahrnuje zarovnání celého čtení. Produkt obsahuje komplexní kanály pro detekci variant a metagenomickou analýzu s libovolnou kombinací dat Illumina, Complete Genomics a Roche 454.	Ano	Ano, pro variantní volání	Ano	Ano	Proprietární, freeware pro individuální použití zkoušejícího
Segemehl	Zvládne vkládání, mazání, neshody; používá pole rozšířených přípon	Ano	Ne	Ano	Ano	Proprietární, freeware pro nekomerční použití	^[49]	2009
SeqMap	Až 5 smíšených substitucí a vložení-odstranění; různé možnosti ladění a vstupně-výstupní formáty					Proprietární, freeware pro akademické a nekomerční použití
Shrec	Krátká oprava chyby čtení s a příponový strom datová struktura				Ano, Jáva
SHRiMP	Indexuje referenční genom od verze 2. Používá masky ke generování možných klíčů. Může mapovat barevný prostor ABI SOLiD.	Ano	Ano	Ano	Ano, OpenMP	Zdarma, [[BSD licence \| style = "background: # 9FF; color: black; vertical-align: middle; text-align: center;" class = "free table-free" \| Free, BSD ]] derivát	^[50]^[51]	2009-2011
Kluzák	Slider je aplikace pro výstup analyzátoru sekvence Illumina, která používá soubory "pravděpodobnosti" namísto souborů sekvencí jako vstup pro zarovnání k referenční sekvenci nebo sadě referenčních sekvencí.	Ano	Ano	Ne	Ne		^[52]^[53]	2009-2010
SOAP, SOAP2, SOAP3, SOAP3-dp	SOAP: robustní s malým (1-3) počtem mezer a nesouladů. Zlepšení rychlosti oproti BLAT, používá hash tabulku s 12 písmeny. SOAP2: použití obousměrného BWT k vytvoření referenčního indexu a je mnohem rychlejší než první verze. SOAP3: Verze s akcelerací GPU, která dokáže najít všechna 4-nesouladná zarovnání za desítky sekund na jeden milion přečtení. SOAP3-dp, také zrychlený GPU, podporuje libovolný počet neshod a mezer podle skóre trestu za afinní mezeru.	Ano	Ne	Ano, SOAP3-dp	Ano, POSIX vlákna; SOAP3, SOAP3-dp potřebují GPU s CUDA Podpěra, podpora	Volný, uvolnit, GPL	^[54]^[55]
SOCS	Pro technologie ABI SOLiD. Významné prodloužení času pro mapování čtení s neshodami (nebo chybami barev). Používá iterativní verzi algoritmu pro vyhledávání řetězců Rabin-Karp.				Ano	Volný, uvolnit, GPL
SparkBWA	Integruje Burrows-Wheeler Aligner —BWA na Apache Spark rámec běží na vrcholu Hadoop. Verze 0.2 z října 2016, podporuje algoritmy BWA-MEM, BWA-backtrack a BWA-ALN. Všechny fungují s čteními na jeden a na pár.	Ano	Ořezávání základen nízké kvality	Ano	Ano	Volný, uvolnit, GPL 3	^[56]	2016
SSAHA, SSAHA2	Rychle pro malý počet variant					Proprietární, freeware pro akademické a nekomerční použití
Stampy	Pro Illumina čte. Vysoká specificita a citlivost pro čtení s indels, strukturálními variantami nebo mnoha SNP. Pomalá, ale rychlost se dramaticky zvýšila použitím BWA pro první průchod vyrovnání.	Ano	Ano	Ano	Ne	Proprietární, freeware pro akademické a nekomerční použití	^[57]	2010
Bouřka	Pro Illumina nebo ABI čte SOLiD, s SAM nativní výstup. Vysoce citlivý pro čtení s mnoha chybami, indels (plný od 0 do 15, jinak rozšířená podpora). Používá rozmístěná semena (jeden zásah) a velmi rychlá SSE -SSE2 -AVX2 -AVX-512 pásmový zarovnávací filtr. Pro čtení pouze s pevnou délkou autoři doporučují SHRiMP2 jinak.	Ne	Ano	Ano	Ano, OpenMP	Volný, uvolnit	^[58]	2010
Subread, Subjunc	Superrychlé a přesné zarovnávače čtení. Subread lze použít k mapování jak čtení gDNA-seq, tak RNA-seq. Subjunc detekuje spojení exon-exon a mapuje čtení RNA-seq. Zaměstnávají pojmenované paradigma mapování seed-and-vote.	Ano	Ano	Ano	Ano	Volný, uvolnit, GPL 3
Taipan	De-novo assembler pro Illuminu čte					Proprietární, freeware pro akademické a nekomerční použití
UGENE	Visual interface both for Bowtie and BWA, and an embedded aligner	Ano	Ano	Ano	Ano	Volný, uvolnit, GPL
VelociMapper	FPGA-accelerated reference sequence alignment mapping tool from TimeLogic. Rychlejší než Burrows-Wheeler transform -based algorithms like BWA and Bowtie. Supports up to 7 mismatches and/or indels with no performance penalty. Produces sensitive Smith-Waterman gapped alignments.	Ano	Ano	Ano	Ano	Proprietární, komerční
XpressAlign	FPGA based sliding window short read aligner which exploits the embarrassingly parallel property of short read alignment. Performance scales linearly with number of transistors on a chip (i.e. performance guaranteed to double with each iteration of Moore's Law without modification to algorithm). Low power consumption is useful for datacentre equipment. Predictable runtime. Better price/performance than software sliding window aligners on current hardware, but not better than software BWT-based aligners currently. Can manage large numbers (>2) of mismatches. Will find all hit positions for all seeds. Single-FPGA experimental version, needs work to develop it into a multi-FPGA production version.					Proprietární, freeware for academic and noncommercial use
ZVĚTŠENÍ	100% sensitivity for a reads between 15-240 bp with practical mismatches. Velmi rychle. Support insertions and deletions. Works with Illumina & SOLiD instruments, not 454.				Yes (GUI), no (CLI)	Proprietární, komerční	^[59]

Viz také

Seznam open source bioinformatického softwaru

Reference

^ Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ; Gish; Mlynář; Myers; Lipman (October 1990). Msgstr "Základní vyhledávací nástroj pro místní zarovnání". Journal of Molecular Biology. 215 (3): 403–10. doi:10.1016 / S0022-2836 (05) 80360-2. PMID 2231712.CS1 maint: více jmen: seznam autorů (odkaz)
^ HPC-BLAST code repository https://github.com/UTennessee-JICS/HPC-BLAST
^ Angermüller, C .; Biegert, A .; Söding, J. (prosinec 2012). „Diskriminační modelování pravděpodobností substituce aminokyselin podle konkrétního kontextu“. Bioinformatika. 28 (24): 3240–7. doi:10.1093 / bioinformatika / bts622. PMID 23080114.
^ Buchfink, Xie and Huson (2015). "Fast and sensitive protein alignment using DIAMOND". Přírodní metody. 12 (1): 59–60. doi:10.1038/nmeth.3176. PMID 25402007. S2CID 5346781.
^ Durbin, Richard; Eddy, Sean R .; Krogh, Anders; Mitchison, Graeme, eds. (1998). Biologická sekvenční analýza: pravděpodobnostní modely proteinů a nukleových kyselin. Cambridge, Velká Británie: Cambridge University Press. ISBN 978-0-521-62971-3.^{[stránka potřebná ]}
^ Söding J (April 2005). "Detekce homologie proteinů porovnáním HMM-HMM". Bioinformatika. 21 (7): 951–60. doi:10.1093 / bioinformatika / bti125. PMID 15531603.
^ Remmert, Michael; Biegert, Andreas; Hauser, Andreas; Söding, Johannes (2011-12-25). "HHblits: lightning-fast iterative protein sequence searching by HMM-HMM alignment". Přírodní metody. 9 (2): 173–175. doi:10.1038/nmeth.1818. hdl:11858 / 00-001M-0000-0015-8D56-A. ISSN 1548-7105. PMID 22198341. S2CID 205420247.
^ Hauswedell H, Singer J, Reinert K (2014-09-01). "Lambda: the local aligner for massive biological data". Bioinformatika. 30 (17): 349–355. doi:10.1093/bioinformatics/btu439. PMC 4147892. PMID 25161219.
^ Steinegger, Martin; Soeding, Johannes (2017-10-16). "MMseqs2 enables sensitive protein sequence searching for the analysis of massive data sets". Přírodní biotechnologie. 35 (11): 1026–1028. doi:10.1038/nbt.3988. hdl:11858/00-001M-0000-002E-1967-3. PMID 29035372. S2CID 402352.
^ Rucci, Enzo; Garcia, Carlos; Botella, Guillermo; Giusti, Armando E. De; Naiouf, Marcelo; Prieto-Matias, Manuel (2016-06-30). "OSWALD: OpenCL Smith–Waterman on Altera's FPGA for Large Protein Databases". International Journal of High Performance Computing Applications. 32 (3): 337–350. doi:10.1177/1094342016654215. ISSN 1094-3420. S2CID 212680914.
^ Altschul SF, Madden TL, Schäffer AA, et al. (Září 1997). „Gapped BLAST and PSI-BLAST: a new generation of protein database search programs“. Výzkum nukleových kyselin. 25 (17): 3389–402. doi:10.1093 / nar / 25.17.3389. PMC 146917. PMID 9254694.
^ Li W, McWilliam H, Goujon M, et al. (Červen 2012). "PSI-Search: iterative HOE-reduced profile SSEARCH searching". Bioinformatika. 28 (12): 1650–1651. doi:10.1093/bioinformatics/bts240. PMC 3371869. PMID 22539666.
^ Oehmen, C.; Nieplocha, J. (August 2006). "ScalaBLAST: A scalable implementation of BLAST for high-performance data-intensive bioinformatics analysis". IEEE Transactions on Parallel & Distributed Systems. 17 (8): 740–749. doi:10.1109/TPDS.2006.112. S2CID 11122366.
^ Hughey, R .; Karplus, K .; Krogh, A. (2003). SAM: sequence alignment and modeling software system. Technical report UCSC-CRL-99-11 (Zpráva). University of California, Santa Cruz, CA.
^ Rucci, Enzo; García, Carlos; Botella, Guillermo; De Giusti, Armando; Naiouf, Marcelo; Prieto-Matías, Manuel (2015-12-25). "An energy-aware performance analysis of SWIMM: Smith–Waterman implementation on Intel's Multicore and Manycore architectures". Concurrency and Computation: Practice and Experience. 27 (18): 5517–5537. doi:10.1002/cpe.3598. ISSN 1532-0634. S2CID 42945406.
^ Rucci, Enzo; García, Carlos; Botella, Guillermo; De Giusti, Armando; Naiouf, Marcelo; Prieto-Matías, Manuel (2015-12-25). "SWIMM 2.0: enhanced Smith-Waterman on Intel's Multicore and Manycore architectures based on AVX-512 vector extensions". International Journal of Parallel Programming. 47 (2): 296–317. doi:10.1007/s10766-018-0585-7. ISSN 1573-7640. S2CID 49670113.
^ Schwartz S, Kent WJ, Smit A, Zhang Z, Baertsch R, Hardison RC, Haussler D, Miller W; Kent; Smit; Zhang; Baertsch; Hardison; Haussler; Miller (2003). "Human-mouse alignments with BLASTZ". Výzkum genomu. 13 (1): 103–107. doi:10.1101/gr.809403. PMC 430961. PMID 12529312.CS1 maint: více jmen: seznam autorů (odkaz)
^ Harris R S (2007). Improved pairwise alignment of genomic DNA (Teze).
^ Sandes, Edans F. de O.; de Melo, Alba Cristina M.A. (May 2013). "Retrieving Smith-Waterman Alignments with Optimizations for Megabase Biological Sequences Using GPU". IEEE Transactions on Parallel and Distributed Systems. 24 (5): 1009–1021. doi:10.1109/TPDS.2012.194.
^ Sandes, Edans F. de O.; Miranda, G.; De Melo, A.C.M.A.; Martorell, X.; Ayguade, E. (May 2014). CUDAlign 3.0: Parallel Biological Sequence Comparison in Large GPU Clusters. Cluster, Cloud and Grid Computing (CCGrid), 2014 14th IEEE/ACM International Symposium on. str. 160. doi:10.1109/CCGrid.2014.18.
^ Sandes, Edans F. de O.; Miranda, G.; De Melo, A.C.M.A.; Martorell, X.; Ayguade, E. (August 2014). Fine-grain Parallel Megabase Sequence Comparison with Multiple Heterogeneous GPUs. Proceedings of the 19th ACM SIGPLAN Symposium on Principles and Practice of Parallel Programming. 383–384. doi:10.1145/2555243.2555280.
^ Chivian, D; Baker, D (2006). "Homology modeling using parametric alignment ensemble generation with consensus and energy-based model selection". Výzkum nukleových kyselin. 34 (17): e112. doi:10.1093/nar/gkl480. PMC 1635247. PMID 16971460.
^ Girdea, M; Noe, L; Kucherov, G (January 2010). "Back-translation for discovering distant protein homologies in the presence of frameshift mutations". Algoritmy pro molekulární biologii. 5 (6): 6. doi:10.1186/1748-7188-5-6. PMC 2821327. PMID 20047662.
^ Ma, B.; Tromp, J .; Li, M. (2002). "PatternHunter: faster and more sensitive homology search". Bioinformatika. 18 (3): 440–445. doi:10.1093/bioinformatics/18.3.440. PMID 11934743.
^ Li, M .; Ma, B.; Kisman, D.; Tromp, J. (2004). "Patternhunter II: highly sensitive and fast homology search". Journal of Bioinformatics and Computational Biology. 2 (3): 417–439. CiteSeerX 10.1.1.1.2393. doi:10.1142/S0219720004000661. PMID 15359419.
^ Gusfield, Dan (1997). Algorithms on strings, trees and sequences. Cambridge univerzitní tisk. ISBN 978-0-521-58519-4.
^ Rucci, Enzo; Garcia, Carlos; Botella, Guillermo; Naiouf, Marcelo; De Giusti,Armando; Prieto-Matias, Manuel (2018). "SWIFOLD: Smith-Waterman implementation on FPGA with OpenCL for long DNA sequences". BMC Systems Biology. 12 (Suppl 5): 96. doi:10.1186/s12918-018-0614-6. PMC 6245597. PMID 30458766.
^ Rucci, Enzo; Garcia, Carlos; Botella, Guillermo; Naiouf, Marcelo; De Giusti,Armando; Prieto-Matias, Manuel. Accelerating Smith-Waterman Alignment of Long DNA Sequences with OpenCL on FPGA. 5th International Work-Conference on Bioinformatics and Biomedical Engineering. str. 500-511. doi:10.1007/978-3-319-56154-7_45.
^ Rasmussen K, Stoye J, Myers EW; Stoye; Myers (2006). "Efficient q-Gram Filters for Finding All epsilon-Matches over a Given Length". Journal of Computational Biology. 13 (2): 296–308. CiteSeerX 10.1.1.465.2084. doi:10.1089/cmb.2006.13.296. PMID 16597241.CS1 maint: více jmen: seznam autorů (odkaz)
^ Noe L, Kucherov G; Kucherov (2005). "YASS: enhancing the sensitivity of DNA similarity search". Výzkum nukleových kyselin. 33 (suppl_2): W540–W543. doi:10.1093/nar/gki478. PMC 1160238. PMID 15980530.
^ Pratas, Diogo; Silva, Jorge (2020). "Persistent minimal sequences of SARS-CoV-2". Bioinformatika. doi:10.1093/bioinformatics/btaa686. PMID 32730589.
^ Wilton, Richard; Budavari, Tamas; Langmead, Ben; Wheelan, Sarah J.; Salzberg, Steven L .; Szalay, Alexander S. (2015). „Arioc: vysokorychlostní zarovnání čtení s GPU zrychleným průzkumem prostoru pro vyhledávání semen a rozšíření“. PeerJ. 3: e808. doi:10,7717 / peerj.808. PMC 4358639. PMID 25780763.
^ Homer, Nils; Merriman, Barry; Nelson, Stanley F. (2009). "BFAST: An Alignment Tool for Large Scale Genome Resequencing". PLOS ONE. 4 (11): e7767. doi:10.1371/journal.pone.0007767. PMC 2770639. PMID 19907642.
^ Abuín, J.M.; Pichel, J.C.; Pena, T.F.; Amigo, J. (2015). "BigBWA: approaching the Burrows–Wheeler aligner to Big Data technologies". Bioinformatika. 31 (24): 4003–5. doi:10.1093/bioinformatics/btv506. PMID 26323715.
^ Kent, W. J. (2002). „BLAT --- BLAST-Like Alignment Tool“. Výzkum genomu. 12 (4): 656–664. doi:10,1101 / gr. 229202. ISSN 1088-9051. PMC 187518. PMID 11932250.
^ Langmead, Ben; Trapnell, Cole; Pop, Mihai; Salzberg, Steven L (2009). „Ultrarychlé a paměťově efektivní zarovnání krátkých sekvencí DNA do lidského genomu“. Genome Biology. 10 (3): R25. doi:10.1186 / gb-2009-10-3-r25. ISSN 1465-6906. PMC 2690996. PMID 19261174.
^ Li, H .; Durbin, R. (2009). „Rychlé a přesné zarovnání krátkého čtení s transformací Burrows-Wheeler“. Bioinformatika. 25 (14): 1754–1760. doi:10.1093 / bioinformatika / btp324. ISSN 1367-4803. PMC 2705234. PMID 19451168.
^ ^A ^b Kerpedjiev, Peter; Frellsen, Jes; Lindgreen, Stinus; Krogh, Anders (2014). "Adaptable probabilistic mapping of short reads using position specific scoring matrices". BMC bioinformatika. 15 (1): 100. doi:10.1186/1471-2105-15-100. ISSN 1471-2105. PMC 4021105. PMID 24717095.
^ Liu, Y .; Schmidt, B .; Maskell, D. L. (2012). "CUSHAW: a CUDA compatible short read aligner to large genomes based on the Burrows-Wheeler transform". Bioinformatika. 28 (14): 1830–1837. doi:10.1093/bioinformatics/bts276. ISSN 1367-4803. PMID 22576173.
^ Liu, Y .; Schmidt, B. (2012). "Long read alignment based on maximal exact match seeds". Bioinformatika. 28 (18): i318–i324. doi:10.1093/bioinformatics/bts414. ISSN 1367-4803. PMC 3436841. PMID 22962447.
^ Rizk, Guillaume; Lavenier, Dominique (2010). "GASSST: global alignment short sequence search tool". Bioinformatika. 26 (20): 2534–2540. doi:10.1093/bioinformatics/btq485. PMC 2951093. PMID 20739310.
^ Marco-Sola, Santiago; Sammeth, Michael; Guigó, Roderic; Ribeca, Paolo (2012). "The GEM mapper: fast, accurate and versatile alignment by filtration". Přírodní metody. 9 (12): 1185–1188. doi:10.1038/nmeth.2221. ISSN 1548-7091. PMID 23103880. S2CID 2004416.
^ Clement, N. L.; Snell, Q.; Clement, M. J.; Hollenhorst, P. C.; Purwar, J.; Graves, B. J.; Cairns, B. R.; Johnson, W. E. (2009). "The GNUMAP algorithm: unbiased probabilistic mapping of oligonucleotides from next-generation sequencing". Bioinformatika. 26 (1): 38–45. doi:10.1093/bioinformatics/btp614. ISSN 1367-4803. PMC 6276904. PMID 19861355.
^ Santana-Quintero, Luis; Dingerdissen, Hayley; Thierry-Mieg, Jean; Mazumder, Raja; Simonyan, Vahan (2014). "HIVE-Hexagon: High-Performance, Parallelized Sequence Alignment for Next-Generation Sequencing Data Analysis". PLOS ONE. 9 (6): 1754–1760. doi:10.1371/journal.pone.0099033. PMC 4053384. PMID 24918764.
^ Kielbasa, S.M.; Wan, R.; Sato, K .; Horton, P.; Frith, M.C. (2011). "Adaptive seeds tame genomic sequence comparison". Výzkum genomu. 21 (3): 487–493. doi:10.1101/gr.113985.110. PMC 3044862. PMID 21209072.
^ Rivals, Eric; Salmela, Leena; Kiiskinen, Petteri; Kalsi, Petri; Tarhio, Jorma (2009). mpscan: Fast Localisation of Multiple Reads in Genomes. Algorithms in Bioinformatics. Přednášky z informatiky. 5724. 246–260. CiteSeerX 10.1.1.156.928. doi:10.1007/978-3-642-04241-6_21. ISBN 978-3-642-04240-9.
^ Sedlazeck, Fritz J.; Rescheneder, Philipp; von Haeseler, Arndt (2013). "NextGenMap: fast and accurate read mapping in highly polymorphic genomes". Bioinformatika. 29 (21): 2790–2791. doi:10.1093/bioinformatics/btt468. PMID 23975764.
^ Chen, Yangho; Souaiaia, Tade; Chen, Ting (2009). "PerM: efficient mapping of short sequencing reads with periodic full sensitive spaced seeds". Bioinformatika. 25 (19): 2514–2521. doi:10.1093/bioinformatics/btp486. PMC 2752623. PMID 19675096.
^ Searls, David B.; Hoffmann, Steve; Otto, Christian; Kurtz, Stefan; Sharma, Cynthia M.; Khaitovich, Philipp; Vogel, Jörg; Stadler, Peter F.; Hackermüller, Jörg (2009). "Fast Mapping of Short Sequences with Mismatches, Insertions and Deletions Using Index Structures". PLOS výpočetní biologie. 5 (9): e1000502. doi:10.1371/journal.pcbi.1000502. ISSN 1553-7358. PMC 2730575. PMID 19750212.
^ Rumble, Stephen M.; Lacroute, Phil; Dalca, Adrian V.; Fiume, Marc; Sidow, Arend; Brudno, Michael (2009). "SHRiMP: Accurate Mapping of Short Color-space Reads". PLOS výpočetní biologie. 5 (5): e1000386. doi:10.1371/journal.pcbi.1000386. PMC 2678294. PMID 19461883.
^ David, Matei; Dzamba, Misko; Lister, Dan; Ilie, Lucian; Brudno, Michael (2011). "SHRiMP2: Sensitive yet Practical Short Read Mapping". Bioinformatika. 27 (7): 1011–1012. doi:10.1093/bioinformatics/btr046. PMID 21278192.
^ Malhis, Nawar; Butterfield, Yaron S. N.; Ester, Martin; Jones, Steven J. M. (2009). "Slider – Maximum use of probability information for alignment of short sequence reads and SNP detection". Bioinformatika. 25 (1): 6–13. doi:10.1093/bioinformatics/btn565. PMC 2638935. PMID 18974170.
^ Malhis, Nawar; Jones, Steven J. M. (2010). "High Quality SNP Calling Using Illumina Data at Shallow Coverage". Bioinformatika. 26 (8): 1029–1035. doi:10.1093/bioinformatics/btq092. PMID 20190250.
^ Li, R .; Li, Y .; Kristiansen, K .; Wang, J. (2008). "SOAP: short oligonucleotide alignment program". Bioinformatika. 24 (5): 713–714. doi:10.1093/bioinformatics/btn025. ISSN 1367-4803. PMID 18227114.
^ Li, R .; Yu, C .; Li, Y .; Lam, T.-W.; Yiu, S.-M.; Kristiansen, K .; Wang, J. (2009). "SOAP2: an improved ultrafast tool for short read alignment". Bioinformatika. 25 (15): 1966–1967. doi:10.1093/bioinformatics/btp336. ISSN 1367-4803. PMID 19497933.
^ Abuín, José M.; Pichel, Juan C.; Pena, Tomás F.; Amigo, Jorge (2016-05-16). "SparkBWA: Speeding Up the Alignment of High-Throughput DNA Sequencing Data". PLOS ONE. 11 (5): e0155461. doi:10.1371/journal.pone.0155461. ISSN 1932-6203. PMC 4868289. PMID 27182962.
^ Lunter, G .; Goodson, M. (2010). "Stampy: A statistical algorithm for sensitive and fast mapping of Illumina sequence reads". Výzkum genomu. 21 (6): 936–939. doi:10.1101/gr.111120.110. ISSN 1088-9051. PMC 3106326. PMID 20980556.
^ Noe, L.; Girdea, M.; Kucherov, G. (2010). "Designing efficient spaced seeds for SOLiD read mapping". Pokroky v bioinformatice. 2010: 708501. doi:10.1155/2010/708501. PMC 2945724. PMID 20936175.
^ Lin, H .; Zhang, Z .; Zhang, M.Q.; Ma, B.; Li, M. (2008). "ZOOM! Zillions of oligos mapped". Bioinformatika. 24 (21): 2431–2437. doi:10.1093/bioinformatics/btn416. PMC 2732274. PMID 18684737.

[1] Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ; Gish; Mlynář; Myers; Lipman (October 1990). Msgstr "Základní vyhledávací nástroj pro místní zarovnání". Journal of Molecular Biology. 215 (3): 403–10. doi:10.1016 / S0022-2836 (05) 80360-2. PMID 2231712.CS1 maint: více jmen: seznam autorů (odkaz)

[2] HPC-BLAST code repository https://github.com/UTennessee-JICS/HPC-BLAST

[3] Angermüller, C .; Biegert, A .; Söding, J. (prosinec 2012). „Diskriminační modelování pravděpodobností substituce aminokyselin podle konkrétního kontextu“. Bioinformatika. 28 (24): 3240–7. doi:10.1093 / bioinformatika / bts622. PMID 23080114.

[4] Buchfink, Xie and Huson (2015). "Fast and sensitive protein alignment using DIAMOND". Přírodní metody. 12 (1): 59–60. doi:10.1038/nmeth.3176. PMID 25402007. S2CID 5346781.

[5] Durbin, Richard; Eddy, Sean R .; Krogh, Anders; Mitchison, Graeme, eds. (1998). Biologická sekvenční analýza: pravděpodobnostní modely proteinů a nukleových kyselin. Cambridge, Velká Británie: Cambridge University Press. ISBN 978-0-521-62971-3.^{[stránka potřebná ]}

[6] Söding J (April 2005). "Detekce homologie proteinů porovnáním HMM-HMM". Bioinformatika. 21 (7): 951–60. doi:10.1093 / bioinformatika / bti125. PMID 15531603.

[7] Remmert, Michael; Biegert, Andreas; Hauser, Andreas; Söding, Johannes (2011-12-25). "HHblits: lightning-fast iterative protein sequence searching by HMM-HMM alignment". Přírodní metody. 9 (2): 173–175. doi:10.1038/nmeth.1818. hdl:11858 / 00-001M-0000-0015-8D56-A. ISSN 1548-7105. PMID 22198341. S2CID 205420247.

[8] Hauswedell H, Singer J, Reinert K (2014-09-01). "Lambda: the local aligner for massive biological data". Bioinformatika. 30 (17): 349–355. doi:10.1093/bioinformatics/btu439. PMC 4147892. PMID 25161219.

[9] Steinegger, Martin; Soeding, Johannes (2017-10-16). "MMseqs2 enables sensitive protein sequence searching for the analysis of massive data sets". Přírodní biotechnologie. 35 (11): 1026–1028. doi:10.1038/nbt.3988. hdl:11858/00-001M-0000-002E-1967-3. PMID 29035372. S2CID 402352.

[10] Rucci, Enzo; Garcia, Carlos; Botella, Guillermo; Giusti, Armando E. De; Naiouf, Marcelo; Prieto-Matias, Manuel (2016-06-30). "OSWALD: OpenCL Smith–Waterman on Altera's FPGA for Large Protein Databases". International Journal of High Performance Computing Applications. 32 (3): 337–350. doi:10.1177/1094342016654215. ISSN 1094-3420. S2CID 212680914.

[11] Altschul SF, Madden TL, Schäffer AA, et al. (Září 1997). „Gapped BLAST and PSI-BLAST: a new generation of protein database search programs“. Výzkum nukleových kyselin. 25 (17): 3389–402. doi:10.1093 / nar / 25.17.3389. PMC 146917. PMID 9254694.

[12] Li W, McWilliam H, Goujon M, et al. (Červen 2012). "PSI-Search: iterative HOE-reduced profile SSEARCH searching". Bioinformatika. 28 (12): 1650–1651. doi:10.1093/bioinformatics/bts240. PMC 3371869. PMID 22539666.

[13] Oehmen, C.; Nieplocha, J. (August 2006). "ScalaBLAST: A scalable implementation of BLAST for high-performance data-intensive bioinformatics analysis". IEEE Transactions on Parallel & Distributed Systems. 17 (8): 740–749. doi:10.1109/TPDS.2006.112. S2CID 11122366.

[14] Hughey, R .; Karplus, K .; Krogh, A. (2003). SAM: sequence alignment and modeling software system. Technical report UCSC-CRL-99-11 (Zpráva). University of California, Santa Cruz, CA.

[15] Rucci, Enzo; García, Carlos; Botella, Guillermo; De Giusti, Armando; Naiouf, Marcelo; Prieto-Matías, Manuel (2015-12-25). "An energy-aware performance analysis of SWIMM: Smith–Waterman implementation on Intel's Multicore and Manycore architectures". Concurrency and Computation: Practice and Experience. 27 (18): 5517–5537. doi:10.1002/cpe.3598. ISSN 1532-0634. S2CID 42945406.

[16] Rucci, Enzo; García, Carlos; Botella, Guillermo; De Giusti, Armando; Naiouf, Marcelo; Prieto-Matías, Manuel (2015-12-25). "SWIMM 2.0: enhanced Smith-Waterman on Intel's Multicore and Manycore architectures based on AVX-512 vector extensions". International Journal of Parallel Programming. 47 (2): 296–317. doi:10.1007/s10766-018-0585-7. ISSN 1573-7640. S2CID 49670113.

[17] Schwartz S, Kent WJ, Smit A, Zhang Z, Baertsch R, Hardison RC, Haussler D, Miller W; Kent; Smit; Zhang; Baertsch; Hardison; Haussler; Miller (2003). "Human-mouse alignments with BLASTZ". Výzkum genomu. 13 (1): 103–107. doi:10.1101/gr.809403. PMC 430961. PMID 12529312.CS1 maint: více jmen: seznam autorů (odkaz)

[18] Harris R S (2007). Improved pairwise alignment of genomic DNA (Teze).

[19] Sandes, Edans F. de O.; de Melo, Alba Cristina M.A. (May 2013). "Retrieving Smith-Waterman Alignments with Optimizations for Megabase Biological Sequences Using GPU". IEEE Transactions on Parallel and Distributed Systems. 24 (5): 1009–1021. doi:10.1109/TPDS.2012.194.

[20] Sandes, Edans F. de O.; Miranda, G.; De Melo, A.C.M.A.; Martorell, X.; Ayguade, E. (May 2014). CUDAlign 3.0: Parallel Biological Sequence Comparison in Large GPU Clusters. Cluster, Cloud and Grid Computing (CCGrid), 2014 14th IEEE/ACM International Symposium on. str. 160. doi:10.1109/CCGrid.2014.18.

[21] Sandes, Edans F. de O.; Miranda, G.; De Melo, A.C.M.A.; Martorell, X.; Ayguade, E. (August 2014). Fine-grain Parallel Megabase Sequence Comparison with Multiple Heterogeneous GPUs. Proceedings of the 19th ACM SIGPLAN Symposium on Principles and Practice of Parallel Programming. 383–384. doi:10.1145/2555243.2555280.

[22] Chivian, D; Baker, D (2006). "Homology modeling using parametric alignment ensemble generation with consensus and energy-based model selection". Výzkum nukleových kyselin. 34 (17): e112. doi:10.1093/nar/gkl480. PMC 1635247. PMID 16971460.

[23] Girdea, M; Noe, L; Kucherov, G (January 2010). "Back-translation for discovering distant protein homologies in the presence of frameshift mutations". Algoritmy pro molekulární biologii. 5 (6): 6. doi:10.1186/1748-7188-5-6. PMC 2821327. PMID 20047662.

[24] Ma, B.; Tromp, J .; Li, M. (2002). "PatternHunter: faster and more sensitive homology search". Bioinformatika. 18 (3): 440–445. doi:10.1093/bioinformatics/18.3.440. PMID 11934743.

[25] Li, M .; Ma, B.; Kisman, D.; Tromp, J. (2004). "Patternhunter II: highly sensitive and fast homology search". Journal of Bioinformatics and Computational Biology. 2 (3): 417–439. CiteSeerX 10.1.1.1.2393. doi:10.1142/S0219720004000661. PMID 15359419.

[26] Gusfield, Dan (1997). Algorithms on strings, trees and sequences. Cambridge univerzitní tisk. ISBN 978-0-521-58519-4.

[27] Rucci, Enzo; Garcia, Carlos; Botella, Guillermo; Naiouf, Marcelo; De Giusti,Armando; Prieto-Matias, Manuel (2018). "SWIFOLD: Smith-Waterman implementation on FPGA with OpenCL for long DNA sequences". BMC Systems Biology. 12 (Suppl 5): 96. doi:10.1186/s12918-018-0614-6. PMC 6245597. PMID 30458766.

[28] Rucci, Enzo; Garcia, Carlos; Botella, Guillermo; Naiouf, Marcelo; De Giusti,Armando; Prieto-Matias, Manuel. Accelerating Smith-Waterman Alignment of Long DNA Sequences with OpenCL on FPGA. 5th International Work-Conference on Bioinformatics and Biomedical Engineering. str. 500-511. doi:10.1007/978-3-319-56154-7_45.

[29] Rasmussen K, Stoye J, Myers EW; Stoye; Myers (2006). "Efficient q-Gram Filters for Finding All epsilon-Matches over a Given Length". Journal of Computational Biology. 13 (2): 296–308. CiteSeerX 10.1.1.465.2084. doi:10.1089/cmb.2006.13.296. PMID 16597241.CS1 maint: více jmen: seznam autorů (odkaz)

[30] Noe L, Kucherov G; Kucherov (2005). "YASS: enhancing the sensitivity of DNA similarity search". Výzkum nukleových kyselin. 33 (suppl_2): W540–W543. doi:10.1093/nar/gki478. PMC 1160238. PMID 15980530.

[Pratas2020-31] Pratas, Diogo; Silva, Jorge (2020). "Persistent minimal sequences of SARS-CoV-2". Bioinformatika. doi:10.1093/bioinformatics/btaa686. PMID 32730589.

[WiltonEtAl2015-32] Wilton, Richard; Budavari, Tamas; Langmead, Ben; Wheelan, Sarah J.; Salzberg, Steven L .; Szalay, Alexander S. (2015). „Arioc: vysokorychlostní zarovnání čtení s GPU zrychleným průzkumem prostoru pro vyhledávání semen a rozšíření“. PeerJ. 3: e808. doi:10,7717 / peerj.808. PMC 4358639. PMID 25780763.

[HomerMerrimanNelson2009-33] Homer, Nils; Merriman, Barry; Nelson, Stanley F. (2009). "BFAST: An Alignment Tool for Large Scale Genome Resequencing". PLOS ONE. 4 (11): e7767. doi:10.1371/journal.pone.0007767. PMC 2770639. PMID 19907642.

[Abuin2015-34] Abuín, J.M.; Pichel, J.C.; Pena, T.F.; Amigo, J. (2015). "BigBWA: approaching the Burrows–Wheeler aligner to Big Data technologies". Bioinformatika. 31 (24): 4003–5. doi:10.1093/bioinformatics/btv506. PMID 26323715.

[Kent2002-35] Kent, W. J. (2002). „BLAT --- BLAST-Like Alignment Tool“. Výzkum genomu. 12 (4): 656–664. doi:10,1101 / gr. 229202. ISSN 1088-9051. PMC 187518. PMID 11932250.

[LangmeadTrapnell2009-36] Langmead, Ben; Trapnell, Cole; Pop, Mihai; Salzberg, Steven L (2009). „Ultrarychlé a paměťově efektivní zarovnání krátkých sekvencí DNA do lidského genomu“. Genome Biology. 10 (3): R25. doi:10.1186 / gb-2009-10-3-r25. ISSN 1465-6906. PMC 2690996. PMID 19261174.

[LiDurbin2009-37] Li, H .; Durbin, R. (2009). „Rychlé a přesné zarovnání krátkého čtení s transformací Burrows-Wheeler“. Bioinformatika. 25 (14): 1754–1760. doi:10.1093 / bioinformatika / btp324. ISSN 1367-4803. PMC 2705234. PMID 19451168.

[KerpedjievFrellsen2014-38] A ^b Kerpedjiev, Peter; Frellsen, Jes; Lindgreen, Stinus; Krogh, Anders (2014). "Adaptable probabilistic mapping of short reads using position specific scoring matrices". BMC bioinformatika. 15 (1): 100. doi:10.1186/1471-2105-15-100. ISSN 1471-2105. PMC 4021105. PMID 24717095.

[LiuSchmidt2012a-39] Liu, Y .; Schmidt, B .; Maskell, D. L. (2012). "CUSHAW: a CUDA compatible short read aligner to large genomes based on the Burrows-Wheeler transform". Bioinformatika. 28 (14): 1830–1837. doi:10.1093/bioinformatics/bts276. ISSN 1367-4803. PMID 22576173.

[LiuSchmidt2012b-40] Liu, Y .; Schmidt, B. (2012). "Long read alignment based on maximal exact match seeds". Bioinformatika. 28 (18): i318–i324. doi:10.1093/bioinformatics/bts414. ISSN 1367-4803. PMC 3436841. PMID 22962447.

[RizkLavenier2012-41] Rizk, Guillaume; Lavenier, Dominique (2010). "GASSST: global alignment short sequence search tool". Bioinformatika. 26 (20): 2534–2540. doi:10.1093/bioinformatics/btq485. PMC 2951093. PMID 20739310.

[Marco-SolaSammeth2012-42] Marco-Sola, Santiago; Sammeth, Michael; Guigó, Roderic; Ribeca, Paolo (2012). "The GEM mapper: fast, accurate and versatile alignment by filtration". Přírodní metody. 9 (12): 1185–1188. doi:10.1038/nmeth.2221. ISSN 1548-7091. PMID 23103880. S2CID 2004416.

[ClementSnell2009-43] Clement, N. L.; Snell, Q.; Clement, M. J.; Hollenhorst, P. C.; Purwar, J.; Graves, B. J.; Cairns, B. R.; Johnson, W. E. (2009). "The GNUMAP algorithm: unbiased probabilistic mapping of oligonucleotides from next-generation sequencing". Bioinformatika. 26 (1): 38–45. doi:10.1093/bioinformatics/btp614. ISSN 1367-4803. PMC 6276904. PMID 19861355.

[VSimonyan2014-44] Santana-Quintero, Luis; Dingerdissen, Hayley; Thierry-Mieg, Jean; Mazumder, Raja; Simonyan, Vahan (2014). "HIVE-Hexagon: High-Performance, Parallelized Sequence Alignment for Next-Generation Sequencing Data Analysis". PLOS ONE. 9 (6): 1754–1760. doi:10.1371/journal.pone.0099033. PMC 4053384. PMID 24918764.

[45] Kielbasa, S.M.; Wan, R.; Sato, K .; Horton, P.; Frith, M.C. (2011). "Adaptive seeds tame genomic sequence comparison". Výzkum genomu. 21 (3): 487–493. doi:10.1101/gr.113985.110. PMC 3044862. PMID 21209072.

[RivalsEtAl2009-46] Rivals, Eric; Salmela, Leena; Kiiskinen, Petteri; Kalsi, Petri; Tarhio, Jorma (2009). mpscan: Fast Localisation of Multiple Reads in Genomes. Algorithms in Bioinformatics. Přednášky z informatiky. 5724. 246–260. CiteSeerX 10.1.1.156.928. doi:10.1007/978-3-642-04241-6_21. ISBN 978-3-642-04240-9.

[SedlazeckReschenederVonHaeseler2013-47] Sedlazeck, Fritz J.; Rescheneder, Philipp; von Haeseler, Arndt (2013). "NextGenMap: fast and accurate read mapping in highly polymorphic genomes". Bioinformatika. 29 (21): 2790–2791. doi:10.1093/bioinformatics/btt468. PMID 23975764.

[ChenSouaiaiaChen2009-48] Chen, Yangho; Souaiaia, Tade; Chen, Ting (2009). "PerM: efficient mapping of short sequencing reads with periodic full sensitive spaced seeds". Bioinformatika. 25 (19): 2514–2521. doi:10.1093/bioinformatics/btp486. PMC 2752623. PMID 19675096.

[SearlsHoffmann2009-49] Searls, David B.; Hoffmann, Steve; Otto, Christian; Kurtz, Stefan; Sharma, Cynthia M.; Khaitovich, Philipp; Vogel, Jörg; Stadler, Peter F.; Hackermüller, Jörg (2009). "Fast Mapping of Short Sequences with Mismatches, Insertions and Deletions Using Index Structures". PLOS výpočetní biologie. 5 (9): e1000502. doi:10.1371/journal.pcbi.1000502. ISSN 1553-7358. PMC 2730575. PMID 19750212.

[RumbleLacrouteDalcaFiumeSidowBrudno2009-50] Rumble, Stephen M.; Lacroute, Phil; Dalca, Adrian V.; Fiume, Marc; Sidow, Arend; Brudno, Michael (2009). "SHRiMP: Accurate Mapping of Short Color-space Reads". PLOS výpočetní biologie. 5 (5): e1000386. doi:10.1371/journal.pcbi.1000386. PMC 2678294. PMID 19461883.

[DavidDzambaListerIlieBrudno2011-51] David, Matei; Dzamba, Misko; Lister, Dan; Ilie, Lucian; Brudno, Michael (2011). "SHRiMP2: Sensitive yet Practical Short Read Mapping". Bioinformatika. 27 (7): 1011–1012. doi:10.1093/bioinformatics/btr046. PMID 21278192.

[MalhisButterfieldEsterJones2009-52] Malhis, Nawar; Butterfield, Yaron S. N.; Ester, Martin; Jones, Steven J. M. (2009). "Slider – Maximum use of probability information for alignment of short sequence reads and SNP detection". Bioinformatika. 25 (1): 6–13. doi:10.1093/bioinformatics/btn565. PMC 2638935. PMID 18974170.

[MalhisJones2010-53] Malhis, Nawar; Jones, Steven J. M. (2010). "High Quality SNP Calling Using Illumina Data at Shallow Coverage". Bioinformatika. 26 (8): 1029–1035. doi:10.1093/bioinformatics/btq092. PMID 20190250.

[LiLi2008-54] Li, R .; Li, Y .; Kristiansen, K .; Wang, J. (2008). "SOAP: short oligonucleotide alignment program". Bioinformatika. 24 (5): 713–714. doi:10.1093/bioinformatics/btn025. ISSN 1367-4803. PMID 18227114.

[LiYu2009-55] Li, R .; Yu, C .; Li, Y .; Lam, T.-W.; Yiu, S.-M.; Kristiansen, K .; Wang, J. (2009). "SOAP2: an improved ultrafast tool for short read alignment". Bioinformatika. 25 (15): 1966–1967. doi:10.1093/bioinformatics/btp336. ISSN 1367-4803. PMID 19497933.

[56] Abuín, José M.; Pichel, Juan C.; Pena, Tomás F.; Amigo, Jorge (2016-05-16). "SparkBWA: Speeding Up the Alignment of High-Throughput DNA Sequencing Data". PLOS ONE. 11 (5): e0155461. doi:10.1371/journal.pone.0155461. ISSN 1932-6203. PMC 4868289. PMID 27182962.

[LunterGoodson2010-57] Lunter, G .; Goodson, M. (2010). "Stampy: A statistical algorithm for sensitive and fast mapping of Illumina sequence reads". Výzkum genomu. 21 (6): 936–939. doi:10.1101/gr.111120.110. ISSN 1088-9051. PMC 3106326. PMID 20980556.

[NoeGirdeaKucherov2010-58] Noe, L.; Girdea, M.; Kucherov, G. (2010). "Designing efficient spaced seeds for SOLiD read mapping". Pokroky v bioinformatice. 2010: 708501. doi:10.1155/2010/708501. PMC 2945724. PMID 20936175.

[LinZhangZhangMaLi2008-59] Lin, H .; Zhang, Z .; Zhang, M.Q.; Ma, B.; Li, M. (2008). "ZOOM! Zillions of oligos mapped". Bioinformatika. 24 (21): 2431–2437. doi:10.1093/bioinformatics/btn416. PMC 2732274. PMID 18684737.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]

[39]

[40]

[41]

[42]

[43]

[44]

[45]

[46]

[47]

[48]

[49]

[50]

[51]

[52]

[53]

[54]

[55]

[56]

[57]

[58]

[59]