Motýlek (sekvenční analýza) - Bowtie (sequence analysis) - Wikipedia
Původní autoři | Ben Langmead Cole Trapnell Mihai Pop Steven Salzberg |
---|---|
Vývojáři | Ben Langmead a kol., |
Stabilní uvolnění | 2.3.5.1 / 16. dubna 2019 |
Úložiště | ![]() |
Operační systém | Linux Operační Systém Mac Okna |
Velikost | 14.7 MB (Zdroj) |
Typ | Bioinformatika |
webová stránka | www |
Motýlek je softwarový balíček běžně používaný pro zarovnání sekvence a sekvenční analýza v bioinformatika.[1] Zdrojový kód balíčku je distribuován volně a kompilované binární soubory jsou k dispozici pro Linux, Operační Systém Mac a Okna platformy. Jak 2017, Genome Biology článek popisující původní metodu Bowtie byl citován více než 11 000krát.[1] Motýlek je open-source software a je v současné době udržována Univerzita Johna Hopkinse.
Dějiny
Zarovnávač sekvencí motýlek byl původně vyvinut společností Ben Langmead et al. na University of Maryland v roce 2009.[1] Zarovnávač se obvykle používá s krátkými čteními a velkým referenční genom, nebo pro analýza celého genomu. Motýlek je propagován jako „ultrarychlý, paměťově efektivní krátký vyrovnávač pro krátké DNA sekvence. "Zvýšení rychlosti Bowtie je částečně způsobeno implementací Burrows – Wheelerova transformace pro vyrovnání, což snižuje paměťová stopa (typicky na přibližně 2,2 GB pro lidský genom);[2] podobnou metodu používá BWA[3] a SOAP2[4] metody zarovnání. [2]
Motýlek provádí kvalitního, chamtivého, náhodného, hloubkové vyhledávání prostorem možných zarovnání. Protože je hledání chamtivé, první platné zarovnání, na které Bowtie narazil, nemusí být nutně „nejlepší“, pokud jde o počet nesouladů nebo kvalitu.
Bowtie se používá jako zarovnávač sekvencí u řady dalších souvisejících bioinformatických algoritmů, včetně Cylindr,[5] Manžetové knoflíčky[6] a CummeRbund Biovodič balík.[7]
Motýlek 2
Dne 16. října 2011 vydali vývojáři beta verzi Vidlička projektu s názvem Motýlek 2.[8] Kromě transformace Burrows-Wheeler používá Bowtie 2 také FM index (podobně jako a pole přípon ), aby jeho paměťová stopa byla malá. Díky své implementaci je Bowtie 2 vhodnější pro hledání delších zarovnání ve srovnání s původní metodou Bowtie. V Bowtie 2 neexistuje horní limit délky čtení a umožňuje zarovnání překrývat nejednoznačné znaky v odkazu.
Reference
- ^ A b C Langmead, Ben; Cole Trapnell; Mihai Pop; Steven L Salzberg (4. března 2009). „Ultrarychlé a paměťově efektivní zarovnání krátkých sekvencí DNA do lidského genomu“ (PDF). Genome Biology. 10 (3): 10: R25. doi:10.1186 / gb-2009-10-3-r25. PMC 2690996. PMID 19261174. Citováno 29. listopadu 2013.
- ^ A b „Motýlek: ultrarychlý, paměťově efektivní zarovnávač krátkého čtení - SourceForge“. Citováno 29. listopadu 2013.
- ^ Li, H .; Durbin, R. (18. května 2009). „Rychlé a přesné zarovnání krátkého čtení s transformací Burrows-Wheeler“. Bioinformatika. 25 (14): 1754–1760. doi:10.1093 / bioinformatika / btp324. PMC 2705234. PMID 19451168.
- ^ Li, R .; Yu, C .; Li, Y .; Lam, T.-W .; Yiu, S.-M .; Kristiansen, K .; Wang, J. (3. června 2009). „SOAP2: vylepšený ultrarychlý nástroj pro zarovnání krátkého čtení“. Bioinformatika. 25 (15): 1966–1967. doi:10.1093 / bioinformatika / btp336. PMID 19497933.
- ^ Trapnell, C .; Pachter, L.; Salzberg, S.L. (16. března 2009). „TopHat: objevování spojovacích spojení pomocí RNA-Seq“. Bioinformatika. 25 (9): 1105–1111. doi:10.1093 / bioinformatika / btp120. PMC 2672628. PMID 19289445.
- ^ Trapnell, Cole; Roberts, Adam; Goff, Loyal; Pertea, Geo; Kim, Daehwan; Kelley, David R; Pimentel, Harold; Salzberg, Steven L; Rinn, John L; Pachter, Lior (1. března 2012). „Diferenciální genová a transkriptová analýza exprese experimentů RNA-seq s TopHat a manžetovými knoflíčky“. Přírodní protokoly. 7 (3): 562–578. doi:10.1038 / nprot.2012.016. PMC 3334321. PMID 22383036.
- ^ „CummeRbund - balíček R pro trvalé ukládání, analýzu a vizualizaci RNA-Seq z výstupu manžetových knoflíků“. Citováno 11. srpna 2015.
- ^ Langmead, Ben; Salzberg, Steven L (4. března 2012). „Rychlé zarovnání čtení s mezerami s motýlkem 2“. Přírodní metody. 9 (4): 357–359. doi:10.1038 / nmeth.1923. PMC 3322381. PMID 22388286.