Balíček analýzy krátkých oligonukleotidů - Short Oligonucleotide Analysis Package
![]() | Téma tohoto článku nemusí splňovat požadavky Wikipedie obecný pokyn k notabilitě.Prosince 2009) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
MÝDLO (Short Oligonucleotide Analysis Package) je sada bioinformatika softwarové nástroje z BGI Oddělení bioinformatiky umožňující montáž, sladění a analýzu sekvenování DNA nové generace data. Je zvláště vhodný pro krátké sekvenční čtení dat.
Všechny programy v balíčku SOAP mohou být použity bezplatně a jsou distribuovány pod GPL open source software licence.
Funkčnost
Sada nástrojů SOAP může být použita k provedení následujících úkolů sestavení genomu:
Sekvenční zarovnání
SOAPaligner (SOAP2) je speciálně navržen pro rychlé zarovnání krátkých čtení a funguje příznivě s ohledem na podobné nástroje pro zarovnání, jako je Motýlek a MAQ.[1]
Shromáždění genomu
SOAPdenovo je krátké čtení de novo využití assembleru De Bruijnův graf konstrukce. Je optimalizován pro krátká čtení, jako například generovaná Illumina a je schopen shromažďovat velké genomy, jako je lidský genom.[2] SOAPdenovo byl použit k sestavení genomu obrovská Panda.[3] To bylo upgradováno na SOAPdenovo2, který byl optimalizován pro velké genomy a zahrnoval široce používaný modul GapCloser.[4]
Sestava transkriptomu
SOAPdenovo-Trans je de novo přepis assembler navržený speciálně pro RNA-sekv který byl vytvořen pro 1000 rostlinných genomů projekt.[5]
Indel Discovery
SOAPindel je nástroj k nalezení vkládání a mazání z dat nové generace spárovaných koncových sekvencí poskytujících seznam kandidátů indels s skóre kvality.[6]
Objev SNP
SOAPsnp je nástroj pro vytváření konsenzuální sekvence. Tento nástroj používá výstup z SOAPaligner generovat konsensuální sekvenci, která umožňuje SNP být povolán na nově seřazeného jedince.
Objev strukturních variací
SOAPsv je nástroj k hledání strukturních variací pomocí celé genomové sestavy.[7]
Kontrola kvality a předzpracování
SOAPnuke je nástroj pro integrovanou kontrolu kvality a předzpracování datových souborů z genomové, malá RNA, Digitální genový výraz, a metagenomické experimenty.[8]
Dějiny
SOAP v1
První vydání SOAP sestávalo pouze z zarovnání sekvence nářadí SOAPaligner.[9]
SOAP v2
SOAP v2 [1] rozšířeno a vylepšeno na SOAP v1 podstatným zlepšením výkonu systému SOAPaligner nářadí. Čas zarovnání byl snížen o faktor 20 - 30, zatímco využití paměti bylo sníženo o faktor 3. Byla přidána podpora pro komprimované formáty souborů.
Sada SOAP byla poté rozšířena o nové nástroje: SOAPdenovo 1 & 2, SOAPindel, SOAPsnp a SOAPsv.
SOAP v3
SOAP v3 rozšířil nástroj pro zarovnání tím, že byl prvním nástrojem pro zarovnání s krátkým čtením, který využíval procesory GPU.[10] V důsledku těchto vylepšení SOAPalign výrazně překonal konkurenční zarovnávače Motýlek a BWA z hlediska rychlosti.
Viz také
externí odkazy
- http://soap.genomics.org.cn
- http://soap.genomics.org.cn/soap1
- http://bioinformatics.genomics.org.cn
- http://seqanswers.com/forums/showthread.php?t=43
Reference
- ^ A b Li, R .; Yu, C .; Li, Y .; Lam, T.-W .; Yiu, S.-M .; Kristiansen, K .; Wang, J. (2009). „SOAP2: vylepšený ultrarychlý nástroj pro zarovnání krátkého čtení“. Bioinformatika. 25 (15): 1966–1967. doi:10.1093 / bioinformatika / btp336. ISSN 1367-4803. PMID 19497933.
- ^ Li, R .; Zhu, H .; Ruan, J .; Qian, W .; Fang, X .; Shi, Z .; Li, Y .; Li, S .; Shan, G .; Kristiansen, K .; Li, S .; Yang, H .; Wang, J .; Wang, J. (2009). „Sestavení lidských genomů de novo s masivně paralelním sekvenováním krátkého čtení“. Výzkum genomu. 20 (2): 265–272. doi:10.1101 / gr.097261.109. ISSN 1088-9051. PMC 2813482. PMID 20019144.
- ^ Li, Ruiqiang; Ventilátor, Wei; Tian, Geng; Zhu, Hongmei; On, Lin; Cai, Jing; Huang, Quanfei; Cai, Qingle; Li, Bo; Bai, Yinqi; Zhang, Zhihe; Zhang, Yaping; Wang, Wen; Li, červen; Wei, Fuwen; Li, Heng; Jian, Min; Li, Jianwen; Zhang, Zhaolei; Nielsen, Rasmus; Li, Dawei; Gu, Wanjun; Yang, Zhentao; Xuan, Zhaoling; Ryder, Oliver A .; Leung, Frederick Chi-Ching; Zhou, Yan; Cao, Jianjun; Sun, Xiao; et al. (2009). „Sekvence a de novo shromáždění genomu pandy obrovské“. Příroda. 463 (7279): 311–317. doi:10.1038 / nature08696. ISSN 0028-0836. PMC 3951497. PMID 20010809.
- ^ Luo, Ruibang; Liu, Binghang; Xie, Yinlong; Li, Zhenyu; Huang, Weihua; Yuan, Jianying; On, Guangzhu; Chen, Yanxiang; Pan, Qi; Liu, Yunjie; Tang, Jingbo (2012-12-01). „SOAPdenovo2: empiricky vylepšený paměťově efektivní de-novo assembler s krátkým čtením“. GigaScience. 1 (1): 18. doi:10.1186 / 2047-217X-1-18. PMC 3626529. PMID 23587118.
- ^ Xie, Yinlong; Wu, Gengxiong; Tang, Jingbo; Luo, Ruibang; Patterson, Jordan; Liu, Shanlin; Huang, Weihua; On, Guangzhu; Gu, Shengchang; Li, Shengkang; Zhou, Xin (2014-06-15). „SOAPdenovo-Trans: sestava transkriptomu de novo s krátkými přečteními RNA-Seq“. Bioinformatika. 30 (12): 1660–1666. doi:10.1093 / bioinformatika / btu077. ISSN 1367-4803. PMID 24532719.
- ^ Li, Shengting; Li, Ruiqiang; Li, Heng; Lu, Jianliang; Li, Yingrui; Bolund, Lars; Schierup, Mikkel H .; Wang, červen (01.01.2013). „SOAPindel: Efektivní identifikace indelů z krátkých párových čtení“. Výzkum genomu. 23 (1): 195–200. doi:10,1101 / gr.132480.111. ISSN 1088-9051. PMC 3530679. PMID 22972939.
- ^ Li, Yingrui; Zheng, Hancheng; Luo, Ruibang; Wu, Honglong; Zhu, Hongmei; Li, Ruiqiang; Cao, Hongzhi; Wu, Boxin; Huang, Shujia; Shao, Haojing; Ma, Hanzhou (srpen 2011). „Strukturální variace ve dvou lidských genomech mapovaných při rozlišení jednoho nukleotidu podle celé sestavy genomu de novo“. Přírodní biotechnologie. 29 (8): 723–730. doi:10.1038 / nbt.1904. ISSN 1546-1696. PMID 21785424.
- ^ Chen, Yuxin; Chen, Yongsheng; Shi, Chunmei; Huang, Zhibo; Zhang, Yong; Li, Shengkang; Li, Yan; Ye, Jia; Yu, Chang; Li, Zhuo; Zhang, Xiuqing (01.01.2018). „SOAPnuke: a MapReduce akcelerovaný software pro integrovanou kontrolu kvality a předzpracování vysoce výkonných sekvenčních dat“. GigaScience. 7 (1): 1–6. doi:10.1093 / gigascience / gix120. PMC 5788068. PMID 29220494.
- ^ Li, R .; Li, Y .; Kristiansen, K .; Wang, J. (2008). „SOAP: short oligonukleotide alignment program“. Bioinformatika. 24 (5): 713–714. doi:10.1093 / bioinformatika / btn025. ISSN 1367-4803. PMID 18227114.
- ^ Liu, C.-M .; Wong, T .; Wu, E .; Luo, R .; Yiu, S.-M .; Li, Y .; Wang, B .; Yu, C .; Chu, X .; Zhao, K .; Li, R .; Lam, T.-W. (2012). „SOAP3: ultrarychlý nástroj pro paralelní zarovnání založený na GPU pro krátké čtení“. Bioinformatika. 28 (6): 878–879. doi:10.1093 / bioinformatika / bts061. ISSN 1367-4803. PMID 22285832.