Systém řízení toku bioinformatiky - Bioinformatics workflow management system
tento článek může obsahovat nerozlišující, nadměrnýnebo irelevantní příklady.Únor 2012) ( |
A systém řízení pracovního toku bioinformatiky je specializovaná forma systém řízení pracovního toku navržen speciálně pro sestavení a provedení řady výpočtových nebo datových manipulačních kroků, nebo Pracovní postup, které se týkají bioinformatika.
V současné době existuje mnoho různých systémů pracovního toku. Některé byly vyvinuty obecněji jako vědecké systémy pracovního toku pro použití vědci z mnoha různých oborů astronomie a věda o Zemi. Všechny tyto systémy jsou založeny na abstraktní reprezentaci toho, jak výpočet probíhá ve formě směrovaného grafu, kde každý uzel představuje úkol, který má být proveden, a hrany představují buď datový tok, nebo závislosti na provádění mezi různými úkoly. Každý systém obvykle poskytuje vizuální rozhraní, které uživateli umožňuje vytvářet a upravovat složité aplikace s malými nebo žádnými znalostmi programování.[1][2][3]
Příklady
V abecedním pořadí zahrnují některé příklady systémů řízení pracovního toku bioinformatiky:
- Anduril bioinformatika a obrazová analýza[4][5]
- BioBIKE: webová, programovatelná, integrovaná biologická znalostní báze[6]
- CLC bio, platforma pro bioinformatickou analýzu a správu pracovních toků z QIAGEN Digital Insights.
- Klínové písmo: Funkční jazyk pracovního toku pro rozsáhlou analýzu dat[7]
- Discovery Net: jeden z prvních příkladů systému vědeckého pracovního toku, později komercializovaného jako InforSense, který poté získal IDBS.[Citace je zapotřebí ]
- Galaxie: původně zaměřeno na genomika[8]
- GeneVzorek: Výkonný systém vědeckého pracovního toku, který poskytuje přístup ke stovkám nástrojů genomické analýzy.[9]
- KNIME Konstanz Information Miner[10]
- Online HPC Návrhář pracovního postupu online založený na Taverna[Citace je zapotřebí ]
- UGENE poskytuje systém řízení pracovního toku, který je nainstalován na místním počítači[11]
- VisTrails[12]
Porovnání systémů pracovních toků
Díky velkému počtu bioinformatických systémů pracovního toku, ze kterých si můžete vybrat,[13] je obtížné pochopit a porovnat vlastnosti různých systémů pracovního toku. Při hodnocení a porovnávání systémů z pohledu bioinformatiků bylo provedeno málo práce, zejména pokud jde o srovnání datových typů, se kterými se mohou vypořádat, vestavěné funkce poskytované uživateli nebo dokonce jejich výkon nebo použitelnost. Mezi příklady stávajících srovnání patří:
- Článek „Vědecké systémy pracovního toku - může jedna velikost vyhovovat všem?“,[3] který poskytuje rámec na vysoké úrovni pro porovnání systémů pracovních toků na základě jejich řídicích toků a vlastností toku dat. Porovnávané systémy zahrnují Discovery Net, Taverna, Triana, Kepler stejně jako Yawl a BPEL.
- Papír „Meta-pracovní toky: interoperabilita mezi Galaxy a Tavernou na základě vzorů“[14] což poskytuje více uživatelsky orientované srovnání mezi Taverna a Galaxie v kontextu umožnění interoperability mezi oběma systémy.
- Dokument o infrastruktuře „Poskytování infrastruktury IKT pro biomedicínský výzkum“[15] porovnává dva systémy pracovního toku, Anduril a Chipster,[16] pokud jde o požadavky na infrastrukturu v modelu cloudového doručování.
- Článek „Přehled bioinformatických rámců potrubí“[17] pokusí se klasifikovat systémy pro správu pracovních toků na základě tří dimenzí: „použití implicitní nebo explicitní syntaxe, použití konfiguračního, konvenčního nebo třídního paradigmatu návrhu a nabídka rozhraní příkazového řádku nebo pracovního stolu“.
Reference
- ^ Oinn, T .; Greenwood, M .; Addis, M .; Alpdemir, M. N .; Ferris, J .; Glover, K .; Goble, C.; Goderis, A .; Hull, D .; Marvin, D .; Li, P .; Lord, P .; Pocock, M. R.; Senger, M .; Stevens, R .; Wipat, A .; Wroe, C. (2006). „Taverna: Lessons in creating a workflow environment for the life sciences“ (PDF). Souběžnost a výpočet: Praxe a zkušenosti. 18 (10): 1067–1100. doi:10,1002 / cpe.993. S2CID 10219281.
- ^ Yu, J .; Buyya, R. (2005). "Taxonomie systémů vědeckého pracovního toku pro výpočetní síť". Záznam ACM SIGMOD. 34 (3): 44. CiteSeerX 10.1.1.63.3176. doi:10.1145/1084805.1084814. S2CID 538714.
- ^ A b Curcin, V .; Ghanem, M. (2008). Vědecké systémy pracovního toku - může jedna velikost vyhovovat všem?. 2008 Mezinárodní konference o biomedicínském inženýrství v Káhiře. s. 1–9. doi:10.1109 / CIBEC.2008.4786077. ISBN 978-1-4244-2694-2. S2CID 1885579.
- ^ „Web pracovního toku Anduril“.
- ^ Ovaska, Kristian; Laakso, Marko; Haapa-Paananen, Saija; Louhimo, Riku; Chen, Ping; Aittomäki, Viljami; Valo, Erkka; Núñez-Fontarnau, Javier; Rantanen, Ville (07.09.2010). „Rozsáhlý rámec integrace dat poskytuje komplexní pohled na multiformní glioblastom“. Genomová medicína. 2 (9): 65. doi:10,1186 / gm186. ISSN 1756-994X. PMC 3092116. PMID 20822536.
- ^ Elhai, J .; Taton, A .; Massar, J .; Myers, J. K .; Travers, M .; Casey, J .; Slupesky, M .; Shrager, J. (2009). „BioBIKE: Webová, programovatelná, integrovaná biologická znalostní báze“. Výzkum nukleových kyselin. 37 (Problém s webovým serverem): W28 – W32. doi:10.1093 / nar / gkp354. PMC 2703918. PMID 19433511.
- ^ Brandt, Jörgen; Bux, Marc N .; Leser, Ulf (2015). „Klínové písmo: funkční jazyk pro analýzu vědeckých dat ve velkém měřítku“ (PDF). Sborník z workshopů EDBT / ICDT. 1330: 17–26.
- ^ Goecks, J .; Nekrutenko, A .; Taylor, J .; Galaxy Team, T. (2010). „Galaxy: Komplexní přístup k podpoře dostupného, reprodukovatelného a transparentního výpočetního výzkumu v biologických vědách“. Genome Biology. 11 (8): R86. doi:10.1186 / gb-2010-11-8-r86. PMC 2945788. PMID 20738864.
- ^ Reich, Michael; et al. (2006). "GenePattern 2.0". Genetika přírody. 38 (1): 500–5001. doi:10.1038 / ng0506-500. PMID 16642009. S2CID 5503897.
- ^ Tiwari, Abhishek; Sekhar, Arvind K.T. (2007). "Rámec založený na pracovním toku pro informatiku v oblasti přírodních věd". Výpočetní biologie a chemie. 31 (5–6): 305–319. doi:10.1016 / j.compbiolchem.2007.08.009. PMID 17931570.
- ^ Okonechnikov, K; Golosova, O; Fursov, M; Ugene, Team (2012). „Unipro UGENE: Jednotná sada nástrojů pro bioinformatiku“. Bioinformatika. 28 (8): 1166–7. doi:10.1093 / bioinformatika / bts091. PMID 22368248.
- ^ Bavoil, L .; Callahan, S.P .; Crossno, P.J .; Freire, J .; Scheidegger, C.E .; Silva, C.T .; Vo, H.T. (2005). VisTrails: povolení interaktivních vícenásobných vizualizací. VIS 05. IEEE Visualization, 2005. str. 135–142. doi:10.1109 / VISUAL.2005.1532788. ISBN 978-0-7803-9462-9.
- ^ „Existující systémy pracovního toku“. Common Workflow Language wiki. Archivováno od původního dne 2019-10-17. Citováno 2019-10-17.
- ^ Abouelhoda, M .; Alaa, S .; Ghanem, M. (2010). "Meta-pracovní toky". Sborník z 1. mezinárodního semináře o přístupech pracovních postupů k nové vědě zaměřené na data - Wands '10. p. 1. doi:10.1145/1833398.1833400. ISBN 9781450301886. S2CID 17343728.
- ^ Nyrönen, TH; Laitinen, J; et al. (2012), Poskytování infrastruktury IKT pro biomedicínský výzkum, Proceedings of the WICSA / ECSA 2012 Companion Volume (WICSA / ECSA '12), ACM, pp. 37–44, doi:10.1145/2361999.2362006, ISBN 9781450315685, S2CID 18199745
- ^ Kallio, M. A .; Tuimala, J. T .; Hupponen, T; Klemelä, P; Gentile, M; Scheinin, I; Koski, M; Käki, J; Korpelainen, E. I. (2011). „Chipster: Uživatelsky přívětivý analytický software pro microarray a další vysoce výkonná data“. BMC Genomics. 12: 507. doi:10.1186/1471-2164-12-507. PMC 3215701. PMID 21999641.
- ^ Leipzig J (2016). „Přehled bioinformatických rámců potrubí“. Briefings in Bioinformatics. 18 (3): 530–536. doi:10.1093 / bib / bbw020. PMC 5429012. PMID 27013646. Citováno 23. března 2016.