Biovodič - Bioconductor - Wikipedia
Stabilní uvolnění | 3. 12. / 28. října 2020 |
---|---|
Operační systém | Linux, Operační Systém Mac, Okna |
Plošina | Programovací jazyk R. |
Typ | Bioinformatika |
Licence | Umělecká licence 2.0 |
webová stránka | www |
Biovodič je volný, uvolnit, otevřený zdroj a otevřený vývoj softwarový projekt pro analýzu a porozumění genomický data generovaná mokrá laboratoř experimenty v molekulární biologie.
Bioconductor je založen především na statistický Programovací jazyk R., ale obsahuje příspěvky v jiných programovacích jazycích. Má dva zprávy každý rok, který následuje po půlročních vydáních R. V každém okamžiku existuje a vydání verze, což odpovídá vydané verzi R, a vývojová verze, což odpovídá vývojové verzi R. Většina uživatelů najde verzi vydání vhodnou pro jejich potřeby. Kromě toho existuje mnoho anotace genomu dostupné balíčky, které jsou hlavně, ale nikoli výhradně, zaměřeny na různé typy mikročipy.
Zatímco se pro interpretaci biologických dat stále vyvíjejí výpočetní metody, projekt Bioconductor je softwarovým úložištěm s otevřeným zdrojovým kódem, který hostí širokou škálu statistických nástrojů vyvinutých v programovacím prostředí R. S využitím bohatého spektra statistických a grafických funkcí v R bylo vyvinuto mnoho balíků Bioconductor, které splňují různé potřeby analýzy dat. Použití těchto balíčků poskytuje základní pochopení programovacího / příkazového jazyka R. Výsledkem je, že balíčky R a Bioconductor, které mají silné výpočetní pozadí, používá většina biologů, kteří budou těžit z jejich schopnosti analyzovat datové sady. Všechny tyto výsledky poskytují biologům snadný přístup k analýze genomových dat bez nutnosti programování odbornost.
Projekt byl zahájen na podzim roku 2001 a je pod dohledem základního týmu Bioconductor, který je založen především na Fred Hutchinson Cancer Research Center, přičemž další členové pocházejí z mezinárodních institucí.
Balíčky
Většina komponent Bioconductor je distribuována jako Balíčky R., což jsou přídavné moduly pro R. Zpočátku se většina softwarových balíčků Bioconductor zaměřovala na analýzu jednoho kanálu Affymetrix a dva nebo více kanálů cDNA /Oligo mikročipy. Jak projekt dozrával, rozšířil se funkční rozsah softwarových balíčků tak, aby zahrnoval analýzu všech typů genomových dat, jako je SAGE, sekvence nebo SNP data.
Cíle
Hlavními cíli projektů jsou:
- Poskytují rozšířený přístup k široké škále výkonných statistický a grafický metody pro analýzu genomových dat.
- Usnadnit začlenění biologická metadata při analýze genomových dat, např. literární údaje z PubMed, anotační data od LocusLink / Entrez.
- Zajistěte společné softwarová platforma který umožňuje rychlé rozvoj a rozvinutí z možnost připojení, škálovatelné, a interoperabilní software.
- Další vědecké poznání produkcí vysoké kvality dokumentace a reprodukovatelný výzkum.
- Vyškolit výzkumné pracovníky v oblasti výpočetních a statistických metod pro analýzu genomových dat.
Hlavní rysy
- Dokumentace a reprodukovatelný výzkum. Každý balíček Bioconductor obsahuje alespoň jednu vinětu, což je dokument, který poskytuje textový popis úkolů zaměřený na úkoly. Tyto dálniční známky mají několik podob. Mnohé jsou jednoduché “Jak „Jsou navrženy tak, aby demonstrovaly, jak lze konkrétního úkolu dosáhnout pomocí softwaru daného balíčku. Jiné poskytují podrobnější přehled o balíčku nebo mohou dokonce diskutovat o obecných problémech souvisejících s tímto balíčkem. V budoucnu se projekt Bioconductor snaží zajistit viněty, které nejsou konkrétně spojeny s balíčkem, ale spíše ukazují složitější koncepty. Stejně jako u všech aspektů projektu Bioconductor jsou uživatelé vyzváni k účasti na tomto úsilí.
- Statistické a grafické metody. Projekt Bioconductor si klade za cíl poskytnout přístup k široké škále výkonných statistických a grafických metod pro analýzu genomových dat. Balíčky pro analýzu jsou k dispozici pro: předběžné zpracování Affymetrix a Illumina, cDNA data pole; identifikace odlišně exprimované geny; teoretické analýzy grafů; vykreslování genomových dat. Samotný balíkový systém R navíc poskytuje implementace pro širokou škálu nejmodernějších technologií statistický a grafický techniky, včetně lineární a nelineární modelování, shluková analýza, předpověď, převzorkování, analýza přežití, a časové řady analýza.
- Anotace genomu. Projekt Bioconductor poskytuje software pro přidružení microarray a dalších genomických dat v reálném čase k biologickým metadatům z webových databází, jako jsou GenBank, LocusLink a PubMed (anotovat balíček). K dispozici jsou také funkce pro začlenění výsledků statistické analýzy do zpráv HTML s odkazy na anotační zdroje WWW. K dispozici jsou softwarové nástroje pro sestavování a zpracování dat genomických anotací z databází, jako jsou GenBank, Konsorcium pro genovou ontologii, LocusLink, UniGene, Projekt lidského genomu UCSC a další s balíčkem AnnotationDbi. Datové balíčky jsou distribuovány tak, aby poskytovaly mapování mezi různými identifikátory sond (např. Affy ID, LocusLink, PubMed ). Lze také sestavit přizpůsobené knihovny anotací.
- Otevřený zdroj. Projekt Bioconductor má závazek k plné disciplíně otevřeného zdroje s distribucí prostřednictvím SourceForge.net - jako platforma. Očekává se, že všechny příspěvky budou existovat pod open source licence jako Umělecké 2.0, GPL2 nebo BSD. Existuje mnoho různých důvodů, proč je software s otevřeným zdrojovým kódem prospěšný pro analýzu dat microarray a pro výpočetní biologii obecně. Mezi důvody patří:
- Poskytnout plný přístup k algoritmy a jejich implementace
- Usnadnit vylepšení softwaru prostřednictvím oprava chyby a zásuvné moduly
- K povzbuzení dobrého vědecké výpočty a statistická praxe poskytnutím vhodných nástrojů a pokynů
- Poskytnout a pracovní stůl nástrojů které vědcům umožňují prozkoumat a rozšířit metody používané k analýze biologických dat
- Zajistit, aby mezinárodní vědecká společnost je vlastníkem softwarové nástroje potřebné k provedení výzkumu
- Vedení a podpora komerční podpory a rozvoje těch nástrojů, které jsou úspěšné
- Povýšit reprodukovatelný výzkum poskytnutím otevřených a přístupných nástrojů, pomocí nichž je možné tento výzkum provádět (reprodukovatelný výzkum se liší od nezávislého ověřování)
- Otevřený vývoj. Uživatelé se doporučuje stát se vývojáři, a to buď přispěním balíčků nebo dokumentace kompatibilní s Bioconductor. Bioconductor dále poskytuje mechanismus pro propojení různých skupin s společné cíle podporovat spolupráce na softwaru, možná na úrovni sdíleného vývoje.
Milníky
Každé vydání Bioconductor je vyvinuto tak, aby co nejlépe fungovalo s vybranou verzí R.[1] Kromě oprav chyb a aktualizací nové vydání obvykle přidává balíčky. Tabulka níže mapuje vydání Bioconductor na verzi R a ukazuje počet dostupných softwarových balíčků Bioconductor pro toto vydání.
Verze | Datum vydání | Počet balíků | Závislost R. |
---|---|---|---|
3.12 | 28. října 2020 | 1974 | R 4,0 |
3.11 | 28. dubna 2020 | 1903 | R 4,0 |
3.10 | 30. října 2019 | 1823 | R 3.6 |
3.8 | 31. října 2018 | 1649 | R 3,5 |
3.6 | 31. října 2017 | 1473 | R 3.4 |
3.4 | 18. října 2016 | 1296 | R 3.3 |
3.2 | 14. října 2015 | 1104 | R 3.2 |
3.0 | 14. října 2014 | 934 | R 3.1 |
2.13 | 15. října 2013 | 749 | R 3.0 |
2.11 | 3. října 2012 | 610 | R 2,15 |
2.9 | 1. listopadu 2011 | 517 | R 2,14 |
2.8 | 14.dubna 2011 | 466 | R 2.13 |
2.7 | 18. listopadu 2010 | 418 | R 2.12 |
2.6 | 23. dubna 2010 | 389 | R 2.11 |
2.5 | 28. října 2009 | 352 | R 2.10 |
2.4 | 21. dubna 2009 | 320 | R 2.9 |
2.3 | 22. října 2008 | 294 | R 2.8 |
2.2 | 1. května 2008 | 260 | R 2.7 |
2.1 | 8. října 2007 | 233 | R 2.6 |
2.0 | 26. dubna 2007 | 214 | R 2.5 |
1.9 | 4. října 2006 | 188 | R 2.4 |
1.8 | 27.dubna 2006 | 172 | R 2.3 |
1.7 | 14. října 2005 | 141 | R 2.2 |
1.6 | 18. května 2005 | 123 | R 2.1 |
1.5 | 25. října 2004 | 100 | R 2.0 |
1.4 | 17. května 2004 | 81 | R 1,9 |
1.3 | 30. října 2003 | 49 | R 1.8 |
1.2 | 29. května 2003 | 30 | R 1.7 |
1.1 | 19. října 2002 | 20 | R 1.6 |
1.0 | 1. května 2002 | 15 | R 1,5 |
Zdroje
- Gentleman, R .; Carey, V .; Huber, W .; Irizarry, R .; Dudoit, S. (2005). Řešení pro bioinformatiku a výpočetní biologii pomocí R a Bioconductor. Springer. ISBN 978-0-387-25146-2.
- Gentleman, R. (2008). R Programování pro bioinformatiku. Chapman & Hall / CRC. ISBN 978-1-4200-6367-7.
- Hahne, F .; Huber, W .; Gentleman, R .; Falcon, S. (2008). Případové studie z biovodiče. Springer. ISBN 978-0-387-77239-4.
- Gentleman, Robert C.; Carey, Vincent J .; Bates, Douglas M .; Bolstad, Ben; Dettling, Marcel; Dudoit, Sandrine; Ellis, Byron; Gautier, Laurent; Ge, Yongchao; Gentry, Jeff; Hornik, Kurt; Hothorn, Torsten; Huber, Wolfgang; Iacus, Stefano; Irizarry, Rafael; Leisch, Friedrich; Li, Cheng; Maechler, Martin; Rossini, Anthony J .; Sawitzki, Gunther; Smith, Colin; Smyth, Gordon; Tierney, Luke; Yang, Jean Y. H.; Zhang, Jianhua (2004). "Bioconductor: otevřený vývoj softwaru pro výpočetní biologii a bioinformatiku". Genome Biology. 5 (10): R80. doi:10.1186 / gb-2004-5-10-r80. PMC 545600. PMID 15461798.
Viz také
- Výpočetní biologie
- Bioinformatika
- Seznam open source bioinformatického softwaru
- Seznam softwaru pro zarovnání sekvence
- R (programovací jazyk)
- DNA microarray
- Affymetrix, technologická platforma microarray
Reference
- ^ „Bioconductor - oznámení o vydání“. bioconductor.org. Biovodič. Citováno 28. května 2019.
externí odkazy
- Oficiální webové stránky
- Projekt R GNU R je programovací jazyk pro statistické výpočty.
- Uvolňování biovodičů
- Komunita Debian GNU / Linux distribuce usiluje o automatizované vytváření balíčků BioConductor pro jejich distribuci. BioKnoppix a Quantian jsou projekty rozšiřující Knoppix které přispěly bootovatelnou Debian GNU / Linux CD poskytující instalace BioConductor.