Biokurace - Biocuration
![](http://upload.wikimedia.org/wikipedia/commons/thumb/b/be/Pubmed_biocuration_2020-09-23.png/339px-Pubmed_biocuration_2020-09-23.png)
Biokurace je obor humanitní vědy výzkum zaměřený na překlad a integraci biomedicínských znalostí z vědeckých článků do interoperabilních databází.[1][2] Biokurz biomedicínských znalostí umožňuje spolupráce biokurátorů, vývojáři softwaru a bioinformatici.[1]
Biokurace jako profese
A biokurátor je profesionál vědec SZO kurátoři, shromažďuje, anotuje a ověřuje informace, které šíří biologický a modelové databáze organismů.[3][4] Jedná se o nové povolání, s první zmínkou ve vědecké literatuře z roku 2006.[5][6] Role biokurátoru zahrnuje kontrolu kvality údajů primárního biologického výzkumu určených pro publikaci, extrakci a organizaci dat z původní vědecké literatury a popis údajů standardem anotace protokoly a slovníky, které umožňují výkonné dotazy a biologická databáze interoperabilita. Biokurátoři komunikují s výzkumnými pracovníky, aby zajistili přesnost správných informací a podpořili výměnu dat s výzkumnými laboratořemi.[6]
V roce 2011 byla biokurace uznána jako profese, ale neexistovaly žádné formální studijní kurzy, které by cíleně připravovaly kurátory na biologická data.[7] S růstem pole se University of Cambrigdge a EMBL-EBI začal společně nabízet postgraduální certifikát v biokuraci,[8] považováno za krok k uznání biokurace jako disciplíny samo o sobě.[9]
Kurátorství a anotace
Biocuration je integrace biologických informací do on-line databází sémanticky standardizovaným způsobem s použitím vhodných jedinečných sledovatelných identifikátorů a poskytnutím nezbytných metadat včetně zdroje a původu.
Ontologie, řízené slovníky a standardní názvy
Biokurátoři běžně zaměstnávají a podílejí se na tvorbě a vývoji sdílené biomedicíny ontologie: strukturované, řízené slovníky , které zahrnují mnoho domén biologických a lékařských znalostí, jako je Otevřené biomedicínské ontologie. Mezi tyto domény patří genomika a proteomika, anatomie, zvířat a rostlin rozvoj, biochemie, metabolické cesty, taxonomická klasifikace a mutant fenotypy. Vzhledem k rozmanitosti existujících ontologií existují pokyny, které výzkumníky orientují na to, jak vybrat vhodnou.[10]
The Jednotný systém lékařských jazyků je jeden takový systém, který integruje a distribuuje miliony termínů používaných v oblasti biologických věd.[11]
Biokurátoři prosazují důsledné používání genová nomenklatura pokyny a účastnit se různých výborů pro genetickou nomenklaturu modelové organismy, často ve spolupráci s HUGO Výbor pro genovou nomenklaturu (HGNC ). Rovněž prosazují další pokyny pro nomenklaturu, jako jsou pokyny poskytnuté Výborem pro nomenklaturu Mezinárodní unie pro biochemii a molekulární biologii (IUBMB), jedním z příkladů je Enzymová komise EC číslo.
Obecněji řečeno, použití trvalé identifikátory je chválen komunitou, takže ke zlepšení srozumitelnosti a usnadnění znalostí [12]
Anotace entity
v anotace genomu například identifikátory definované ontology a konsorcii se používají k popisu částí genomu. Například genová ontologie (GO) kurátoruje výrazy pro biologické procesy, které se používají k popisu toho, co víme o konkrétních geny.
![](http://upload.wikimedia.org/wikipedia/commons/thumb/f/fd/Scilite.jpg/255px-Scilite.jpg)
Textová anotace
Kromě anotování biologických sekvencí biokurátoři také anotují texty a spojují slova s jedinečnými identifikátory. To pomáhá při nejednoznačnosti, objasnění zamýšleného významu a zajištění textů zpracovatelných pomocí počítačů. Jednou z aplikací anotace textu je určit přesný gen, na který vědec odkazuje.[13]
Veřejně dostupné textové anotace umožňují biologům využívat další výhody biomedicínského textu. The Evropa PMC má Rozhraní pro programování aplikací který centralizuje textové anotace z různých zdrojů a zpřístupňuje je v a Grafické uživatelské rozhraní s názvem SciLite.[14] PubTator Central také poskytuje poznámky, ale je plně založen na počítačové těžbě textu a neposkytuje uživatelské rozhraní.[15]
Existují také programy, které uživatelům umožňují ručně anotovat biomedicínské texty, které je zajímají, například systém ezTag.[16]
International Society for Biocuration (ISB)
The International Society for Biocuration (ISB) je nezisková organizace „propaguje oblast biokurace a poskytuje fórum pro výměnu informací prostřednictvím setkání a workshopů.“ Vyrostl z mezinárodních konferencí o biocuraci a byl založen počátkem roku 2009.[4]
ISB nabízí Cena za biokurzní kariéru biokurátorům v komunitě: Cena Biocurator Career Award (uděluje se každoročně) a Cena ISB za výjimečné příspěvky k biocuraci (uděluje se dvakrát ročně).
Wikimedia
Wikipedia
Mezi prací biokurátorů a Wikipedia, s hranicemi mezi vědeckými databáze a Wikipedia se stále více rozmazává.[17][18][19] Databáze jako Rfam[20][21] a Proteinová datová banka[22] například intenzivně využívají Wikipedii a její editory ke správě informací.[23][24] Většina databází však nabízí vysoce strukturovaná data, která lze prohledávat v komplexních kombinacích, což však na Wikipedii obvykle není možné Wikidata si klade za cíl do jisté míry tento problém vyřešit.
The Gene Wiki projekt využíval Wikipedii ke společné léčbě tisíců genů a genových produktů, jako je titin a inzulín.[25]
Wikidata
Databáze znalostí Wikimedia Wikidata je stále více využívána komunitou pro biokuraci jako integrační úložiště napříč vědami o životě.[26] Například to bylo používáno Gene Wiki projekt pro výběr informací o geny.[27]
Kurátorství komunity
Tradičně byla biokurace prováděna specializovanými odborníky, kteří integrují data do databází. Kurátorství Společenství se ukázalo jako slibný přístup ke zlepšení šíření znalostí ze zveřejněných údajů a poskytnutí nákladově efektivního způsobu, jak zlepšit škálovatelnost biokurace.
Biologické databáze
Několik biologických databází do určité míry zahrnuje příspěvky autorů do jejich strategie funkční kurace, která se může pohybovat od asociace identifikátorů genů s publikacemi nebo volným textem, až po strukturovanější a podrobnější anotace sekvencí a funkčních dat, výstup kurace podle stejných standardů jako profesionální biokurátory . Většina komunitního kurátora na Modelové databáze organizmů zahrnuje anotaci původních autorů publikovaného výzkumu (anotace prvního průchodu) k efektivnímu získání přesných identifikátorů pro objekty, které mají být kurátorovány, nebo identifikaci datových typů pro podrobnou kuraci. Například:
- WormBase úspěšně získává od uživatelů anotace prvního průchodu a má integrovanou autorskou kuraci s procesem mikropublikace.[29] WormBase také integruje těžbu textu do své platformy a poskytuje návrhy kurátorům komunity.[28]
- FlyBase zasílá e-mailové požadavky autorům nových publikací,[30] vyzval je, aby vypsali geny a datové typy popsané pomocí online nástroje, a také mobilizoval komunitu, aby psala odstavce se shrnutím genů.[31]
Jiné databáze, jako např PomBase se spoléhají na autory publikací, že pro své publikace předloží vysoce podrobné anotace založené na ontologii a meta-data spojená s datovými soubory v celém genomu pomocí řízených slovníků. Webový nástroj Zpěv;[32] byl vyvinut s cílem usnadnit zasílání komunit. Vzhledem k tomu, že Canto je volně dostupné, obecné a vysoce konfigurovatelné, bylo přijato jinými projekty.[33] Kurátorství podléhá kontrole profesionálních kurátorů, což vede k vysoce kvalitní hloubkové kuraci všech typů molekulárních dat.[34]
Prostředky ve stylu wiki
Biowiki se při poskytování obsahu spoléhají na své komunity. Autor Odměna,[35] například je rozšířením MediaWiki, které kvantifikuje příspěvky výzkumných pracovníků na biowiki. RiceWiki byl příkladem databáze založené na wiki pro komunitní kurátorství vybavených genů rýže Autor Odměna.[36][37]
Jeden pozoruhodný příklad je WikiProteiny / WikiProfessional, projekt sémanticky organizovat biologická data vedený Barend Mons.[38][39] Projekt z roku 2007 měl přímé příspěvky od Jimmy Wales, Spoluzakladatel Wikipedie, a vzal Wikidata jako inspirace.[38] Další je WikiPathways, o kterém se shromažďují informace biologické cesty.[40]
Gamifikované zdroje
Přístup k zapojení davu do biokurze je prostřednictvím gamifikovaných platforem, které používají herní design zásady pro posílení zapojení. Několik příkladů:
- Mark2Cure, gamifikovaná platforma pro komunitní kurátorství biomedicínských abstraktů[41][42][43]
- Cochrane Crowd,[44] platforma od Cochrane pro vyléčení klinické testy a kategorizovat a shrnout biomedicínskou literaturu.[45]
Výpočetní těžba textu pro kuraci
Zpracování v přirozeném jazyce a dolování textu technologie mohou pomoci biokurátorům získat informace pro ruční ošetření.[46] Těžba textu může škálovat úsilí o kurátorství, například podporovat identifikaci genových jmen, stejně jako částečně odvodit ontologie.[47] Těžba textů biomedicínských konceptů čelí výzvám týkajícím se variací v podávání zpráv a komunita pracuje na zvýšení strojové čitelnosti článků.[48]
Populární NLP krajta balík SpaCy má modifikaci pro biomedicínské texty, SciSpaCy, kterou udržuje Allenův institut pro AI.[49]
Mezi výzvy těžby textu aplikované na biokuraci patří obtížnost přístupu k plným textům biomedicínských článků z důvodu placení stěny, která spojuje výzvy biocurace s výzvami pohyb s otevřeným přístupem.[50]
Doplňkový přístup k biocuraci prostřednictvím dolování textu zahrnuje použití optické rozpoznávání znaků k biomedicínským obrázkům ve spojení s automatickými anotačními algoritmy. To bylo použito k extrakci genové informace z cesta čísla, například.[51]
Biokreativní výzvy
Rozhraní mezi těžbou textu a biocurací bylo poháněno BioKREATIVITA (Critical Assessment of Information Extraction systems in Biology) Challenge, a series of text-mining campaigns which were Poprvé v roce 2004.[52]
Viz také
Reference
- ^ A b „Co je to biocurace? | International Society for Biocuration“. www.biocuration.org. Citováno 2020-09-06.
- ^ Howe D, Costanzo M, Fey P, Gojobori T, Hannick L, Hide W a kol. (Září 2008). „Big data: The future of biocuration“. Příroda. 455 (7209): 47–50. Bibcode:2008Natur.455 ... 47H. doi:10.1038 / 455047a. PMC 2819144. PMID 18769432.
- ^ Burge S, Attwood TK, Bateman A, Berardini TZ, Cherry M, O'Donovan C a kol. (2012-03-20). „Biokurátory a biokurace: průzkum výzev 21. století“. Databáze. 2012: bar059. doi:10.1093 / databáze / bar059. PMC 3308150. PMID 22434828.
- ^ A b Bateman A (duben 2010). „Kurátoři světa se sjednocují: International Society of Biocuration“. Bioinformatika. 26 (8): 991. doi:10.1093 / bioinformatika / btq101. PMID 20305270.
- ^ Bourne PE, McEntyre J (říjen 2006). „Biokurátoři: přispěvatelé do světa vědy“. PLOS výpočetní biologie. 2 (10): e142. Bibcode:2006PLSCB ... 2..142B. doi:10.1371 / journal.pcbi.0020142. PMC 1626157. PMID 17411327.
- ^ A b Salimi N, Vita R (říjen 2006). „Biokurátor: propojování a zlepšování vědeckých údajů“. PLOS výpočetní biologie. 2 (10): e125. Bibcode:2006PLSCB ... 2..125S. doi:10.1371 / journal.pcbi.0020125. PMC 1626147. PMID 17069454.
- ^ Sanderson, Katharine (únor 2011). „Bioinformatika: Generace léčení“. Příroda. 470 (7333): 295–296. doi:10.1038 / nj7333-295a. ISSN 1476-4687. PMID 21348148.
- ^ Anonymní (2019-10-30). „Postgraduální certifikát v biokuraci“. www.ice.cam.ac.uk. Citováno 2020-10-06.
- ^ Tang YA, Pichler K, Füllgrabe A, Lomax J, Malone J, Munoz-Torres MC a kol. (Květen 2019). „Deset rychlých tipů pro biokuraci“. PLOS výpočetní biologie. 15 (5): e1006906. Bibcode:2019PLSCB..15E6906T. doi:10.1371 / journal.pcbi.1006906. PMC 6497217. PMID 31048830.
- ^ Malone J, Stevens R, Jupp S, Hancocks T, Parkinson H, Brooksbank C (únor 2016). „Deset jednoduchých pravidel pro výběr biotologie“. PLOS výpočetní biologie. 12 (2): e1004743. Bibcode:2016PLSCB..12E4743M. doi:10.1371 / journal.pcbi.1004743. PMC 4750991. PMID 26867217.
- ^ Bodenreider O (leden 2004). „Unified Medical Language System (UMLS): integrating biomedical terminology“. Výzkum nukleových kyselin. 32 (Problém s databází): D267-70. doi:10.1093 / nar / gkh061. PMC 308795. PMID 14681409.
- ^ McMurry JA, Juty N, Blomberg N, Burdett T, Conlin T, Conte N a kol. (Červen 2017). „Identifikátory pro 21. století: Jak navrhovat, zajišťovat a opakovaně používat trvalé identifikátory, aby se maximalizovala užitečnost a dopad dat z biologických věd“. PLOS Biology. 15 (6): e2001414. doi:10.1371 / journal.pbio.2001414. PMC 5490878. PMID 28662064.
- ^ Mons B (červen 2005). „Který gen jste měl na mysli?“. BMC bioinformatika. 6 (1): 142. doi:10.1186/1471-2105-6-142. PMC 1173089. PMID 15941477.
- ^ Venkatesan A, Kim JH, Talo F, Ide-Smith M, Gobeill J, Carter J a kol. (12.12.2016). „SciLite: platforma pro zobrazování textových poznámek jako prostředku k propojení článků výzkumu s biologickými daty“. Vítejte v otevřeném výzkumu. 1: 25. doi:10.12688 / wellcomeopenres.10210.1. PMC 5527546. PMID 28948232.
- ^ Wei CH, Allot A, Leaman R, Lu Z (červenec 2019). „PubTator central: automated concept annotation for biomedical full text articles“. Výzkum nukleových kyselin. 47 (W1): W587 – W593. doi:10.1093 / nar / gkz389. PMC 6602571. PMID 31114887.
- ^ Kwon D, Kim S, Wei CH, Leaman R, Lu Z (červenec 2018). „ezTag: označování biomedicínských konceptů prostřednictvím interaktivního učení“. Výzkum nukleových kyselin. 46 (W1): W523 – W529. doi:10.1093 / nar / gky428. PMC 6030907. PMID 29788413.
- ^ Wodak SJ, Mietchen D, Collings AM, Russell RB, Bourne PE (2012). „Tématické stránky: PLOS Computational Biology meets Wikipedia“. PLOS výpočetní biologie. 8 (3): e1002446. Bibcode:2012PLSCB ... 8E2446W. doi:10.1371 / journal.pcbi.1002446. PMC 3315447. PMID 22479174.
- ^ Finn RD, Gardner PP, Bateman A (leden 2012). „Zpřístupnění databáze prostřednictvím Wikipedie: klady a zápory“. Výzkum nukleových kyselin. 40 (Problém s databází): D9-12. doi:10.1093 / nar / gkr1195. PMC 3245093. PMID 22144683.
- ^ Stránka RD (březen 2011). „Propojení NCBI s Wikipedií: přístup založený na wiki“. PLOS proudy. 3: RRN1228. doi:10,1371 / proudy.RRN1228. PMC 3080707. PMID 21516242.
- ^ Gardner PP, Daub J, Tate J, Moore BL, Osuch IH, Griffiths-Jones S a kol. (Leden 2011). „Rfam: Wikipedia, klany a„ desetinné “vydání“. Výzkum nukleových kyselin. 39 (Problém s databází): D141-5. doi:10.1093 / nar / gkq1129. PMC 3013711. PMID 21062808.
- ^ Daub J, Gardner PP, Tate J, Ramsköld D, Manske M Scott WG a kol. (Prosinec 2008). „RNA WikiProject: komunitní anotace rodin RNA“. RNA. 14 (12): 2462–4. doi:10.1261 / rna.1200508. PMC 2590952. PMID 18945806.
- ^ Burkhardt K, Schneider B, Ory J (říjen 2006). „Perspektiva biokurátoru: anotace ve Výzkumné spolupráci pro proteinovou banku strukturní bioinformatiky“. PLOS výpočetní biologie. 2 (10): e99. Bibcode:2006PLSCB ... 2 ... 99B. doi:10,1371 / journal.pcbi.0020099. PMC 1626146. PMID 17069453.
- ^ Logan DW, Sandal M, Gardner PP, Manske M, Bateman A (Září 2010). „Deset jednoduchých pravidel pro úpravu Wikipedie“. PLOS výpočetní biologie. 6 (9): e1000941. Bibcode:2010PLSCB ... 6E0941L. doi:10.1371 / journal.pcbi.1000941. PMC 2947980. PMID 20941386.
- ^ Butler D (2008). "Publikovat na Wikipedii nebo zahynout: Časopis vyžadovat, aby autoři zveřejňovali příspěvky v encyklopedii online zdarma". Příroda. doi:10.1038 / novinky.2008.1312.
- ^ Huss JW, Lindenbaum P, Martone M, Roberts D, Pizarro A, Valafar F a kol. (Leden 2010). „Gene Wiki: komunitní inteligence aplikovaná na anotaci lidských genů“. Výzkum nukleových kyselin. 38 (Problém s databází): D633-9. doi:10.1093 / nar / gkp760. PMC 2808918. PMID 19755503.
- ^ Waagmeester A, Stupp G, Burgstaller-Muehlbacher S, Good BM, Griffith M, Griffith OL a kol. (Březen 2020). Rodgers P, Mungall C (eds.). „Wikidata jako graf znalostí pro vědy o živé přírodě“. eLife. 9: e52614. doi:10,7554 / eLife.52614. PMC 7077981. PMID 32180547. S2CID 212739087.
- ^ Burgstaller-Muehlbacher S, Waagmeester A, Mitraka E, Turner J, Putman T, Leong J a kol. (2016). „Wikidata jako sémantický rámec pro iniciativu Gene Wiki“. Databáze. 2016: baw015. doi:10.1093 / databáze / baw015. PMC 4795929. PMID 26989148.
- ^ A b Arnaboldi V, Raciti D, Van Auken K, Chan JN, Müller HM, Sternberg PW (leden 2020). „Těžba textu se setkává s kurátorstvím komunity: nově navržená kurátorská platforma pro zlepšení zkušeností autorů a účasti na WormBase“. Databáze. 2020. doi:10.1093 / databáze / baaa006. PMC 7078066. PMID 32185395. S2CID 212750405.
- ^ Lee RY, Howe KL, Harris TW, Arnaboldi V, Cain S, Chan J a kol. (Leden 2018). „WormBase 2017: přecházení do nové fáze“. Výzkum nukleových kyselin. 46 (D1): D869 – D874. doi:10.1093 / nar / gkx998. PMC 5753391. PMID 29069413.
- ^ Bunt SM, Grumbling GB, Field HI, Marygold SJ, Brown NH, Millburn GH (2012). „Přímé zasílání e-mailů autorům nově publikovaných článků podporuje kurátorství komunity“. Databáze. 2012: bas024. doi:10.1093 / databáze / bas024. PMC 3342516. PMID 22554788.
- ^ Antonazzo G, Urbano JM, Marygold SJ, Millburn GH, Brown NH (leden 2020). „Budování kanálu k získávání odborných znalostí z komunity na podporu genové souhrnné léčby“. Databáze. 2020. doi:10.1093 / databáze / baz152. PMC 6971343. PMID 31960022.
- ^ Rutherford KM, Harris MA, Lock A, Oliver SG, Wood V (červen 2014). „Canto: online nástroj pro kurátorství komunitní literatury“. Bioinformatika. 30 (12): 1791–2. doi:10.1093 / bioinformatika / btu103. PMC 4058955. PMID 24574118.
- ^ "pombase / canto". PomBase. 25. září 2020.
- ^ Lock A, Harris MA, Rutherford K, Hayles J, Wood V (leden 2020). „Kurátorství komunity v PomBase: umožnění odborníkům na štěpné kvasinky poskytovat podrobné, standardizované a sdílené poznámky z výzkumných publikací“. Databáze. 2020. doi:10.1093 / databáze / baaa028. PMC 7192550. PMID 32353878.
- ^ Dai L, Tian M, Wu J, Xiao J, Wang X, Townsend JP, Zhang Z (červenec 2013). „AuthorReward: zvyšování kurátorství komunity v oblasti biologických znalostí prostřednictvím automatizované kvantifikace autorství“. Bioinformatika. 29 (14): 1837–9. doi:10.1093 / bioinformatika / btt284. PMC 3702255. PMID 23732274.
- ^ Zhang Z, Sang J, Ma L, Wu G, Wu H, Huang D a kol. (Leden 2014). „RiceWiki: databáze založená na wiki pro komunitní léčení genů rýže“. Výzkum nukleových kyselin. 42 (Problém s databází): D1222-8. doi:10.1093 / nar / gkt926. PMC 3964990. PMID 24136999.
- ^ "Os01g0883800 - RiceWiki". 20. 10. 2017. Archivovány od originál dne 2017-10-20. Citováno 2020-09-06.
- ^ A b Mons B, Ashburner M, Chichester C, van Mulligen E, Weeber M, den Dunnen J a kol. (2008-05-28). „Volání milionu myslí na anotaci komunity ve WikiProteins“. Genome Biology. 9 (5): R89. doi:10.1186 / gb-2008-9-5-r89. PMC 2441475. PMID 18507872.
- ^ Giles J (únor 2007). Msgstr "Klíčové biologické databáze. Příroda. 445 (7129): 691. Bibcode:2007 Natur.445..691G. doi:10.1038 / 445691a. PMID 17301755. S2CID 4410783.
- ^ „WikiPathways - WikiPathways“. www.wikipathways.org. Citováno 2020-10-14.
- ^ Tsueng G, Nanis SM, Fouquier J, Good BM, Su AI (2016-12-31). „Občanská věda pro těžbu biomedicínské literatury“. Občanská věda. 1 (2): 14. doi:10,5334 / cstp.56. PMC 6226017. PMID 30416754.
- ^ Tsueng G, Nanis M, Fouquier JT, Mayers M, Good BM, Su AI (únor 2020). "Aplikování občanské vědy na extrakci vztahů mezi geny, léky a chorobami z biomedicínských abstraktů". Bioinformatika. 36 (4): 1226–1233. doi:10.1093 / bioinformatika / btz678. PMID 31504205.
- ^ „Hrajte Mark2Cure, pomozte identifikovat klíčové pojmy v abstraktech biomedicínského výzkumu“. Občanské vědecké hry. Citováno 2020-09-06.
- ^ „Cochrane Crowd“. dav.cochrane.org. Citováno 2020-09-25.
- ^ Gartlehner G, Affengruber L, Titscher V, Noel-Storr A, Dooley G, Ballarini N, König F (květen 2020). „Jeden screeningový abstraktní screening vynechal 13 procent příslušných studií: davově založená, randomizovaná kontrolovaná studie“. Journal of Clinical Epidemiology. 121: 20–28. doi:10.1016 / j.jclinepi.2020.01.005. PMID 31972274.
- ^ Hirschman L, Burns GA, Krallinger M, Arighi C, Cohen KB, Valencia A, et al. (2012). „Text mining for the biocuration workflow“. Databáze. 2012: bas020. doi:10.1093 / databáze / bas020. PMC 3328793. PMID 22513129.
- ^ Winnenburg, R .; Wachter, T .; Plake, C .; Doms, A .; Schroeder, M. (11.7.2008). „Fakta z textu: může textová těžba pomoci rozšířit vysoce kvalitní ruční kuraci genových produktů pomocí ontologií?“. Briefings in Bioinformatics. 9 (6): 466–478. doi:10.1093 / bib / bbn043. ISSN 1467-5463. PMID 19060303.
- ^ Robert Leaman; Chih-Hsuan Wei; Alexis Allot; Zhiyong (1. června 2020), „Deset tipů pro článek připravený pro těžbu textu: Jak zlepšit automatickou zjistitelnost a interpretovatelnost“, PLOS Biology, 18 (6): e3000716, doi:10.1371 / JOURNAL.PBIO.3000716, ISSN 1544-9173, PMID 32479517, Wikidata Q96032351
- ^ Neumann M, král D, Beltagy I, Ammar W. (2019). „ScispaCy: Rychlé a robustní modely pro zpracování biomedicínského přirozeného jazyka“. Sborník 18. workshopu BioNLP a sdíleného úkolu. Florencie, Itálie: Sdružení pro počítačovou lingvistiku: 319–327. arXiv:1902.07669. doi:10.18653 / v1 / W19-5034. S2CID 67788603.
- ^ Altman RB, Bergman CM, Blake J, Blaschke C, Cohen A, Gannon F a kol. (2008). „Těžba textu pro biologii - cesta vpřed: názory předních vědců“. Genome Biology. 9 Suppl 2 (Suppl 2): S7. doi:10.1186 / gb-2008-9-s2-s7. PMC 2559991. PMID 18834498.
- ^ Hanspers, Kristina; Riutta, Anders; Summer-Kutmon, Martina; Pico, Alexander R. (09.11.2020). „Informace o dráze získané z 25 let údajů o dráze“. Genome Biology. 21 (1): 273. doi:10.1186 / S13059-020-02181-2. PMC 7649569. PMID 33168034.
- ^ Hirschman L, Yeh A, Blaschke C, Valencia A (2005). "Přehled BioCreAtIvE: kritické hodnocení extrakce informací pro biologii". BMC bioinformatika. 6 Suppl 1 (Suppl 1): S1. doi:10.1186 / 1471-2105-6-s1-s1. PMC 1869002. PMID 15960821. S2CID 5119495.