Informatika o biologické rozmanitosti - Biodiversity informatics - Wikipedia

Informatika o biologické rozmanitosti je aplikace informatika techniky informace o biologické rozmanitosti, jako taxonomie, biogeografie nebo ekologie. Moderní počítačové techniky mohou přinést nové způsoby prohlížení a analýzy stávajících informací a předvídání budoucích situací (viz modelování výklenků ). Informatika o biologické rozmanitosti je pojem, který byl vytvořen až kolem roku 1992, ale s rychle rostoucími soubory dat se stal užitečným v mnoha studiích a aplikacích, jako je konstrukce taxonomické databáze nebo geografické informační systémy. Informatika o biologické rozmanitosti kontrastuje s „bioinformatika ", který se často používá jako synonymum pro počítačové zpracování dat ve specializované oblasti molekulární biologie.

Přehled

Informatika o biologické rozmanitosti (odlišná, ale spojená s bioinformatikou) je aplikace metod informační technologie na problémy organizace, přístupu, vizualizace a analýzy údajů o primární biologické rozmanitosti. Údaje o primární biologické rozmanitosti se skládají ze jmen, pozorování a záznamů o exemplářích a genetických a morfologických údajů souvisejících se vzorkem. Informatika o biologické rozmanitosti se možná bude muset vyrovnat se správou informací z nepojmenovaných taxonů, jako jsou ty, které jsou získány vzorkováním prostředí a sekvenováním vzorků smíšeného pole. Termín informatika o biologické rozmanitosti se také používá k pokrytí výpočetní problémy specifické pro názvy biologických entit, jako je vývoj algoritmů pro řešení variantních reprezentací identifikátorů, jako jsou názvy druhů a autorit, a mnohočetná klasifikační schémata, ve kterých mohou tyto subjekty sídlit podle preferencí různých pracovníků v oboru, stejně jako syntaxe a sémantika, pomocí kterých lze obsah taxonomických databází učinit strojově dotazovatelným a interoperabilním pro účely informatiky biologické rozmanitosti ...

Historie oboru

Lze předpokládat, že informatika o biologické rozmanitosti začala s konstrukcí prvního počítačového systému taxonomické databáze počátkem 70. let a postupným vývojem nástrojů pro distribuované vyhledávání koncem 90. let, včetně Species Analyst z Kansas University, North American Biodiversity Information Network NABIN, CONABIO v Mexiku a dalších,[1] zřízení Globální informační zařízení o biologické rozmanitosti v roce 2001 a souběžný vývoj řady modelování výklenků a další nástroje pro práci s digitalizovanými údaji o biologické rozmanitosti od poloviny 80. let 20. století (viz např [2]). V září 2000 americký časopis Věda věnoval speciální číslo „Bioinformatice pro biologickou rozmanitost“,[3] časopis „Biodiversity Informatics“ byl vydán v roce 2004 a na několika mezinárodních konferencích do roku 2000 se sešli odborníci z oblasti Biodiversity Informatics, včetně Londýna e-biosféra konference v červnu 2009. Příloha časopisu BMC bioinformatika (Svazek 10 Suppl 14[4]) publikovaný v listopadu 2009 se také zabývá Informatikou o biologické rozmanitosti.

Historie pojmu

Podle korespondence reprodukované Walterem Berendsohnem,[5] termín „Informatika o biologické rozmanitosti“ vytvořil John Whiting v roce 1992, aby pokryl aktivity subjektu známého jako Kanadské konsorcium pro biologickou rozmanitost, skupina zabývající se fúzí základních biologická rozmanitost informace s ekonomika životního prostředí a geoprostorové informace ve formě GPS a GIS. Zdá se, že následně ztratil jakékoli povinné spojení se světem GPS / GIS a je spojen s počítačovým řízením jakýchkoli aspektů informací o biologické rozmanitosti (viz např. [6])

Digitální taxonomie (systematika)

Globální seznam všech druhů

Jedním z hlavních problémů informatiky biologické rozmanitosti v globálním měřítku je současná absence úplného hlavního seznamu v současné době uznávané druhy světa, i když je to cílem Katalog života projekt, který má ca. 1,65 milionu druhů z odhadovaných 1,9 milionu popsaných druhů Výroční kontrolní seznam za rok 2016. Podobné úsilí pro fosilní taxony, databáze paleobiologie[7] dokumentuje asi 100 000+ jmen fosilních druhů z neznámého celkového počtu.

Vědecké názvy rodů a druhů jako jedinečné identifikátory

Uplatňování Linné systém binomické nomenklatury pro druh a uninomials pro rody a vyšší pozice, vedlo k mnoha výhodám, ale také problémům s homonyma (stejný název se používá pro více taxonů, ať už neúmyslně nebo oprávněně ve více královstvích), synonyma (více jmen pro stejný taxon), stejně jako variantní reprezentace stejného jména kvůli ortografickým rozdílům, drobným pravopisným chybám, variacím ve způsobu citování jmen a dat autorů a další. Kromě toho se jména mohou časem měnit v důsledku měnících se taxonomických názorů (například správné druhové umístění druhu nebo povýšení poddruhu na hodnost druhu nebo naopak), a také se může měnit popis taxonu podle k taxonomickým konceptům různých autorů. Jedním z navrhovaných řešení tohoto problému je použití identifikátorů biologických věd (LSID ) pro účely komunikace stroj-stroj, ačkoli existují jak zastánci, tak odpůrci tohoto přístupu.

Konsenzuální klasifikace organismů

Organismy lze klasifikovat mnoha způsoby (viz hlavní stránka Biologická klasifikace ), které mohou vytvářet problémy v oblasti designu informačních systémů o biologické rozmanitosti, jejichž cílem je začlenit buď jednu nebo více klasifikací tak, aby vyhovovaly potřebám uživatelů, nebo je vést k jedinému „upřednostňovanému“ systému. To, zda lze někdy dosáhnout jednotného systému klasifikace konsensu, je pravděpodobně otevřená otázka, avšak Katalog života si v této oblasti objednal činnost[8] který byl následován publikovaným systémem navrženým v roce 2015 M. Ruggierem a spolupracovníky.[9]

Mobilizace informací o primární biologické rozmanitosti

Za „primární“ informace o biologické rozmanitosti lze považovat základní údaje o výskytu a rozmanitosti druhů (nebo dokonce jakýchkoli rozeznatelných taxonů), obvykle ve spojení s informacemi o jejich rozšíření v prostoru, čase nebo v obou. Tyto informace mohou mít formu zadržených vzorků a souvisejících informací, například shromážděných v přírodopisných sbírkách muzea a herbář, nebo jako observační záznamy, například z formálních faunálních nebo floristických průzkumů prováděných profesionálními biology a studenty, nebo jako amatérská a jiná plánovaná nebo neplánovaná pozorování, včetně těch, která stále více spadají do oblasti působnosti občanská věda. Poskytování online, koherentního digitálního přístupu k této rozsáhlé sbírce různorodých primárních dat je klíčovou funkcí Informatiky o biologické rozmanitosti, která je jádrem regionálních a globálních datových sítí o biologické rozmanitosti, přičemž příklady těchto sítí zahrnují OBIS a GBIF.

Jako sekundární zdroj údajů o biologické rozmanitosti je relevantní vědecká literatura mohou být analyzovány buď člověkem, nebo (potenciálně) specializovanými algoritmy vyhledávání informací, aby se extrahovaly relevantní informace o primární biologické rozmanitosti, které jsou v nich uvedeny, někdy v agregované / souhrnné formě, ale často jako primární pozorování v narativní nebo tabulkové formě. Prvky takové činnosti (například extrakce klíčových taxonomických identifikátorů, klíčové slovo / indexové pojmy atd.) se již mnoho let praktikuje na vyšší úrovni akademické databáze a vyhledávače. Pro maximální hodnotu Informovanosti o biologické rozmanitosti by však měla být data skutečného primárního výskytu v ideálním případě načtena a poté zpřístupněna ve standardizované formě nebo formách; například oba Plazi a INOTAXA projekty transformují taxonomickou literaturu na XML formáty, které pak mohou číst klientské aplikace, první používají TaxonX-XML a druhý pomocí formátu taXMLit. The Knihovna kulturního dědictví rovněž významně pokročila ve svém úsilí o digitalizaci podstatných částí taxonomické literatury bez autorských práv, která je poté podrobena OCR (optické rozpoznávání znaků), aby bylo možné je dále zpracovávat pomocí nástrojů Informatiky o biologické rozmanitosti.

Standardy a protokoly

Stejně jako u jiných oborů souvisejících s daty, má Biodiversity Informatics prospěch z přijetí vhodných standardy a protokoly za účelem podpory přenosu mezi stroji a interoperability informací v jeho konkrétní doméně. Mezi příklady příslušných norem patří Darwin Core XML schéma pro údaje o biologické rozmanitosti založené na vzorcích a pozorováních vyvinuté od roku 1998 a jejich rozšíření, Schéma přenosu taxonomické koncepce plus standardy pro Strukturovaná popisná data a Přístup k údajům o biologickém sběru (ABECEDA); zatímco protokoly pro načítání a přenos dat zahrnují DiGIR (nyní většinou nahrazeno) a TAPÍR (TDWG Access Protocol for Information Retrieval). Mnoho z těchto standardů a protokolů v současné době udržuje a na jejich vývoj dohlíží Pracovní skupina pro taxonomické databáze (TDWG).

Aktuální aktivity

Na konferenci o e-biosféře ve Velké Británii v roce 2009[10] byla přijata následující témata, která svědčí o široké škále současných aktivit v oblasti informatiky v oblasti biologické rozmanitosti a o tom, jak je lze kategorizovat:

  • Použití: Ochrana / Zemědělství / Rybolov / Průmysl / Lesnictví
  • Aplikace: Invazivní mimozemské druhy
  • Aplikace: Systematická a evoluční biologie
  • Aplikace: Taxonomie a identifikační systémy
  • Nové nástroje, služby a standardy pro správu a přístup k datům
    • Nové nástroje pro modelování
    • Nové nástroje pro integraci dat
    • Nové přístupy k infrastruktuře biologické rozmanitosti
    • Nové přístupy k identifikaci druhů
    • Nové přístupy k mapování biologické rozmanitosti
  • Národní a regionální databáze a sítě biologické rozmanitosti

Postkonferenční workshop klíčových osob se současnými významnými rolemi v oblasti informatiky v oblasti biologické rozmanitosti rovněž vyústil v Řešení dílny která mimo jiné zdůraznila potřebu vytvoření trvalých globálních registrů zdrojů, které jsou základem informatiky biologické rozmanitosti (např. úložiště, sbírky); dokončit výstavbu pevné taxonomické infrastruktury; a vytvářet ontologie pro údaje o biologické rozmanitosti.

Příklad projektů informatiky v oblasti biologické rozmanitosti

Globální:

Regionální / národní projekty:

  • LifeWatch navrhuje ESFRI jako celoevropská výzkumná (e-) infrastruktura na podporu výzkumu a tvorby politiky v oblasti biologické rozmanitosti.

Seznam více než 600 současných aktivit souvisejících s informatikou v oblasti biologické rozmanitosti najdete na Databáze TDWG "Informační projekty o biologické rozmanitosti světa".

Viz také

Reference

  1. ^ Krishtalka L, Humphrey PS (2000). „Mohou přírodovědná muzea zachytit budoucnost?“. BioScience. 50 (7): 611–617. doi:10.1641 / 0006-3568 (2000) 050 [0611: CNHMCT] 2.0.CO; 2.
  2. ^ Peterson AT, Vieglais D (2001). „Předpovídání invazí druhů pomocí ekologického modelování výklenků: Nové přístupy z bioinformatiky útočí na naléhavý problém“ (PDF). BioScience. 51 (5): 363–371. doi:10.1641 / 0006-3568 (2001) 051 [0363: PSIUEN] 2.0.CO; 2.
  3. ^ „Bioinformatika pro biologickou rozmanitost?“. Věda. 289: 2229–2440. 2000.
  4. ^ „Informatika o biologické rozmanitosti“. BMC bioinformatika. 10 Suppl 14. 2009. Archived from originál dne 2010-01-27. Citováno 2009-11-15.
  5. ^ ""Informatika o biologické rozmanitosti ", pojem". Citováno 2009-08-06.
  6. ^ Bisby FA; et al. (2000). „Tichá revoluce: Informatika o biologické rozmanitosti a internet“. Věda. 289 (5488): 2309–2312. Bibcode:2000Sci ... 289,2309B. doi:10.1126 / science.289.5488.2309. PMID  11009408. S2CID  31852825.
  7. ^ „Paleobiologická databáze“. Citováno 2009-08-06.
  8. ^ „Směrem k hierarchii řízení (klasifikaci) pro Katalog života. Návrh diskusního dokumentu Dr. Dennis P. Gordona, květen 2009“. Archivovány od originál dne 8. 8. 2009. Citováno 2009-08-06.
  9. ^ Ruggiero, M.A .; Gordon, D.P .; Orrell, T. M.; Bailly, N .; Bourgoin, T .; Brusca, R.C .; et al. (2015). „Vyšší klasifikace všech živých organismů“. PLOS ONE. 10 (4): e0119248. Bibcode:2015PLoSO..1019248R. doi:10.1371 / journal.pone.0119248. PMC  4418965. PMID  25923521.
  10. ^ http://www.e-biosphere09.org/

Další čtení

externí odkazy