Jednotný systém lékařských jazyků - Unified Medical Language System
The Jednotný systém lékařských jazyků (UMLS) je kompendium z mnoha řízené slovníky v biomedicínské vědy (vytvořeno 1986).[1] Poskytuje strukturu mapování mezi těmito slovníky a umožňuje tak překládat mezi různými terminologickými systémy; lze to také považovat za komplexní tezaurus a ontologie biomedicínských konceptů. UMLS dále poskytuje zařízení pro zpracování přirozeného jazyka. Je určen k použití hlavně vývojáři systémů v systému Windows lékařská informatika.
UMLS se skládá ze zdrojů znalostí (databází) a sady softwarových nástrojů.
UMLS byl navržen a udržován NÁS Národní lékařská knihovna, je čtvrtletně aktualizován a lze jej používat zdarma. Projekt byl zahájen v roce 1986 Donald A.B. Lindberg, M.D., poté ředitel Lékařské knihovny a režii Betsy Humphreys.[2]
Účel a aplikace
Počet biomedicínských zdrojů, které mají vědci k dispozici, je obrovský. Často je to problém kvůli velkému množství dokumentů získaných při prohledávání lékařské literatury. Účelem UMLS je zlepšit přístup k této literatuře usnadněním vývoje počítačových systémů, které rozumějí biomedicínskému jazyku. Toho je dosaženo překonáním dvou významných překážek: „rozmanitost způsobů, jak jsou stejné koncepty vyjádřeny v různých strojově čitelných zdrojích a různými lidmi“ a „distribuce užitečných informací mezi mnoho různorodých databází a systémů“.[Citace je zapotřebí ]
Licencování
Uživatelé systému jsou povinni podepsat „smlouvu UMLS“ a podat krátké výroční zprávy o používání. Akademičtí uživatelé mohou UMLS používat bezplatně pro výzkumné účely. Komerční nebo produkční použití vyžaduje licence na autorská práva pro některé začleněné zdrojové slovníky.
Zdroje znalostí
Metathesaurus
Metathesaurus tvoří základ UMLS a zahrnuje více než 1 milion biomedicínských konceptů a 5 milionů názvů konceptů, které všechny pocházejí z více než 100 integrovaných řízených slovníků a klasifikačních systémů. Některé příklady začleněných řízených slovníků jsou CPT, ICD-10, Pletivo, SNOMED CT, DSM-IV, LOINC, Terminologie WHO pro nežádoucí účinky, Klinické podmínky ve Velké Británii, RxNorm, Genová ontologie, a OMIM (vidět úplný seznam ).
Metathesaurus je organizován podle konceptu a každý koncept má specifické atributy definující jeho význam a je propojen s odpovídajícími názvy konceptů v různých zdrojových slovnících. Jsou představeny četné vztahy mezi koncepty, například hierarchické, jako například „je „pro podtřídy a“ je součástí „pro podjednotky a asociativní jako„ je způsobeno “nebo„ v literatuře se často vyskytuje blízko “(druhá je odvozena z Medline ).
Rozsah metatezauru je určen rozsahem zdrojových slovníků. Pokud různé slovníky používají různé názvy pro stejný koncept, nebo pokud používají stejný název pro různé koncepty, pak to bude věrně znázorněno v metathesauru. Veškeré hierarchické informace ze zdrojových slovníků jsou uchovávány v metathezauru. Pojmy Metathesaurus mohou také odkazovat na zdroje mimo databázi, například databáze genových sekvencí.
Sémantická síť
Každému konceptu v metatezauru je přiřazen jeden nebo více sémantické typy (kategorie), které jsou navzájem propojeny prostřednictvím sémantické vztahy.[3]The sémantická síť je katalog těchto sémantických typů a vztahů. Toto je poměrně široká klasifikace; existuje celkem 127 sémantických typů a 54 vztahů.
Hlavní sémantické typy jsou organismy, anatomické struktury, biologické funkce, chemikálie, události, fyzické objekty a koncepty nebo nápady. Vazby mezi sémantickými typy definují strukturu sítě a ukazují důležité vztahy mezi seskupení a pojmy. Primárním spojením mezi sémantickými typy je „je "odkaz, založení hierarchie Síť má také 5 hlavních kategorií nehierarchických (nebo asociativních) vztahů, které tvoří zbývajících 53 typů vztahů. Jedná se o „fyzicky související“, „prostorově související“, „časově související“, „funkčně související“ a „koncepčně související“.[3]
Informace o sémantickém typu zahrnují identifikátor, definici, příklady, hierarchické informace o zahrnujících sémantických typech a asociativní vztahy. Asociační vztahy v rámci sémantické sítě jsou velmi slabé. Zachycují nanejvýš některé-některé vztahy, tj. Zachycují skutečnost, že některá instance prvního typu může být spojena s výrazným vztahem k některé instanci druhého typu. Formulované odlišně zachycují skutečnost, že odpovídající relační tvrzení má smysl (i když to nemusí být ve všech případech pravda).
Příkladem asociativního vztahu je „může způsobit„, aplikováno na výrazy (kouření, rakovina plic) by přineslo: kouření“může způsobit" rakovina plic.
SPECIALISTA Lexikon
Lexikon SPECIALISTU obsahuje informace o běžné anglické slovní zásobě, biomedicínských termínech, termínech nalezených v MEDLINE a termíny nalezené v metathesauru UMLS. Každá položka obsahuje syntaktický (jak jsou slova dávána dohromady, aby vytvořila význam), morfologické (forma a struktura) a ortografický (pravopis) informace. Sada Jáva programy používají lexikon k propracování variací v biomedicínských textech spojením slov s jejich řečovými částmi, což může být užitečné při web prohledává nebo prohledává elektronický lékařský záznam.
Záznamy mohou být jednoslovné nebo víceslovné. Záznamy obsahují čtyři části: základní formulář (tj. „Běh“ pro „běh“); slovní druhy (z nichž Specialist uznává jedenáct); jedinečný identifikátor; a všechny dostupné pravopisné varianty. Například a dotaz pro "anestetikum" vrátí následující:[4]
{base = anestetikum spelling_variant = anestetikum vstup = E0008769 cat = podstatné jméno varianty = reg} {base = anestetikum spelling_variant = anestetikum vstup = E0008770 kočka = adj varianty = inv pozice = attrib (3)}
Lexikon SPECIALISTŮ je k dispozici ve dvou formátech. Formát „jednotkového záznamu“ lze vidět výše a obsahuje sloty a plniva. A slot je prvek (tj. "base =" nebo "pravopisná varianta =") a plniva jsou hodnoty, které lze přiřadit tomuto slotu pro danou položku. „relační tabulka "formát zatím není normalizováno a obsahují velké množství nadbytečných dat v souborech.
Nesrovnalosti a jiné chyby
Vzhledem k velikosti a složitosti UMLS a jeho tolerantní politice při integraci termínů jsou chyby nevyhnutelné.[5]Mezi chyby patří nejednoznačnost a redundance, hierarchické cykly vztahů (koncept je předkem i potomkem jiného), chybějící předci (sémantické typy nadřazených a podřízených konceptů nesouvisí) a sémantická inverze (vztah dítě / rodič se sémantickými typy je není v souladu s koncepty).[6]
Tyto chyby jsou objeveny a vyřešeny auditováním UMLS. Ruční audity mohou být velmi časově náročné a nákladné. Vědci se pokusili tento problém vyřešit řadou způsobů. K hledání těchto chyb lze použít automatizované nástroje. Pro strukturální nesrovnalosti (například smyčky) by fungovalo triviální řešení založené na objednávce. Totéž by však neplatilo, pokud je nesrovnalost na úrovni pojmu nebo konceptu (kontextově specifický význam pojmu).[7] To vyžaduje použití informované vyhledávací strategie (reprezentace znalostí ).
Podpora softwarových nástrojů
Kromě zdrojů znalostí je Národní lékařská knihovna také poskytuje podpůrné nástroje.
- MetamorphoSys - přizpůsobuje Metathesaurus pro konkrétní aplikace, například vyloučením určitých zdrojových slovníků.
- lvg - program, který pomocí lexikonu SPECIALIST generuje lexikální varianty daného termínu a podporuje analýzu textu v přirozeném jazyce.
- MetaMap - online nástroj, který po zadání libovolného kusu textu vyhledá a vrátí příslušné pojmy metathezauru.
- Přenos MetaMap (MMTx) - Java implementace MetaMap (již není podporována).
- Zdrojový server znalostí - webový přístup ke slovníkům (do důchodu na podzim 2010).[8]
Software třetích stran
- Podobnost UMLS, softwarový balík s otevřeným zdrojovým kódem, který implementuje mnoho opatření sémantické podobnosti a příbuznosti.
- Webové rozhraní UMLS-Podobnost, webové rozhraní pro podobnost UMLS
Viz také
Reference
- ^ Jednotný systém lékařských jazyků, 1996
- ^ Ellison D, Humphreys BL, Mitchell J (červenec 2010). „Předání ceny Morris F Collen 2009 Betsy L Humphreys s poznámkami od příjemce“. Journal of the American Medical Informatics Association. 17 (4): 481–5. doi:10.1136 / jamia.2010.005728. PMC 2995660. PMID 20595319.
- ^ A b National Library of Medicine (2009). „Kapitola 5 - Sémantické sítě“. Referenční příručka UMLS. Bethesda, MD: Americká národní lékařská knihovna, National Institutes of Health.
- ^ Browne AC, McCray AT, Srinivasan S (červen 2000). Specializovaný lexikon (PDF). Bethesda, MD: Lister Hill National Center for Biomedical Communications, National Library of Medicine. p. 1.
- ^ Morrey CP, Geller J, Halper M, Perl Y (červen 2009). „The Neighborhood Auditing Tool: a hybrid interface for auditing the UMLS“. Časopis biomedicínské informatiky. 42 (3): 468–89. doi:10.1016 / j.jbi.2009.01.006. PMC 2891659. PMID 19475725.
- ^ Geller J, Morrey CP, Xu J, Halper M, Elhanan G, Perl Y, Hripcsak G (listopad 2009). "Porovnání nekonzistentních konfigurací vztahů označujících chyby UMLS". AMIA ... Sborník výročních sympozií. AMIA Symposium. 2009: 193–7. PMC 2815406. PMID 20351848.
- ^ Zhu X, Fan JW, Baorto DM, Weng C, Cimino JJ (červen 2009). „Přehled auditorských metod použitých na obsah kontrolovaných biomedicínských terminologií“. Časopis biomedicínské informatiky. 42 (3): 413–25. doi:10.1016 / j.jbi.2009.03.003. PMC 3505841. PMID 19285571.
- ^ „Unified Medical Language System® (UMLS®) News: Revised License Agreement, New UMLS Terminology Services and Browser, Discontinued UMLSKS, and API Changes“. Technický bulletin NLM. Americká národní lékařská knihovna. 29. července 2010.
Další čtení
- Bodenreider O (leden 2004). „Unified Medical Language System (UMLS): integrating biomedical terminology“. Výzkum nukleových kyselin. 32 (Problém s databází): D267-70. doi:10.1093 / nar / gkh061. PMC 308795. PMID 14681409.
- Kumar A, Smith B (2003). „Jednotný systém lékařských jazyků a genová ontologie: některé kritické úvahy“ (PDF). Pokroky v umělé inteligenci (poznámky k přednášce v oblasti umělé inteligence 2821. Berlín: Springer. str. 135–148.
- Smith B, Kumar A, Schulze-Kremer S (2004). „Revize sémantické sítě UMLS“ (PDF). In Fieschi M, et al. (eds.). Medinfo. Amsterdam: IOS Press. p. 1700.
- Coiera E (2003). „Kapitola 17 - Terminologie a klasifikační systémy zdravotní péče“. Průvodce po zdravotnické informatice (2. vyd.). Modder, Arnold. ISBN 978-0-340-76425-1.
- Mougin F, Bodenreider O (2005). „Přístupy k eliminaci cyklů v metathesauru UMLS: naivní vs. formální“. Sborník AMIA výroční sympozium: 550–4. PMC 1560864. PMID 16779100.
externí odkazy
- Oficiální webové stránky
- Souhrnný popis UMLS, s odkazy na informační listy a dokumentaci pro Metathesaurus, Semantic Network, SPECIALIST Lexicon a MetamorphoSys
- Přehled a výukový program UMLS autorů: Rachel Kleinsorge, Jan Willis, Allen Browne, Alan Aronson
- Modul Perl pro dotazování instalace mysql UMLS
- Jednotný systém lékařských jazyků v americké národní lékařské knihovně Lékařské předměty (Pletivo)
- UMLS.me - výtažky lékařských konceptů a kódů UMLS z volného textu v prohlížeči, autor Alexander Scarlat MD.