Přechod pro chodce schématu - Schema crosswalk
A přechod pro chodce schématu je tabulka, která zobrazuje ekvivalentní prvky (nebo „pole“) ve více než jednom databázové schéma. Mapuje prvky v jednom schématu na ekvivalentní prvky v jiném schématu.
Stoly pro přechod pro chodce se často používají uvnitř nebo souběžně s nimi podnikové systémy, zvláště když je propojeno více systémů nebo když systém obsahuje starší systém data. V kontextu rozhraní fungují jako jakési interní Extrahovat, transformovat, načíst (ETL) mechanismus.
Jedná se například o metadata přechod pro chodce z Standardy MARC na Dublin Core:
MARC pole | Dublin Core element | |
---|---|---|
260 c $ (datum zveřejnění, distribuce atd.) | → | Datum. Vytvořeno |
522 (Geografické pokrytí Poznámka) | → | Pokrytí. Prostorové |
300 $ (fyzický popis) | → | Formát. Rozsah |
Přechody pro chodce ukazují lidem, kam mají dát data z jednoho schématu do jiného schématu. Knihovny, archivy, muzea a další kulturní instituce je často používají k překladu dat do nebo ze standardů MARC, Dublin Core, Iniciativa pro kódování textu (TEI) a další schémata metadat. Řekněme například, že archiv má ve svém katalogu záznam MARC popisující rukopis. Pokud archiv vytvoří digitální kopii tohoto rukopisu a chce jej zobrazit na webu spolu s informacemi z katalogu, bude muset přeložit data ze záznamu katalogu MARC do jiného formátu, například Schéma popisu objektu metadata které lze zobrazit na webové stránce. Protože MARC má jiná pole než MODS, musí se rozhodnout, kam do MODS dát data. Tento typ „překladu“ z jednoho formátu do jiného se často nazývá „mapování metadat“ nebo „mapování polí“ a souvisí s „mapování dat ", a "sémantické mapování ".
Přechody pro chodce mají také několik technických možností. Pomáhají databázím sdílet různá schémata metadat. Pomáhají sklízečům metadat vytvářet souborné katalogy. Umožňují vyhledávačům prohledávat více databází současně pomocí jediného dotazu.
Výzvy pro přechod pro chodce
Jednou z největších výzev pro přechod pro chodce je, že žádná dvě schémata metadat nejsou stoprocentně ekvivalentní. Jedno schéma může mít pole, které neexistuje v jiném schématu, nebo může mít pole, které je v jiném schématu rozděleno na dvě různá pole; proto při mapování ze složitého schématu na jednodušší často ztrácíte data. Například při mapování z MARC na Simple Dublin Core ztratíte rozdíl mezi typy titulů:
MARC pole | Dublin Core element | |
---|---|---|
210 Zkrácený název | → | Titul |
222 Název klíče | → | Titul |
240 Jednotný název | → | Titul |
242 Přeložený název | → | Titul |
245 Prohlášení o názvu | → | Titul |
246 Název varianty | → | Titul |
Simple Dublin Core má pouze jeden jediný prvek „Title“, takže se všechny různé typy titulů MARC spojí dohromady bez jakéhokoli dalšího rozlišování. Toto se nazývá mapování typu „více ku jedné“. To je také důvod, proč po překladu těchto titulů do Simple Dublin Core je již nebudete moci přeložit zpět do MARC. Jakmile jsou Simple Dublin Core, ztratili jste informace MARC o tom, jaké typy titulů jsou, takže při mapování ze Simple Dublin Core zpět na MARC se všechna data v prvku „Title“ mapují na základní MARC 245 Title Statement pole.[1]
Dublin Core element | MARC pole | |
---|---|---|
Titul | → | 245 Prohlášení o názvu |
Titul | → | 245 Prohlášení o názvu |
Titul | → | 245 Prohlášení o názvu |
Titul | → | 245 Prohlášení o názvu |
Titul | → | 245 Prohlášení o názvu |
Titul | → | 245 Prohlášení o názvu |
Proto se o přechodech pro chodce říká „boční“ (jednosměrné) mapování z jednoho schématu do druhého. Pro mapování ze schématu A do schématu B a ze schématu B do schématu A by bylo zapotřebí samostatných přechodů pro chodce.[2]
Obtíže při mapování
Další problémy s mapováním vznikají, když:
- Jedno schéma má jeden prvek, který je třeba rozdělit a jeho různé části umístit do několika dalších prvků ve druhém schématu (mapování „jedna k mnoha“)
- Jedno schéma umožňuje opakování prvku vícekrát, zatímco jiné umožňuje, aby se prvek objevil pouze jednou s více výrazy
- Schémata mají různé datové formáty (např. John Doe nebo Doe, Johne)
- Prvek v jednom schématu je indexován, ale ekvivalentní prvek v druhém schématu není
- Schémata mohou používat různé kontrolované slovníky
- Schémata v průběhu času mění své standardy
Některé z těchto problémů prostě nelze opravit. Jak říká Karen Coyle „Crosswalking Citation Metadata: The University of California's Experience,"
„Čím více zkušeností s metadaty máme, tím více je jasné, že dokonalost metadat nelze dosáhnout, a každý, kdo se o to pokusí, bude velmi zklamán. Když budou metadata přecházet mezi dvěma nebo více nesouvisejícími zdroji, budou existovat datové prvky, které nelze sladit ideálním způsobem. Klíčem k úspěšnému přechodu pro metadata je inteligentní flexibilita. Je důležité zaměřit se na důležité cíle a být ochotni dělat kompromisy, abychom dosáhli praktického závěru k projektům. “[3]
Příklady
- MARC do Dublin Core (Knihovna Kongresu)
- Dublin Core do MARC21 (Knihovna Kongresu)
- Dublinské jádro pro UNIMARC (UKOLN)
- TEI do az MARC
- FGDC do USMARC (Alexandrie)
- ONIX do MARC21 (Knihovna Kongresu)
- VRA do MARC (Indiana University)
- Mapování metadat (Knihovna MIT)
- Mapování mezi formáty metadat (UKOLN)
- Standardní mapování mezinárodních metadat (Academia Sinica)
- JATS MARC
- ISAD (G) až EAD 2002 (Knihovna Kongresu)
- EAD 2002 až ISAD (G) (Knihovna Kongresu)
- MARC21 až EAD 2002 (Knihovna Kongresu)
Viz také
Reference
- ^ „Dublin Core to MARC Crosswalk,“ Kancelář pro vývoj sítí a standardy MARC, Library of Congress
- ^ Caplan, Priscilla (2003). Základy metadat pro všechny knihovníky. Chicago: American Library Association. str.39. ISBN 0838908470.
- ^ v „Metadata v praxi“ Diane I. Hillmann a Elaine L. Westbrooks, eds., American Library Association, Chicago, 2004, s. 91.