Zastoupení termín - Representation term
A reprezentační termín je slovo nebo kombinace slov, která sémanticky představují datový typ (hodnotová doména) datového prvku. Termín reprezentace se běžně označuje jako a třídní slovo ti, kteří jsou obeznámeni s datové slovníky. Definuje ISO / IEC 11179-5: 2005 reprezentační termín jako označení instance třídy reprezentace Jak se používá v ISO / IEC 11179, reprezentační člen je ta část a název datového prvku , který poskytuje sémantický ukazatel na základní datový typ. A Třída reprezentace je třída reprezentací. Tento třída reprezentace poskytuje způsob, jak klasifikovat nebo skupina datové prvky.
A Termín zastoupení lze považovat za atribut a datový prvek v registr metadat který klasifikuje datový prvek podle typu dat uložených v datovém prvku.[1]
Podmínky zastoupení jsou obvykle „schváleny“ organizací nebo normalizačním orgánem, který je používá. OSN například zveřejňuje svůj schválený seznam jako součást technické specifikace UN / CEFACT Core Components. The Universal Data Element Framework používá podmnožinu reprezentací CCTS a přiřazuje číselné kódy těm, které jsou použity.
Případy použití pro reprezentační výraz
Správa hodnotových domén
Hodnotová doména vyjadřuje sadu povolených hodnot pro datový prvek. Termín reprezentace (a obvykle odpovídající termín datového typu) zahrnuje taxonomii hodnotových domén v datové sadě. Tato taxonomie je třída reprezentace. Reprezentační člen lze tedy použít k řízení šíření hodnotových domén zajištěním toho, aby domény ekvivalentní hodnoty používaly stejný reprezentační termín.
Nalezení ekvivalentních vlastností
Když osoba nebo softwarový agent analyzuje dva samostatné registry metadat, aby je našel majetková ekvivalence, termín Zastoupení lze použít jako vodítko. Například pokud má systém A datový prvek, jako je PersonGenderCode, a systém B, má datový prvek, jako je PersonSexCode, může přípona kódu pomoci dvěma systémům porovnávat pouze datové prvky, které mají příponu „Kód“. Taxonomie majetkových pojmů (tj. „Pohlaví“ nebo „pohlaví“) je však v tomto ohledu mnohem efektivnější.
Odvození
Termín zastoupení lze mnoha způsoby použít k odvození datových sad. Podmínky reprezentace informují pozorovatele o jakémkoli datovém toku o datových typech a udávají, jak lze datový prvek použít. To je důležité při mapování registrů metadat na externí datové prvky. Například pokud vám bude zaslán záznam o osobě, můžete vyhledat jakoukoli příponu „ID“, abyste pochopili, jak může vzdálený systém rozlišovat dva odlišné záznamy.
Povinná pole
Podmínky zastoupení se také používají k vyvození závěrů o požadavcích na nemovitost. Například pokud měl datový proud datový prvek PersonBirthDateAndTime, věděli byste, že BOTH datum A čas jsou k dispozici a relevantní, nejen datum. Pokud byl čas narození volitelný, měly by být použity samostatné datové prvky, jako je PersonBirthDate a PersonBirthTime.
Hledání dimenzí a měr datového skladu
Při vytváření datového skladu se obchodní analytik podívá na Podmínky reprezentace, aby rychle našel dimenze a míry předmětu, aby mohl vytvořit kostky OLAP. Například:
- Indikátor nebo Kód slouží k vytvoření dimenzí datového skladu
- datum nebo Čas schůzky se používají k vztahu k časové dimenzi, které jsou často sdíleny mezi kostkami pomocí přizpůsobených dimenzí
- Množství, Číslo, Opatření nebo Hodnota termíny (které lze sčítat) jsou kandidáty na měření
- název a Text se používají pro popisky obrazovky nebo jiné popisné prvky
- Procent je třeba analyzovat, protože je nelze sčítat s jasným významem
- ID slouží k odstranění duplicitních záznamů
Technická specifikace základních komponent
Společná technická specifikace ISO / UN Core Components formálně definuje jak povolenou sadu reprezentačních podmínek, tak odpovídající sadu datových typů. ISO 15000-5 je implementační vrstva ISO 11179 a normativně vyjadřuje soubor pravidel sémanticky definujících koncepční a fyzicko-logické datové modely pro širokou škálu použití. V ISO 15000-5 poskytuje termín reprezentace mechanismus k harmonizaci hodnotových domén kandidátských datových prvků před přidáním do celkových datových modelů. ISO 15000-5 je používána řadou vlád, organizací zabývajících se vývojem norem a soukromým sektorem jako základ pro modelování dat.
Universal Data Element Framework
Některé neformální standardy, jako např Universal Data Element Framework (které odkazují na termín zastoupení jako na „majetkové slovo“) přiřadit každému celorepublikovému ID jedinečná celočíselná ID. To umožňuje nástrojům pro mapování metadat mapovat jednu sadu datových prvků do jiných slovníků metadat. Příklad těchto mapování najdete na ID slova vlastnosti. Upozorňujeme, že od listopadu 2005 nebyly koncepty UDEF široce přijaty.
Příklad reprezentačních výrazů jako přípona XML
Například pokud fragment dat XML měl následující:
<Person> <PersonID>123-45-6789</PersonID> <PersonGivenName>John</PersonGivenName> <PersonFamilyName>Kovář</PersonFamilyName> <PersonBirthDate>1990-08-14</PersonBirthDate></Person>
Ve výše uvedeném příkladu jsou termíny reprezentace „ID“ pro
Ukázkové reprezentační podmínky
Následuje ukázka Podmínek zastoupení, které byly použity pro výměnu elektronických zpráv v systémech, jako jsou NIEM nebo GJXDM 3.0: [poznámka: zde uvedená omezení jsou omezena na tyto specifikace a nepředstavují univerzální konsenzus]
Období | Používání |
---|---|
Množství | Peněžní hodnota s měnovými jednotkami. |
BinaryObject | Sada konečných sekvencí binárních oktetů používaných k reprezentaci zvuku, obrazů a dalších struktur. |
Kód | Výčet všech povolených hodnot. Každá vyjmenovaná hodnota je řetězec, který pro stručnost představuje konkrétní význam. Například pro a PersonGenderCode platné hodnoty mohou být „muž“, „žena“ nebo „neznámý“. |
datum | An ISO 8601 datum obvykle ve formátu RRRR-MM-DD |
Čas schůzky | An ISO 8601 datum (ve formátu RRRR-MM-DD) A časová struktura. Poznámka: Nepoužívejte, pokud NEJSOU VYŽADOVÁNA pole datum a čas. Pokud je jeden NEBO druhý volitelný, vždy zadejte datové prvky jako samostatné prvky data a času. |
Grafický | Slouží k ukládání obrázků. Sekundární k binárnímu objektu. |
ID | Zkratka pro identifikátor |
Identifikátor | Jazykově nezávislý štítek, znak nebo token používaný k vytvoření identity a jednoznačně odlišit jednu instanci objektu v rámci identifikační schéma. |
Indikátor | Boolean, přesně dvě vzájemně se vylučující hodnoty (true nebo false). Musí být uvedena přesná definice významu skutečné hodnoty. |
Opatření | Číselná hodnota určená měřením s jednotkami. Obvykle se používá u položek, jako je výška nebo hmotnost. není-li měrná jednotka jasná, měla by být uvedena. |
název | Textový štítek používaný jako identifikace objektu. Jméno má v nějakém jazyce obvykle smysl a je primárním prostředkem identifikace objektů pro člověka. Na rozdíl od identifikátor, název nemusí být nutně jedinečný. |
Číslo | Přiřazeno nebo určeno výpočtem. |
Text | Řetězec znaků obecně ve formě slov. |
Čas | An ISO 8601 časová struktura. |
Hodnota | Typ Numeric. |
Procent | Typ Numeric, který je tradičně výsledkem výpočtu poměru, který se pohybuje od hodnot 0 do 1 pro hodnoty 0% až 100%. |
Množství | Nepeněžní číselná hodnota nebo počet s jednotkami. |
Hodnotit | Typ Numeric |
Rok | An ISO 8601 Rok |
Pros podmínek reprezentace
- Použití reprezentačních výrazů v názvu datového prvku je konvence, která je široce přijímána několika velkými systémy, jako je NIEM, GJXDM a ebXML.
- Mnoho datových architektů, kteří jsou zodpovědní za mapování XML ze zahraničních zdrojů, považuje termíny reprezentace za velmi užitečné.
- Standardy, jako je UDEF závisí na přesném kódování podmínek zastoupení.
- Nástroje, které se ověřují podle výčtu, mohou rychle rozlišit kódované hodnoty hledáním přípony „Kód“.
- Dimenzionální analýza dat může použít podmínky reprezentace pro vytváření datových skladů. Termíny reprezentace, jako je kód a indikátor, lze převést na dimenze a částky a míry lze převést na míry v tabulce faktů.
Nevýhody podmínek zastoupení
- Neexistuje žádná univerzální dohoda, pokud jde o definitivní sadu podmínek reprezentace.
- Mezi reprezentačním pojmem a hodnotovou doménou, kterou představuje, není vždy přímý vztah. To je způsobeno další kvalifikací odpovídajícího termínu datového typu.
Standardy, které používají termíny reprezentace
- Elektronické podnikání s použitím rozšiřitelného značkovacího jazyka
- Vláda USA Národní model výměny informací vyžaduje použití reprezentačních výrazů pro datové prvky XML.
- Standardy pro výměnu údajů amerického ministerstva spravedlnosti Globální datový model XML XML vyžadovalo použití termínů reprezentace pro datové prvky XML.
[Poznámka] Toto je extrémně omezená sada široké škály standardů, které specifikují použití reprezentačních výrazů.
Viz také
- ISO / IEC 11179
- ISO / IEC 11404
- Metadata
- Datový prvek
- Třída reprezentace
- Universal Data Element Framework
- XML
- Schéma XML
Poznámky
- ^ ISO / IEC 11179-5 3.11 (238K soubor zip)
- ^ v ISO / IEC 11179-3: 2003 5.4 (546K soubor zip) je to ve skutečnosti třída reprezentace který je specifikován jako atribut a datový prvek.
externí odkazy
- ISO / TS 15000-5: 2005 Electronic Business Extensible Markup Language (ebXML) - Část 5: Technická specifikace ebXML Core Components, verze 2.01 (ebCCTS) (1 MB soubor PDF)
- ISO / IEC 11179-3: 2003 Metadata registry (MDR) - Část 3: Metamodel registru a základní atributy (546K soubor zip)
- ISO / IEC 11179-5: 2005 Metadata registry (MDR) - Část 5: Pojmenování a identifikační zásady (238K soubor zip)
- ISO / IEC TR 20943-1: 2003 (E) Postupy pro dosažení konzistence obsahu registru metadat - Část 1: Datové prvky Viz strana 84. (700K zip soubor)
- Výcvik DOJ a GJXDM klouže po pojmenování
- ISO / IEC JTC 1 / SC 32 / WG 2 metadata
- ZLOŽENÝ ODKAZ: http://ashcomp.com/DOI_Representation_terms.html Podmínky reprezentace amerického ministerstva vnitra
- Výcvik NIEM - viz snímek na straně 8, kde jsou uvedeny pojmy obsažené ve výukové třídě.
- Podmínky zastoupení NIEM 3.0 Beta