Zastoupení termín - Representation term

A reprezentační termín je slovo nebo kombinace slov, která sémanticky představují datový typ (hodnotová doména) datového prvku. Termín reprezentace se běžně označuje jako a třídní slovo ti, kteří jsou obeznámeni s datové slovníky. Definuje ISO / IEC 11179-5: 2005 reprezentační termín jako označení instance třídy reprezentace Jak se používá v ISO / IEC 11179, reprezentační člen je ta část a název datového prvku , který poskytuje sémantický ukazatel na základní datový typ. A Třída reprezentace je třída reprezentací. Tento třída reprezentace poskytuje způsob, jak klasifikovat nebo skupina datové prvky.

A Termín zastoupení lze považovat za atribut a datový prvek v registr metadat který klasifikuje datový prvek podle typu dat uložených v datovém prvku.[1]

Podmínky zastoupení jsou obvykle „schváleny“ organizací nebo normalizačním orgánem, který je používá. OSN například zveřejňuje svůj schválený seznam jako součást technické specifikace UN / CEFACT Core Components. The Universal Data Element Framework používá podmnožinu reprezentací CCTS a přiřazuje číselné kódy těm, které jsou použity.

Případy použití pro reprezentační výraz

Správa hodnotových domén

Hodnotová doména vyjadřuje sadu povolených hodnot pro datový prvek. Termín reprezentace (a obvykle odpovídající termín datového typu) zahrnuje taxonomii hodnotových domén v datové sadě. Tato taxonomie je třída reprezentace. Reprezentační člen lze tedy použít k řízení šíření hodnotových domén zajištěním toho, aby domény ekvivalentní hodnoty používaly stejný reprezentační termín.

Nalezení ekvivalentních vlastností

Když osoba nebo softwarový agent analyzuje dva samostatné registry metadat, aby je našel majetková ekvivalence, termín Zastoupení lze použít jako vodítko. Například pokud má systém A datový prvek, jako je PersonGenderCode, a systém B, má datový prvek, jako je PersonSexCode, může přípona kódu pomoci dvěma systémům porovnávat pouze datové prvky, které mají příponu „Kód“. Taxonomie majetkových pojmů (tj. „Pohlaví“ nebo „pohlaví“) je však v tomto ohledu mnohem efektivnější.

Odvození

Termín zastoupení lze mnoha způsoby použít k odvození datových sad. Podmínky reprezentace informují pozorovatele o jakémkoli datovém toku o datových typech a udávají, jak lze datový prvek použít. To je důležité při mapování registrů metadat na externí datové prvky. Například pokud vám bude zaslán záznam o osobě, můžete vyhledat jakoukoli příponu „ID“, abyste pochopili, jak může vzdálený systém rozlišovat dva odlišné záznamy.

Povinná pole

Podmínky zastoupení se také používají k vyvození závěrů o požadavcích na nemovitost. Například pokud měl datový proud datový prvek PersonBirthDateAndTime, věděli byste, že BOTH datum A čas jsou k dispozici a relevantní, nejen datum. Pokud byl čas narození volitelný, měly by být použity samostatné datové prvky, jako je PersonBirthDate a PersonBirthTime.

Hledání dimenzí a měr datového skladu

Při vytváření datového skladu se obchodní analytik podívá na Podmínky reprezentace, aby rychle našel dimenze a míry předmětu, aby mohl vytvořit kostky OLAP. Například:

  1. Indikátor nebo Kód slouží k vytvoření dimenzí datového skladu
  2. datum nebo Čas schůzky se používají k vztahu k časové dimenzi, které jsou často sdíleny mezi kostkami pomocí přizpůsobených dimenzí
  3. Množství, Číslo, Opatření nebo Hodnota termíny (které lze sčítat) jsou kandidáty na měření
  4. název a Text se používají pro popisky obrazovky nebo jiné popisné prvky
  5. Procent je třeba analyzovat, protože je nelze sčítat s jasným významem
  6. ID slouží k odstranění duplicitních záznamů

Technická specifikace základních komponent

Společná technická specifikace ISO / UN Core Components formálně definuje jak povolenou sadu reprezentačních podmínek, tak odpovídající sadu datových typů. ISO 15000-5 je implementační vrstva ISO 11179 a normativně vyjadřuje soubor pravidel sémanticky definujících koncepční a fyzicko-logické datové modely pro širokou škálu použití. V ISO 15000-5 poskytuje termín reprezentace mechanismus k harmonizaci hodnotových domén kandidátských datových prvků před přidáním do celkových datových modelů. ISO 15000-5 je používána řadou vlád, organizací zabývajících se vývojem norem a soukromým sektorem jako základ pro modelování dat.

Universal Data Element Framework

Některé neformální standardy, jako např Universal Data Element Framework (které odkazují na termín zastoupení jako na „majetkové slovo“) přiřadit každému celorepublikovému ID jedinečná celočíselná ID. To umožňuje nástrojům pro mapování metadat mapovat jednu sadu datových prvků do jiných slovníků metadat. Příklad těchto mapování najdete na ID slova vlastnosti. Upozorňujeme, že od listopadu 2005 nebyly koncepty UDEF široce přijaty.

Příklad reprezentačních výrazů jako přípona XML

Například pokud fragment dat XML měl následující:

<Person> <PersonID>123-45-6789</PersonID> <PersonGivenName>John</PersonGivenName> <PersonFamilyName>Kovář</PersonFamilyName> <PersonBirthDate>1990-08-14</PersonBirthDate></Person>

Ve výše uvedeném příkladu jsou termíny reprezentace „ID“ pro , přípona „Název“ pro křestní a příjmení a „Datum“ pro .

Ukázkové reprezentační podmínky

Následuje ukázka Podmínek zastoupení, které byly použity pro výměnu elektronických zpráv v systémech, jako jsou NIEM nebo GJXDM 3.0: [poznámka: zde uvedená omezení jsou omezena na tyto specifikace a nepředstavují univerzální konsenzus]

Ukázkové podmínky zastoupení
ObdobíPoužívání
MnožstvíPeněžní hodnota s měnovými jednotkami.
BinaryObjectSada konečných sekvencí binárních oktetů používaných k reprezentaci zvuku, obrazů a dalších struktur.
KódVýčet všech povolených hodnot. Každá vyjmenovaná hodnota je řetězec, který pro stručnost představuje konkrétní význam. Například pro a PersonGenderCode platné hodnoty mohou být „muž“, „žena“ nebo „neznámý“.
datumAn ISO 8601 datum obvykle ve formátu RRRR-MM-DD
Čas schůzkyAn ISO 8601 datum (ve formátu RRRR-MM-DD) A časová struktura. Poznámka: Nepoužívejte, pokud NEJSOU VYŽADOVÁNA pole datum a čas. Pokud je jeden NEBO druhý volitelný, vždy zadejte datové prvky jako samostatné prvky data a času.
GrafickýSlouží k ukládání obrázků. Sekundární k binárnímu objektu.
IDZkratka pro identifikátor
IdentifikátorJazykově nezávislý štítek, znak nebo token používaný k vytvoření identity a jednoznačně odlišit jednu instanci objektu v rámci identifikační schéma.
IndikátorBoolean, přesně dvě vzájemně se vylučující hodnoty (true nebo false). Musí být uvedena přesná definice významu skutečné hodnoty.
OpatřeníČíselná hodnota určená měřením s jednotkami. Obvykle se používá u položek, jako je výška nebo hmotnost. není-li měrná jednotka jasná, měla by být uvedena.
názevTextový štítek používaný jako identifikace objektu. Jméno má v nějakém jazyce obvykle smysl a je primárním prostředkem identifikace objektů pro člověka. Na rozdíl od identifikátor, název nemusí být nutně jedinečný.
ČísloPřiřazeno nebo určeno výpočtem.
TextŘetězec znaků obecně ve formě slov.
ČasAn ISO 8601 časová struktura.
HodnotaTyp Numeric.
ProcentTyp Numeric, který je tradičně výsledkem výpočtu poměru, který se pohybuje od hodnot 0 do 1 pro hodnoty 0% až 100%.
MnožstvíNepeněžní číselná hodnota nebo počet s jednotkami.
HodnotitTyp Numeric
RokAn ISO 8601 Rok

Pros podmínek reprezentace

  • Použití reprezentačních výrazů v názvu datového prvku je konvence, která je široce přijímána několika velkými systémy, jako je NIEM, GJXDM a ebXML.
  • Mnoho datových architektů, kteří jsou zodpovědní za mapování XML ze zahraničních zdrojů, považuje termíny reprezentace za velmi užitečné.
  • Standardy, jako je UDEF závisí na přesném kódování podmínek zastoupení.
  • Nástroje, které se ověřují podle výčtu, mohou rychle rozlišit kódované hodnoty hledáním přípony „Kód“.
  • Dimenzionální analýza dat může použít podmínky reprezentace pro vytváření datových skladů. Termíny reprezentace, jako je kód a indikátor, lze převést na dimenze a částky a míry lze převést na míry v tabulce faktů.

Nevýhody podmínek zastoupení

  • Neexistuje žádná univerzální dohoda, pokud jde o definitivní sadu podmínek reprezentace.
  • Mezi reprezentačním pojmem a hodnotovou doménou, kterou představuje, není vždy přímý vztah. To je způsobeno další kvalifikací odpovídajícího termínu datového typu.

Standardy, které používají termíny reprezentace

[Poznámka] Toto je extrémně omezená sada široké škály standardů, které specifikují použití reprezentačních výrazů.

Viz také

Poznámky

  1. ^ ISO / IEC 11179-5 3.11 (238K soubor zip)
  2. ^ v ISO / IEC 11179-3: 2003 5.4 (546K soubor zip) je to ve skutečnosti třída reprezentace který je specifikován jako atribut a datový prvek.

externí odkazy