ISO 639-3 - ISO 639-3

ISO 639-3: 2007, Kódy pro zastoupení názvů jazyků - Část 3: Alfa-3 kód pro komplexní pokrytí jazyků, je mezinárodní standard pro jazykové kódy v ISO 639 série. Definuje třípísmenné kódy pro identifikaci jazyků. Standard vydal Mezinárodní organizace pro normalizaci (ISO) dne 1. února 2007.[1]

ISO 639-3 rozšiřuje ISO 639-2 alfa-3 kódy s cílem pokrýt všechny známé přirozené jazyky. Rozšířené jazykové pokrytí bylo založeno především na jazykových kódech používaných v EU Etnolog (svazky 10-14) publikoval SIL International, což je nyní Registrační orgán pro ISO 639-3.[2] Poskytuje výčet jazyků co nejúplnějších, včetně živých a vyhynulých, starověkých a konstruovaných, hlavních i vedlejších, psaných i nepsaných.[1] Nezahrnuje to však rekonstruované jazyky jako Protoindoevropský.[3]

ISO 639-3 je určena pro použití jako metadata kódy v široké škále aplikací. Je široce používán v počítačových a informačních systémech, jako je internet, ve kterých je třeba podporovat mnoho jazyků. V archivech a jiných úložištích informací se používá v katalogizačních systémech, což naznačuje, v jakém jazyce je prostředek nebo v jakém jazyce. Kódy jsou také často používány v lingvistické literatuře a jinde k vyrovnání skutečnosti, že názvy jazyků mohou být nejasné nebo nejednoznačné.

Najděte jazyk
Zadejte kód ISO 639-3 a najděte odpovídající článek v jazyce.

Kódy jazyků

ISO 639-3 zahrnuje všechny jazyky v ISO 639-1 a všechny jednotlivé jazyky v ISO 639-2. ISO 639-1 a ISO 639-2 se zaměřily na hlavní jazyky, nejčastěji zastoupené v celém textu světové literatury. Jelikož ISO 639-2 zahrnuje také jazykové sbírky a část 3 nikoli, ISO 639-3 není nadmnožinou ISO 639-2. Kde Kódy B a T. existují v ISO 639-2, ISO 639-3 používá T-kódy.

Ukázkové jazykové kódy ISO
Jazyk639-1639-2 (B / T)639-3 typu639-3 kód
Angličtinaenanglindividuálníangl
Němecdeger / deuindividuálnídeu
arabštinaararamakroara
individuálníarb + další
čínštinazhchi / zho[4][5]makrozho
Mandarinkaindividuálnícmn
Kantonskýindividuálníyue
Minnanindividuálnínan

Ke dni 30. ledna 2020, standard obsahuje 7 868 záznamů.[6] Soupis jazyků je založen na řadě zdrojů, včetně: jednotlivých jazyků obsažených v 639-2, moderních jazyků z Etnolog, historické odrůdy, starověké jazyky a umělé jazyky z Seznam lingvistů,[7] stejně jako jazyky doporučené v ročním období pro veřejné komentování.

Strojově čitelná data soubory poskytuje registrační úřad.[6] Pomocí těchto datových souborů lze provést mapování z ISO 639-1 nebo ISO 639-2 na ISO 639-3.

Norma ISO 639-3 má předpokládat rozlišení na základě kritérií, která nejsou zcela subjektivní.[8] Není zamýšleno dokumentovat nebo poskytovat identifikátory pro dialekty nebo jiné podjazykové varianty.[9] Rozsudky týkající se rozdílů mezi jazyky však mohou být subjektivní, zejména v případě jazykových variant bez zavedených literárních tradic, použití ve vzdělávání nebo v médiích nebo jiných faktorů, které přispívají ke konvenci jazyka. Standard by proto neměl být považován za směrodatné prohlášení o tom, jaké odlišné jazyky ve světě existují (o čemž může v některých případech dojít k podstatným neshodám), ale spíše jen za jeden užitečný způsob přesné identifikace různých jazykových variant.

Kódový prostor

Jelikož je kód třípísmenný abecední, je horní hranice počtu jazyků, které lze reprezentovat, 26 × 26 × 26 = 17 576. Protože ISO 639-2 definuje speciální kódy (4), vyhrazený rozsah (520) a kódy pouze pro B (22), nelze v části 3 použít 546 kódů. Proto je přísnější horní hranice 17 576 - 546 = 17 030.

Horní hranice bude ještě přísnější, pokud odečteme jazykové sbírky definované v 639-2 a ty, které ještě nebudou definovány ISO 639-5.

Makrojazyky

Existuje 58 jazyků v ISO 639-2, které jsou pro účely této normy považovány za „makrojazyky“ v ISO 639-3.[10]

Některé z těchto makrojazyky neměl žádný individuální jazyk definovaný v ISO 639-3 v kódové sadě ISO 639-2, např. 'ara' (obecná arabština). Jiní jako „nor“ (norština) měli své dvě jednotlivé části („nno“ (Nynorsk ), „nob“ (Bokmål )) již v ISO 639-2.

To znamená, že některé jazyky (např. „Arb“, standardní arabština), které byly podle ISO 639-2 považovány za dialekty jednoho jazyka („ara“), jsou nyní v ISO 639-3 v určitých kontextech považovány za samotné jednotlivé jazyky.

Jedná se o pokus zabývat se odrůdami, které se mohou od sebe jazykově odlišovat, ale jejich mluvčí s nimi zacházejí jako se dvěma formami stejného jazyka, např. v případech diglosie.

Například:

Vidět[11] pro úplný seznam.

Kolektivní jazyky

"Prvek kódu kolektivního jazyka je identifikátor, který představuje skupinu jednotlivých jazyků, které se v žádném kontextu použití nepovažují za jeden jazyk."[12] Tyto kódy nepředstavují přesně konkrétní jazyk nebo makrojazyk.

Zatímco ISO 639-2 obsahuje třípísmenné identifikátory pro kolektivní jazyky, tyto kódy jsou z ISO 639-3 vyloučeny. ISO 639-3 proto není nadmnožinou ISO 639-2.

ISO 639-5 definuje třípísmenné kolektivní kódy pro jazykové rodiny a skupiny, včetně kolektivních jazykových kódů z ISO 639-2.

Speciální kódy

V něm jsou vyčleněny čtyři kódy ISO 639-2 a ISO 639-3 pro případy, kdy žádný ze specifických kódů není vhodný. Jsou určeny především pro aplikace, jako jsou databáze, kde je vyžadován kód ISO bez ohledu na to, zda existuje.

  • mis (nekódované jazyky, původně zkratka pro „Miscellaneous“) je určena pro jazyky, které (dosud) nebyly zahrnuty do normy ISO.
  • mul (více jazyků) je určen pro případy, kdy data obsahují více než jeden jazyk a (například) databáze vyžaduje jeden kód ISO.
  • und (neurčeno) je určen pro případy, kdy jazyk v datech nebyl identifikován, například když je nesprávně označen nebo nikdy nebyl označen. Není určen pro případy, jako je trojský kde byl neověřený jazyk pojmenován.
  • zxx (žádný jazykový obsah / není relevantní) je určen pro data, která vůbec nejsou jazykem, jako jsou hovory se zvířaty.[13]

Kromě toho 520 kódů v rozsahu qaaqtz jsou „vyhrazeny pro místní použití“. Například Seznam lingvistů používá je pro vyhynulé jazyky. Seznam lingvistů přidělil jednomu z nich obecnou hodnotu: qnp, nejmenovaný proto-jazyk. Používá se pro navrhované mezilehlé uzly v rodokmenu, které nemají žádný název.

Procesy údržby

Tabulka kódů pro ISO 639-3 je otevřena změnám. Z důvodu ochrany stability stávajícího použití jsou povolené změny omezeny na:[14]

  • úpravy referenčních informací k záznamu (včetně názvů nebo kategorizací pro typ a rozsah),
  • přidání nových záznamů,
  • ukončení podpory duplikátů nebo falešných záznamů,
  • - sloučení jedné nebo více položek do jiné položky a -
  • rozdělení existujícího záznamu jazyka do několika záznamů nového jazyka.

Kód přiřazený jazyku se nezmění, pokud nedojde také ke změně denotace.[15]

Změny se provádějí v ročním cyklu. Každá žádost má pro veřejnou kontrolu minimální dobu tří měsíců.

Web ISO 639-3 obsahuje stránky, které popisují „rozsah denotace“[16] (mdlý typy) a typy jazyků,[17] které vysvětlují, jaké pojmy jsou v rozsahu pro kódování a určitá kritéria, která je třeba splnit. Například konstruované jazyky lze kódovat, ale pouze pokud jsou navrženy pro lidskou komunikaci a mají řadu literatury zabraňující žádostem o idiosynkratické vynálezy.

Pokyny registrační autority na jejích webových stránkách jsou uvedeny v textu normy ISO 639-3 týkající se způsobu údržby kódových tabulek.[18] Také dokumentuje procesy používané pro příjem a zpracování žádostí o změnu.[19]

K dispozici je formulář žádosti o změnu a existuje druhý formulář pro shromažďování informací o navrhovaných dodatcích. Žádost o změnu může odeslat kterákoli strana. Po odeslání žádosti nejprve zkontroluje úplnost registračního orgánu.

Po přijetí plně zdokumentovaného požadavku se přidá do publikovaného rejstříku požadavků na změny. Oznámení se také zasílají na obecný seznam diskusí LINGUISTŮ v seznamu lingvistů a na další seznamy, které registrační úřad může považovat za relevantní, s výzvou k veřejné kontrole a vstupu k požadované změně. Kterýkoli vlastník nebo jednotlivec seznamu může požadovat oznámení o požadavcích na změnu pro konkrétní regiony nebo jazykové rodiny. Přijaté komentáře se zveřejní, aby je mohly ostatní strany zkontrolovat. Na základě konsensu v obdržených komentářích může být žádost o změnu stažena nebo povýšena na „status kandidáta“.

Tři měsíce před koncem ročního kontrolního cyklu (obvykle v září) je nastaveno oznámení na diskusní seznam LINGUISTŮ a další seznamy týkající se žádostí o změnu stavu kandidáta. Všechny žádosti zůstávají otevřené ke kontrole a komentování až do konce ročního cyklu přezkumu.

Rozhodnutí jsou oznamována na konci ročního kontrolního cyklu (obvykle v lednu). V té době mohou být žádosti zcela nebo zčásti přijaty, pozměněny a přeneseny do dalšího kontrolního cyklu nebo zamítnuty. Odmítnutí často zahrnují návrhy, jak upravit návrhy na opětovné podání. Veřejný archiv každé žádosti o změnu je udržován spolu s přijatými rozhodnutími a zdůvodněním rozhodnutí.[20]

Kritika

Lingvisté Morey, Post a Friedman vznášejí různé kritiky ISO 639, zejména ISO 639-3:[15]

  • Samotné třípísmenové kódy jsou problematické, protože i když jsou oficiálně libovolné technické štítky, jsou často odvozeny od mnemotechnických zkratek pro názvy jazyků, z nichž některé jsou pejorativní. Například, Yemsa byl přidělen kód jnj, z pejorativního „Janejero“. Tyto kódy tedy mohou být rodilými mluvčími považovány za urážlivé, avšak kódy ve standardu, jakmile jsou přiřazeny, již nelze změnit.
  • Správa standardu je problematická, protože SIL je misionářská organizace s nedostatečnou transparentností a odpovědností. Rozhodnutí o tom, co si zaslouží být zakódováno jako jazyk, se přijímají interně. Zatímco vnější vstupy mohou, ale nemusí být vítány, samotná rozhodnutí jsou neprůhledná a mnoho lingvistů se vzdalo snahy o zlepšení standardu.
  • Trvalá identifikace jazyka je nekompatibilní se změnou jazyka.
  • Jazyky a dialekty často nelze přesně rozlišovat a kontinuum dialektu lze rozdělit mnoha způsoby, zatímco standardní privileguje jednu volbu. Takové rozdíly jsou často založeny na sociálních a politických faktorech.
  • ISO 639-3 může být nepochopeno a zneužito orgány, které rozhodují o identitě a jazyce lidí, čímž ruší právo mluvčích identifikovat nebo se ztotožnit s jejich rozmanitostí řeči. Ačkoli je SIL na takové problémy citlivý, je tento problém inherentní povaze zavedené normy, kterou lze použít (nebo nesprávně použít) způsoby, které ISO a SIL nezamýšlejí.

Martin Haspelmath souhlasí se čtyřmi z těchto bodů, ale nikoli s bodem o změně jazyka.[21] Nesouhlasí, protože jakýkoli popis jazyka vyžaduje jeho identifikaci, a my můžeme snadno identifikovat různé etapy jazyka. Navrhuje, aby lingvisté mohli upřednostňovat kodifikaci provedenou na mdlý úroveň, protože „lingvistům málokdy záleží na tom, zda to, o čem mluví, je jazyk, dialekt nebo blízká rodina jazyků.“ Také se ptá, zda je vhodný standard ISO pro jazykovou identifikaci, protože ISO je průmyslová organizace, zatímco jazykovou dokumentaci a nomenklaturu považuje za vědecké úsilí. Cituje původní potřebu standardizovaných jazykových identifikátorů jako „ekonomický význam překladu a lokalizace softwaru „„ pro které účely byly stanoveny normy ISO 639-1 a 639-2. Ale vzbuzuje pochybnosti o průmyslové potřebě komplexního pokrytí poskytovaného normou ISO 639-3, včetně „málo známých jazyků malých komunit, které jsou nikdy nebo jen stěží použit v písemné formě a často jim hrozí vyhynutí “.

Používání

Reference

  1. ^ A b „Stav ISO 639-3 a abstrakt“. iso.org. 2010-07-20. Citováno 2012-06-14.
  2. ^ „Údržbové agentury a registrační orgány“. ISO.
  3. ^ "Typy jednotlivých jazyků - starověké jazyky". sil.org. Citováno 2018-06-11.
  4. ^ Zpráva Ethnologue pro kód ISO 639: zho Archivováno 2014-09-12 na Wayback Machine na ethnologue.com
  5. ^ ISO639-3 na SIL.org
  6. ^ A b „Sada kódů ISO 639-3“. Sil.org. 18. 10. 2007. Citováno 2012-06-14.
  7. ^ „ISO 639-3“. sil.org.
  8. ^ „Rozsah označení: jednotlivé jazyky“. sil.org.
  9. ^ „Rozsah označení: dialekty“. sil.org.
  10. ^ „Rozsah označení: Makrolanguages“. sil.org. Citováno 2012-06-14.
  11. ^ „Mapování makroglangů“. sil.org. Citováno 2012-06-14.
  12. ^ „Rozsah označení: kolektivní jazyky“. sil.org. Citováno 2012-06-14.
  13. ^ Polní záznamy hovorů opice kočkodani. Zápis do katalogu Konsorcium jazykových dat. Citováno 2012-09-04.
  14. ^ „Odeslání požadavků na změnu ISO 639-3: Typy změn“. sil.org.
  15. ^ A b Morey, Stephen; Post, Mark W .; Friedman, Victor A. (2013). Kódy jazyků ISO 639: Předčasná, nakonec nedosažitelná a možná škodlivá standardizace. Konference RRR PARADISEC. Archivovány od originál dne 2016-02-23. Citováno 2015-11-03.
  16. ^ „Rozsah označení pro jazykové identifikátory“. sil.org.
  17. ^ „Druhy jazyků“. sil.org.
  18. ^ „ISO 639-3 Management změn“. sil.org.
  19. ^ „Odesílání požadavků na změnu ISO 639-3“. sil.org.
  20. ^ „Index požadavků na změnu ISO 639-3“. sil.org.
  21. ^ Martin Haspelmath, „Může být jazyková identita standardizována? Na základě kritiky ISO 639-3 Morey et al.“, Komentář k lingvistice rozmanitosti, 2013/12/04
  22. ^ „OLAC Language Extension“. language-archives.org. Citováno 3. srpna 2015.
  23. ^ „Více než 7 000 jazyků, pouze 1 Windows“. Microsoft. 05.02.2014.
  24. ^ „Zásady jazykových návrhů“. wikimedia.org. Citováno 3. srpna 2015.
  25. ^ „BCP 47 - značky pro identifikaci jazyků“. ietf.org. Citováno 3. srpna 2015.
  26. ^ A b „Publikace EPUB 3.0“. idpf.org. Citováno 3. srpna 2015.
  27. ^ „Podmínky metadat DCMI“. purl.org. Citováno 3. srpna 2015.
  28. ^ „Dvoupísmenné nebo třípísmenné kódy jazyka ISO“. w3.org. Citováno 3. srpna 2015.
  29. ^ "Jazykový registr". Iana.org. Citováno 2015-08-12.
  30. ^ „3 Sémantika, struktura a rozhraní API dokumentů HTML - HTML5“. w3.org. Citováno 3. srpna 2015.
  31. ^ „Elements - MODS User Guidelines: Metadata Object Description Schema: MODS (Library of Congress)“. loc.gov. Citováno 3. srpna 2015.
  32. ^ „TEI element language“. tei-c.org. Citováno 3. srpna 2015.

Další čtení

externí odkazy