Internacionalizace a lokalizace - Internationalization and localization - Wikipedia

Screenshot z TDE softwarové programy většinou lokalizované do Čínština (tradiční).

v výpočetní, internacionalizace a lokalizace (americký ) nebo internacionalizace a lokalizace (BrE ), často zkráceně i18n a L10n,[Citace je zapotřebí ] jsou prostředky přizpůsobení počítačový software do různých jazyků, regionálních zvláštností a technických požadavků cílového národního prostředí.[1] Internacionalizace je proces navrhování softwarové aplikace tak, aby ji bylo možné přizpůsobit různým jazykům a regionům bez technických změn. Lokalizace je proces přizpůsobení internacionalizovaného softwaru pro konkrétní region nebo jazyk překladem textu a přidáním národní prostředí -specifické komponenty. Lokalizace (která se potenciálně provádí vícekrát, pro různá národní prostředí) využívá infrastrukturu nebo flexibilitu poskytovanou internacionalizací (která se ideálně provádí pouze jednou před lokalizací nebo jako nedílná součást probíhajícího vývoje).[2]

Pojmenování

Termíny jsou často zkráceny na numeronyma i18n (kde 18 znamená počet písmen mezi prvními i a poslední n ve slově internacionalizace, použití vytvořeno na Digital Equipment Corporation v 70. nebo 80. letech)[3][4] a L10n pro lokalizace, vzhledem k délce slov.[5][6] Někteří autoři mají druhou zkratku vypsanou velkými písmeny, aby pomohli tyto dvě odlišit.[7]

Některé společnosti, jako IBM a Věštec, použijte výraz globalizace, g11n, pro kombinaci internacionalizace a lokalizace.[8]

Microsoft definuje internacionalizaci jako kombinaci připravenosti na svět a lokalizace. Světová připravenost je úkol pro vývojáře, který umožňuje použití produktu s více skripty a kulturami (globalizace) a oddělení prostředků uživatelského rozhraní v lokalizovatelném formátu (lokalizovatelnost, zkráceně na L12y).[9][10]

Hewlett Packard a HP-UX vytvořil systém s názvem „Podpora národního jazyka“ nebo „Podpora přirozeného jazyka“ (NLS), aby vytvořil lokalizovatelný software.[1]

Rozsah

Proces internacionalizace a lokalizace
(na základě tabulky z LISA webová stránka)

Podle Software bez hranic, aspekty designu, které je třeba vzít v úvahu při internacionalizaci produktu, jsou „kódování dat, data a dokumentace, konstrukce softwaru, podpora hardwarových zařízení, interakce uživatele“; zatímco klíčové oblasti designu, které je třeba vzít v úvahu při výrobě zcela internacionalizovaného produktu od začátku, jsou „interakce uživatele, návrh algoritmu a datové formáty, softwarové služby, dokumentace“.[1]

Překlad je obvykle časově nejnáročnější složkou jazyková lokalizace.[1] To může zahrnovat:

  • U filmu, videa a zvuku, překladu mluvených slov nebo hudebních textů, často s použitím obou dabing nebo titulky
  • Překlad textu pro tištěné materiály, digitální média (případně včetně chybových zpráv a dokumentace)
  • Potenciální změna obrázků a log obsahujících text tak, aby obsahovala překlady nebo obecné ikony[1]
  • Různá délka překladu a rozdíly ve velikosti znaků (např. Mezi latinka dopisy a čínské postavy ) může způsobit, že rozložení, která dobře fungují v jednom jazyce, budou fungovat špatně v ostatních[1]
  • Zohlednění rozdílů v dialekt, Registrovat nebo odrůda[1]
  • Konvence psaní jako:

Standardní národní data

Počítačový software může narazit na rozdíly nad rámec přímého překladu slov a frází, protože počítačové programy mohou generovat obsah dynamicky. Je možné, že tyto rozdíly bude třeba zohlednit v procesu internacionalizace při přípravě překladu. Mnoho z těchto rozdílů je tak pravidelných, že lze snadno automatizovat převod mezi jazyky. The Společné datové úložiště národního prostředí podle Unicode poskytuje soubor takových rozdílů. Jeho data používá major operační systémy, počítaje v to Microsoft Windows, Operační Systém Mac a Debian, a významnými internetovými společnostmi nebo projekty, jako je Google a Wikimedia Foundation. Mezi příklady těchto rozdílů patří:

  • Různé „skripty“ v různých psací systémy použít různé postavy - jiná sada písmen, syllogramů, logogramů nebo symbolů. Moderní systémy používají Unicode standard reprezentovat mnoho různých jazyků v jednom Kódování znaků.
  • Směr psaní je zleva doprava ve většině evropských jazyků, zprava doleva v hebrejštině a arabštině nebo obojí v boustrofedon skripty a v některých asijských jazycích volitelně vertikální.[1]
  • Složité rozložení textu, pro jazyky, kde znaky mění tvar v závislosti na kontextu
  • V některých skriptech existuje velká písmena, v jiných nikoli
  • Různé jazyky a systémy psaní se liší třídění textu pravidla
  • Různé jazyky mají různé číselné soustavy, které možná bude nutné podporovat, pokud Západní arabské číslice nejsou používány
  • Různé jazyky mají různá pravidla pluralizace, což může komplikovat programy, které dynamicky zobrazují číselný obsah.[11] Mohou se také lišit další pravidla gramatiky, např. genitiv.
  • Různé jazyky používají různé interpunkční znaménka (např. Citace textu pomocí uvozovek ("") jako v angličtině nebo guillemets («») Jako ve francouzštině)
  • Klávesové zkratky může používat pouze tlačítka, která jsou skutečně na rozložení klávesnice který je lokalizován pro. Pokud zkratka odpovídá slovu v konkrétním jazyce (např. Ctrl-s znamená „uložit“ v angličtině), bude pravděpodobně nutné jej změnit.[12]

Národní úmluvy

Různé země mají různé ekonomické konvence, včetně variací v:

Ve většině těchto případů se liší zejména USA a Evropa. Jiné oblasti často následují jednu z nich.

Specifické služby třetích stran, jako jsou online mapy, zprávy o počasí nebo poskytovatelé platebních služeb, nemusí být celosvětově k dispozici od stejných dopravců nebo vůbec.

Časová pásma se liší po celém světě, a to je třeba vzít v úvahu, pokud produkt původně komunikoval pouze s lidmi v jednom časovém pásmu. Pro internacionalizaci UTC se často používá interně a poté se pro účely zobrazení převede na místní časové pásmo.

Různé země mají různé právní požadavky, což znamená například:

Lokalizace také může brát v úvahu rozdíly v kultuře, například:

Obchodní proces pro internacionalizaci softwaru

V následujících situacích internacionalizovat produktu, je důležité podívat se na různé trhy, na které produkt v dohledné době vstoupí.[1] Podrobnosti, jako je délka pole pro poštovní adresy, jedinečný formát adresy, možnost volit pole poštovního směrovacího čísla pro adresy zemí, které nemají poštovní směrovací čísla, nebo pole stavu pro země, které nemají státy, plus zavedení nové registrace toky, které dodržují místní zákony, jsou jen některé z příkladů, díky nimž je internacionalizace komplexním projektem.[7][16] Širší přístup zohledňuje kulturní faktory týkající se například přizpůsobení logiky obchodního procesu nebo zahrnutí jednotlivých kulturních (behaviorálních) aspektů.[1][17]

Již v 90. letech 20. století společnosti jako Býk použitý strojový překlad (Systran ) ve velkém měřítku, za veškerou jejich překladatelskou činnost: překladatelé prováděli předběžné úpravy (aby byl vstupní stroj čitelný) a post-editace.[1]

Inženýrství

Jak při přepracování stávajícího softwaru, tak při navrhování nového internacionalizovaného softwaru je prvním krokem internacionalizace rozdělení každé části potenciálně závislé na místním nastavení (ať už kódu, textu nebo dat) do samostatného modulu.[1] Každý modul pak může buď spoléhat na standardní knihovnu / závislost, nebo může být podle potřeby pro každé národní prostředí nezávisle nahrazen.

Aktuální převládající praxí je, že aplikace umísťují text do řetězců prostředků, které se podle potřeby načítají během provádění programu.[1] Tyto řetězce uložené v souborech prostředků lze přeložit relativně snadno. Programy jsou často vytvářeny tak, aby odkazovaly na knihovny zdrojů v závislosti na vybraných datech národního prostředí.

Úložiště pro přeložitelné a přeložené řetězce se někdy nazývá katalog zpráv[1] protože řetězce se nazývají zprávy. Katalog obecně obsahuje sadu souborů ve specifickém lokalizačním formátu a standardní knihovnu pro zpracování uvedeného formátu. Jeden softwarová knihovna a formát, který tomu napomáhá gettext.

Tedy k získání aplikace podporující více jazyků by bylo možné navrhnout aplikaci tak, aby za běhu vybrala příslušný zdrojový soubor jazyka. Kód vyžadovaný ke správě ověřování zadávání dat a mnoho dalších typů dat citlivých na národní prostředí také musí podporovat odlišné požadavky na národní prostředí. Moderní vývojové systémy a operační systémy zahrnují sofistikované knihovny pro mezinárodní podporu těchto typů, viz také Standardní národní data výše.

Mnoho problémů s lokalizací (např. Směr psaní, třídění textu) vyžaduje hlubší změny v softwaru než překlad textu. Například, OpenOffice.org toho dosahuje kompilačními přepínači.

Proces

Metoda globalizace zahrnuje po plánování tři implementační kroky: internacionalizace, lokalizace a zajištění kvality.[1]

Do určité míry (např zajištění kvality ), vývojové týmy zahrnují někoho, kdo zvládá základní / centrální fáze procesu, které pak umožňují všechny ostatní.[1] Tito lidé obvykle rozumějí cizím jazykům a kulturám a mají určité technické zázemí. Specializovaní techničtí autoři jsou povinni vytvořit kulturně vhodnou syntaxi pro potenciálně komplikované koncepty spolu s technickými prostředky pro nasazení a testování prvků lokalizace.

Jakmile bude software správně internacionalizován, může se při lokalizaci spolehnout na decentralizovanější modely: bezplatný open source software obvykle spoléhají na vlastní lokalizaci koncových uživatelů a dobrovolníků, někdy organizovaných v týmech.[18] The KDE3 projekt byl například přeložen do více než 100 jazyků;[19] MediaWiki ve 270 jazycích, z toho 100 většinou úplných od roku 2016.[20]

Při překladu existujícího textu do jiných jazyků je obtížné udržovat paralelní verze textů po celou dobu životnosti produktu.[21] Například pokud dojde ke změně zprávy zobrazené uživateli, je nutné změnit všechny přeložené verze.

Obchodní úvahy

V komerčním prostředí je výhodou lokalizace přístup na více trhů. Na začátku 80. let Lotus 1-2-3 trvalo dva roky, než se oddělil programový kód a text, a ztratil vedoucí postavení na evropském trhu Microsoft Multiplan.[1] Společnost MicroPro zjistila, že použití rakouského překladače pro západoněmecký trh způsobilo jeho WordStar výkonný ředitel řekl, že „nemá tón, jaký měl mít“.[22]

S tím však souvisejí značné náklady, které jdou daleko za rámec strojírenství. Dále se obchodní operace musí přizpůsobit řízení výroby, skladování a distribuce několika diskrétních lokalizovaných produktů, které se často prodávají ve zcela odlišných měnách, regulačních prostředích a daňových režimech.

A konečně musí prodejní, marketingová a technická podpora také usnadnit jejich vlastní provoz v nových jazycích, aby podpořili zákazníky pro lokalizované produkty. Zejména pro relativně malé jazykové populace nemusí být nikdy ekonomicky výhodné nabídnout lokalizovaný produkt. I když velké jazykové populace mohou ospravedlnit lokalizaci pro daný produkt a vnitřní struktura produktu již umožňuje lokalizaci, danému softwarovému vývojáři nebo vydavateli může chybět velikost a propracovanost pro správu pomocných funkcí spojených s provozem ve více národních prostředích.

Viz také

Reference

  1. ^ A b C d E F G h i j k l m n Ó str q Patrick A.V. Sál; Martyn A. Ould, eds. (1996). Software bez hranic: multiplatformní, multikulturní a mnohonárodnostní přístup. S příspěvky a vedením Ray Hudson, Costas Spyropoulos, Timo Honkela a kol. Wiley. ISBN  978-0-471-96974-7.
  2. ^ Bert Esselink (2003). Evoluce lokalizace (PDF). Průvodce lokalizací. Vícejazyčné výpočty a technologie. Archivovány od originál (PDF) dne 07.09.2012. Stručně řečeno, lokalizace se točí kolem kombinování jazyka a technologie k výrobě produktu, který může překonat kulturní a jazykové bariéry. Nic víc, nic míň.
  3. ^ "Glosář W3C žargonu". World Wide Web Consortium. Citováno 2008-10-13.
  4. ^ „Původ zkratky I18n“.
  5. ^ „Lokalizace vs. internacionalizace“. World Wide Web Consortium.
  6. ^ „GNU gettext utilities: Concepts“. Projekt GNU. Archivovány od originál dne 18. září 2019. Citováno 29. října 2019. Když hovoříme o podpoře mateřského jazyka v programech, objevují se po celou dobu dvě dlouhá slova a tato slova mají přesný význam, který stojí za to zde v tomto dokumentu jednou provždy vysvětlit. Jde o internacionalizaci a lokalizaci. Mnoho lidí, unavených opakováním těchto dlouhých slov, si zvyklo místo toho psát i18n a l10n, citovat první a poslední písmeno každého slova a nahradit mezilehlá písmena číslem, které pouze řeklo, kolik takových písmen existují.
  7. ^ A b alan (2011-03-29). „Co je to internacionalizace (i18n), lokalizace (L10n) a globalizace (g11n)“. Archivovány od originál dne 02.04.2015. Velké písmeno L v L10n ho pomáhá odlišit od malých písmen i v i18n.
  8. ^ „Globalizace IBM“. 17. března 2016. Archivovány od originál dne 31.03.2016.
  9. ^ „Globalizace krok za krokem“. Archivovány od originál dne 12. 4. 2015.
  10. ^ „Globalizace krok za krokem: porozumění internacionalizaci“. Archivovány od originál dne 2015-05-26.
  11. ^ „GNU gettext utilities: Plurální formy“.
  12. ^ languagetranslationsservices.wordpress.com Archivováno 3. dubna 2015, na Wayback Machine
  13. ^ Haider, M. (17. května 2016). „Pákistán vyjadřuje znepokojení nad kontroverzním zákonem o mapách Indie'". Svítání. Pakistan Herald Publication (Pvt.) Ltd. Citováno 9. května 2018.
  14. ^ Hamdani, Y.L. (18. května 2016). „Změna map neznamená, že Kašmír je vaší součástí, Indie.“. Blogy Express Tribune. Express Tribune News Network. Citováno 9. května 2018.
  15. ^ Madrad Courier (24. července 2017). „Přehled zákona o regulaci geoprostorových informací“. Kurýr Madras. Vipra Holdings Ltd.. Citováno 9. května 2018.
  16. ^ „Formáty mezinárodní adresy“. Microsoft Developer Network. Microsoft. Citováno 10. prosince 2013.
  17. ^ Pawlowski, J.M. (2008): Profily kultury: Usnadnění globálního učení a sdílení znalostí. Proc. ICCE 2008, Tchaj-wan, listopad 2008. Konceptová verze
  18. ^ Reina, Laura Arjona; Robles, Gregorio; González-Barahona, Jesús M. (2013-06-25). Petrinja, Etiel; Succi, Giancarlo; Ioini, Nabil El; Sillitti, Alberto (eds.). Předběžná analýza lokalizace ve svobodném softwaru: Jak se provádějí překlady. Pokrok IFIP v oblasti informačních a komunikačních technologií. Springer Berlin Heidelberg. str. 153–167. doi:10.1007/978-3-642-38928-3_11. ISBN  978-3-642-38927-6.
  19. ^ Aktuální seznam viz KDE.org
  20. ^ „Translations: Group statistics - translatewiki.net“.
  21. ^ „Jak přeložit hru do 20 jazyků a vyhnout se peklu“.
  22. ^ Schrage, Michael (1985-02-17). „IBM získává dominanci na evropském počítačovém trhu“. Washington Post. ISSN  0190-8286. Citováno 2018-08-29.

Další čtení

  • .NET Internationalization: The Developer's Guide to Building Global Windows and Web Applications, Guy Smith-Ferrier, Addison-Wesley Professional, 7. srpna 2006. ISBN  0-321-34138-4
  • Praktický průvodce lokalizací, Bert Esselink, John Benjamins Publishing, [2000]. ISBN  1-58811-006-0
  • Lydia Ash: Web Testing Companion: The Insider's Guide to Efficient and Effective Tests, Wiley, 2. května 2003. ISBN  0-471-43021-8
  • Podnikání bez hranic: Strategický průvodce globálním marketingem, Donald A. DePalma, Globa Vista Press [2004]. ISBN  978-0-9765169-0-3

externí odkazy