Mezera znak - Whitespace character
v programování, mezery je jakýkoli charakter nebo řada znaků, které představují vodorovně nebo svisle prostor v typografie. Při vykreslení znak mezery neodpovídá viditelné značce, ale obvykle zabírá oblast na stránce. Například společný bílý znak U + 0020 PROSTOR (taky ASCII 32) představuje a prázdné místo interpunkční znak v textu, používaný jako a rozdělovač slov v západní skripty.
Přehled

U mnoha rozvržení klávesnice lze zadat vodorovný prázdný znak pomocí a mezerník. Horizontální mezery lze také zadat na mnoha klávesnicích pomocí Záložka ↹ klíč, i když se délka prostoru může lišit. Vertikální prázdné znaky jsou trochu rozmanitější, pokud jde o způsob jejich kódování, ale nejzřetelnější při psaní je ↵ Vstupte výsledek, který v aplikačních programech vytvoří sekvenci kódu „nového řádku“. Místo toho by mohly říkat starší klávesnice Vrátit se, zkrácená na klávesnici psacího stroje, což znamená „Carriage-Return“, který vygeneroval elektromechanický návrat k levému dorazu (CR kód v ASCII-hex & 0D;) a posun řádku nebo přechod na další řádek (kód LF v ASCII-hex & 0A;); v některých aplikacích se tyto nezávisle používaly k kreslení displejů založených na textových buňkách na monitorech nebo k tisku na tiskárnách s naváděním traktoru - které by mohly také obsahovat reverzní pohyby / sekvence kódů umístění umožňující textovým výstupním zařízením dosáhnout složitějšího výstupu. Mnoho časných počítačových her používalo tyto kódy k vykreslení obrazovky (např. Království Kroz ) a software pro zpracování textu by to použil k výrobě tištěných efektů, jako jsou tučné písmo, podtržení a přeškrtnutí.
Termín „mezery“ je založen na výsledném vzhledu obyčejného papír. Jsou však kódovány uvnitř aplikace, mezery mohou být zpracovány stejně jako jakýkoli jiný znakový kód a programy mohou provádět správnou akci, jak je definována pro kontext, ve kterém se vyskytují.
Definice a dvojznačnost
Nejběžnější mezery lze zadávat pomocí mezerník nebo klávesa tab. V závislosti na kontextu, zalomení řádku generované návratem nebo zadejte klíč lze také považovat za mezeru.
Unicode
V následující tabulce je uvedeno dvacet pět znaků definovaných jako mezery („WSpace = Y“, „WS“) znaky v Unicode Databáze znaků.[1] Sedmnáct používá definici mezer konzistentní s algoritmem pro obousměrné psaní („Obousměrný typ znaků = WS“) a jsou známé jako znaky „Bidi-WS“. Lze použít i zbývající znaky, ale nejsou tohoto typu „Bidi“.
Poznámka: V závislosti na prohlížeči a použitých písmech k zobrazení následující tabulky se nemusí všechny mezery zobrazit správně.
název | Kódový bod | Šířka pole | Může se zlomit ? | v IDN ? | Skript | Blok | Všeobecné kategorie | Poznámky | |
---|---|---|---|---|---|---|---|---|---|
tabulka znaků | U + 0009 | 9 | Ano | Ne | Běžný | Základní latinka | Jiný, řízení | HT, Horizontální tab. HTML / XML pojmenovaná entita: & Tab; , Latex: ' tab' | |
posuv řádku | U + 000A | 10 | Je konec řádku | Běžný | Základní latinka | Jiný, řízení | LF, Posuv řádku. HTML / XML pojmenovaná entita: &Nový řádek; | ||
řádkování | U + 000B | 11 | Je konec řádku | Běžný | Základní latinka | Jiný, řízení | VT, Vertikální tab | ||
krmivo formuláře | U + 000C | 12 | Je konec řádku | Běžný | Základní latinka | Jiný, řízení | FF, Krmivo pro formuláře | ||
návrat vozíku | U + 000D | 13 | Je konec řádku | Běžný | Základní latinka | Jiný, řízení | ČR, Návrat vozíku | ||
prostor | U + 0020 | 32 | Ano | Ne | Běžný | Základní latinka | Oddělovač, prostor | Nejběžnější (normální prostor ASCII) | |
další řádek | U + 0085 | 133 | Je konec řádku | Běžný | Latinka-1 Doplněk | Jiný, řízení | NEL, Další řádek | ||
prostor bez přestávky | U + 00A0 | 160 | Ne | Ne | Běžný | Latinka-1 Doplněk | Oddělovač, prostor | Nerozbitný prostor: shodné s U + 0020, ale ne bod, ve kterém může být čára přerušena. HTML / XML pojmenovaná entita: & nbsp; LaTeX: '\ ' | |
ogham mezera | U + 1680 | 5760 | Ano | Ne | Ogham | Ogham | Oddělovač, prostor | Používá interword separace v Ogham text. Normálně svislá čára ve svislém textu nebo vodorovná čára ve vodorovném textu, ale může to být také prázdné místo v písmech bez stopky. Vyžaduje písmo Ogham. | |
en quad | U + 2000 | 8192 | Ano | Ne | Běžný | Všeobecné Interpunkce | Oddělovač, prostor | Šířka jedné en. U + 2002 je kanonicky ekvivalentní tomuto znaku; U + 2002 je preferován. | |
em quad | U + 2001 | 8193 | Ano | Ne | Běžný | Všeobecné Interpunkce | Oddělovač, prostor | Také známý jako „skopové čtyřkolky“. Šířka jedné em. U + 2003 je kanonicky ekvivalentní tomuto znaku; U + 2003 je preferováno. | |
en prostor | U + 2002 | 8194 | Ano | Ne | Běžný | Všeobecné Interpunkce | Oddělovač, prostor | Také známý jako „ořech“. Šířka jedné en. U + 2000 En Quad je kanonicky ekvivalentní tomuto znaku; U + 2002 je preferován. HTML / XML pojmenovaná entita: & ensp; LaTeX: ' enspace' | |
em prostor | U + 2003 | 8195 | Ano | Ne | Běžný | Všeobecné Interpunkce | Oddělovač, prostor | Také známý jako „skopové maso“. Šířka jedné em. U + 2001 Em Quad je kanonicky ekvivalentní tomuto znaku; U + 2003 je preferováno. HTML / XML pojmenovaná entita: & emsp; , LaTeX: ' quad' | |
prostor tři na jednoho | U + 2004 | 8196 | Ano | Ne | Běžný | Všeobecné Interpunkce | Oddělovač, prostor | Také známý jako „hustý prostor“. Jedna třetina široká. HTML / XML pojmenovaná entita: & emsp13; | |
prostor čtyři na jednoho | U + 2005 | 8197 | Ano | Ne | Běžný | Všeobecné Interpunkce | Oddělovač, prostor | Také známý jako „střed vesmíru“. Jedna čtvrtina z nich je široká. HTML / XML pojmenovaná entita: & emsp14; | |
šest na jednoho prostoru | U + 2006 | 8198 | Ano | Ne | Běžný | Všeobecné Interpunkce | Oddělovač, prostor | Jedna šestina široká. V počítačové typografii se někdy rovná U + 2009. | |
figurální prostor | U + 2007 | 8199 | Ne | Ne | Běžný | Všeobecné Interpunkce | Oddělovač, prostor | Prostor obrázku. Ve fontech s jednotnými číslicemi, která se rovná šířce jedné číslice. HTML / XML pojmenovaná entita: & numsp; | |
interpunkční prostor | U + 2008 | 8200 | Ano | Ne | Běžný | Všeobecné Interpunkce | Oddělovač, prostor | Široká jako úzká interpunkce v písmu, tj. Šířka posunu tečky nebo čárky.[2] HTML / XML pojmenovaná entita: & puncsp; | |
tenký prostor | U + 2009 | 8201 | Ano | Ne | Běžný | Všeobecné Interpunkce | Oddělovač, prostor | Tenký prostor; jedna pětina (někdy jedna šestina) široké. Doporučeno pro použití jako oddělovač tisíců pro opatření provedená s SI jednotky. Na rozdíl od U + 2002 až U + 2008 se jeho šířka může při sazbě upravit.[3] HTML / XML pojmenovaná entita: & thinsp; ; LaTeX: ',' | |
vlasový prostor | U + 200A | 8202 | Ano | Ne | Běžný | Všeobecné Interpunkce | Oddělovač, prostor | Tenčí než tenký prostor. HTML / XML pojmenovaná entita: & hairsp; (nefunguje ve všech prohlížečích) | |
oddělovač řádků | U + 2028 | 8232 | Je konec řádku | Běžný | Všeobecné Interpunkce | Oddělovač, čára | |||
oddělovač odstavců | U + 2029 | 8233 | Je konec řádku | Běžný | Všeobecné Interpunkce | Oddělovač, odstavec | |||
úzký prostor bez přerušení | U + 202F | 8239 | Ne | Ne | Běžný | Všeobecné Interpunkce | Oddělovač, prostor | Úzký prostor bez přerušení. Podobná funkce jako U + 00A0 No-Break Space. Při použití s mongolštinou je jeho šířka obvykle jedna třetina normálního prostoru; v jiných souvislostech se jeho šířka někdy podobá šířce Tenký prostor (U + 2009). | |
střední matematický prostor | U + 205F | 8287 | Ano | Ne | Běžný | Všeobecné Interpunkce | Oddělovač, prostor | MMSP. Používá se v matematických vzorcích. Čtyři osmnáctiny em.[4] V matematické typografii jsou šířky mezer obvykle uvedeny v integrálních násobcích osmnáctiny em a 4/18 em může být použito v několika situacích, například mezi A a + a mezi + a b ve výrazu a + b.[5] HTML / XML pojmenovaná entita: & MediumSpace; | |
ideografický prostor | U + 3000 | 12288 | Ano | Ne | Běžný | Symboly CJK a Interpunkce | Oddělovač, prostor | Široký jako a CJK znaková buňka (plná šířka ). Používá se například v tai tou. |
Související znaky Unicode bez vlastnosti White_Space | |||||||||
---|---|---|---|---|---|---|---|---|---|
název | Kódový bod | Šířka pole | Může se zlomit ? | v IDN ? | Skript | Blok | Všeobecné kategorie | Poznámky | |
oddělovač mongolských samohlásek | U + 180E | 6158 | | Ano | Ne | mongolský | mongolský | Jiný, Formát | MVS. Znak malého prostoru, který se v mongolštině používá k tomu, aby poslední dva znaky slova získaly různé tvary.[6] Již není klasifikován jako znak mezery (tj. V kategorii Zs) v Unicode 6.3.0, i když tomu tak bylo v předchozích verzích standardu. |
prostor s nulovou šířkou | U + 200B | 8203 | | Ano | Ne | ? | Všeobecné Interpunkce | Jiný, Formát | ZWSP, prostor nulové šířky. Používá se k označení hranic slov do systémů zpracování textu při použití skriptů, které nepoužívají explicitní mezery. Je to podobné jako u měkká pomlčka, s tím rozdílem, že druhý se používá k označení hranic slabiky, a měl by zobrazit viditelnou pomlčku, když se na ní řádek zalomí. HTML / XML pojmenovaná entita: & ZeroWidthSpace; [7][C] |
nulová šířka bez spojení | U + 200C | 8204 | | Ano | Kontextově závislé[12] | ? | Všeobecné Interpunkce | Jiný, Formát | ZWNJ, nulová šířka bez spojení. Při umístění mezi dva znaky, které by jinak byly spojeny, způsobí ZWNJ, aby byly vytištěny v jejich konečné a počáteční podobě. HTML / XML pojmenovaná entita: & zwnj; |
truhlář s nulovou šířkou | U + 200D | 8205 | | Ano | Kontextově závislé[13] | ? | Všeobecné Interpunkce | Jiný, Formát | ZWJ, truhlář s nulovou šířkou. Při umístění mezi dva znaky, které by jinak nebyly spojeny, způsobí ZWJ jejich tisk v připojených formách. Lze také použít k samostatnému zobrazení spojovacích formulářů. V závislosti na tom, zda se ve výchozím nastavení očekává ligatura nebo spojka, lze buď vyvolat (jako v emodži a v sinhálštině ) nebo potlačit (jako v Devanagari ) substituce jediným glyfem, zatímco stále umožňuje použití jednotlivých spojovacích forem (na rozdíl od ZWNJ). HTML / XML pojmenovaná entita: & zwj; |
slovo truhlář | U + 2060 | 8288 | | Ne | Ne | ? | Všeobecné Interpunkce | Jiný, Formát | WJ, slovo truhlář. Podobně jako U + 200B, ale ne bod, ve kterém může být čára přerušena. HTML / XML pojmenovaná entita: &Bez přestávky; |
nulová šířka nerozbitného prostoru | U + FEFF | 65279 | | Ne | Ne | ? | arabština Prezentace Formuláře-B | Jiný, Formát | Nerozbitný prostor s nulovou šířkou. Používá se především jako Byte Order Mark. Použití jako indikace nerozbitnosti je od Unicode 3.2 zastaralé; místo toho viz U + 2060. |
|
Náhradníci
Unicode také poskytuje některé viditelné znaky, které lze použít k reprezentaci různých znaků mezer v kontextech, kde musí být zobrazen viditelný symbol:
Kód | Desetinný | název | Blok | Zobrazit | Popis |
---|---|---|---|---|---|
U + 00B7 | 183 | Prostřední tečka | Doplněk latinky-1 | · | Interpunct Pojmenovaná entita: & middot; |
U + 21A1 | 8609 | Šipka se dvěma hlavami dolů | Šipky | ↡ | ECMA-17 / ISO 2047 symbol pro podávání formuláře (konec stránky)[15] |
U + 2261 | 8810 | Stejný jako | Matematický Operátoři | ≡ | Mezi další použití patří symbol ECMA-17 / ISO 2047 pro řádkový posuv[15] |
U + 237D | 9085 | Otevřená krabice přes rameno | Různé technické | ⍽ | Používá se k označení a NBSP |
U + 23CE | 9166 | Symbol návratu | Různé technické | ⏎ | Symbol pro a návratový klíč, který zadá zalomení řádku |
U + 2409 | 9225 | Symbol pro vodorovnou tabulku | Ovládací obrázky | ␉ | Nahrazuje znak tabulátoru |
U + 240A | 9226 | Symbol pro posuv řádku | Ovládací obrázky | ␊ | Náhrady za řádek |
U + 240B | 9227 | Symbol pro vertikální tabulku | Ovládací obrázky | ␋ | Náhrady za svislou záložku (řádková záložka) |
U + 240 ° C | 9228 | Symbol pro podávání formuláře | Ovládací obrázky | ␌ | Náhražky za zdroj formuláře (konec stránky) |
U + 240D | 9229 | Symbol pro návrat vozíku | Ovládací obrázky | ␍ | Náhražky za vrácení vozíku |
U + 2420 | 9248 | Symbol pro prostor | Ovládací obrázky | ␠ | Nahrazuje prostor ASCII |
U + 2422 | 9250 | Prázdný symbol | Ovládací obrázky | ␢ | aka „náhradní prázdné místo“,[16] použito v BCDIC,[16] EBCDIC,[16] ASCII-1963[16][17] atd. jako symbol pro oddělovač slov |
U + 2423 | 9251 | Otevřít krabici | Ovládací obrázky | ␣ | Použito v tiskací písmeno rukopis minimálně od 80. let, kdy je nutné výslovně uvést počet mezerových znaků (např. při programování perem a papírem). Používá se v učebnici (vydané 1982, 1984, 1985, 1988, Springer-Verlag) Modula-2,[18] programovací jazyk, kde vesmírné kódy vyžadují výslovnou indikaci. Používá se také na klávesnici[n 1] z Texas Instruments TI-8X série z grafické kalkulačky. Pojmenovaná entita: &prázdný; |
U + 2424 | 9252 | Symbol pro nový řádek | Ovládací obrázky |  | Nahrazuje zalomení řádku |
U + 25B3 | 9651 | Bílý trojúhelník směřující nahoru | Geometrické tvary | △ | Mezi další použití patří symbol ECMA-17 / ISO 2047 pro prostor ASCII[15] |
U + 2A5B | 10843 | Logické Nebo se středním dříkem | Doplňkové Matematický Operátoři | ⩛ | Mezi další použití patří symbol ECMA-17 / ISO 2047 pro svislou záložku (řádková záložka)[15] |
U + 2AAA | 10922 | Menší než | Doplňkové Matematický Operátoři | ⪪ | Mezi další použití patří symbol ECMA-17 / ISO 2047 pro návrat vozíku[15] |
U + 2AAB | 10923 | Větší než | Doplňkové Matematický Operátoři | ⪫ | Mezi další použití patří symbol ECMA-17 / ISO 2047 pro znak tabulátoru[15] |
- ^ Nad nulovým klíčem „0“ nebo záporným „(-)“.
- Přesný prostor
- The Cambridge Z88 poskytl speciální "přesný prostor" (kódový bod 160 aka 0xA0) (vyvolaný klávesovou zkratkou ⌑+PROSTOR,[19]) zobrazený jako „...“ ovladačem displeje operačního systému.[20][21] Proto byl také znám jako „tečkovaný prostor“ ve spojení s BBC BASIC.[20][21]
- Pod kódovým bodem 224 (0xE0) počítač také poskytl speciální symbol SPACE se třemi znaky v celé buňce "SPC" (analogicky k Unicode pro celou buňku U + 2420).[20][21]
Prázdné mezery
- The Braillovo písmo Blok Unicode obsahuje U + 2800 ⠀ BRAILLE PATTERN BLANK (HTML
⠀
), a Braillovo písmo vzor bez vyvýšených teček. Některá písma zobrazují znak jako mezeru s pevnou šířkou, standard Unicode však výslovně uvádí, že nepůsobí jako mezera. - Unicode obsahuje a Hangul Filler znak v Kompatibilita Hangul Jamo blok (U + 3164 ㅤ HANGUL FILLER (HTML
ㅤ
)). Toto je klasifikováno jako písmeno, ale zobrazeno jako prázdné místo, jako blok Hangul bez jamo. Používá se v KS X 1001 Hangul kombinující sekvence, ale ne v kombinujícím systému jamo Unicode.[22]. - Ekvivalentní postava Hangul Jungseong Filler je součástí Blok Hangul Jamo (U + 1160 ᅠ VÝPLŇ HANGUL JUNGSEONG (HTML
ᅠ
))[23]. - Navíc, a Hangul Filler s poloviční šířkou je součástí Formuláře s poloviční a plnou šířkou (U + FFA0 ᅠ PLNICÍ HANGULOVÝ VÝPLNOVÝ VÝPLŇ (HTML
ᅠ
)), který se používá při mapování z kódování, které obsahuje znaky obou Johab (nebo Wansung ) a N-byte Hangul (nebo jeho EBCDIC protějšek), jako je IBM-933, který zahrnuje jak plniva Johab, tak EBCDIC.[24][25]
Mezery a digitální typografie
Zobrazení na obrazovce
Textové editory, textové procesory, a software pro stolní publikování se liší v tom, jak představují mezery na obrazovce a jak představují mezery na koncích řádků delší než šířka obrazovky nebo sloupce. V některých případech jsou mezery zobrazeny jednoduše jako prázdné místo; v ostatních případech je může zastupovat interpunktní nebo jiné symboly. K vytváření mezer lze použít mnoho různých znaků (popsaných níže) a mezery mohou ovlivnit i funkce bez znaků (například nastavení okrajů a záložek).
Univerzální prostor s proměnnou šířkou
V počítači kódování znaků existuje normál univerzální prostor (Znak Unicode U + 0020), jehož šířka se bude lišit v závislosti na designu písma. Typické hodnoty se pohybují od 1/5 em do 1/3 em (v digitální typografii an em se rovná nominální velikosti písma, takže u 10bodového písma bude prostor pravděpodobně mezi 2 a 3,3 body). Sofistikovaná písma mohou mít různě velké mezery pro tučné, kurzíva a malé písmena a často skladatelé ručně upraví šířku mezery v závislosti na velikosti a výtečnosti textu.
Kromě tohoto univerzálního prostoru je možné kódovat prostor určité šířky. V následující tabulce najdete kompletní seznam.
Vlasové mezery kolem pomlček
Em pomlčky používané jako závorky, a en pomlčky jsou-li použity jako slovní spojenci, jsou obvykle nastaveny souvisle s textem.[26] Taková pomlčka však může být volitelně obklopena a vlasový prostor, U + 200A nebo tenký prostor, U + 2009. Vlasový prostor lze zapsat do HTML pomocí odkazy na číselné znaky & # x200A;
nebo  
nebo pojmenovaná entita & hairsp;
, ale od roku 2016 dosud není v prohlížečích všeobecně podporována.[Aktualizace][který? ] The tenký prostor je pojmenovaná entita & thinsp;
a číselné odkazy & # x2009;
nebo  
. Tyto prostory jsou mnohem tenčí než normální prostor (kromě a jednoprostorové (neproporcionální) písmo ), přičemž vlasový prostor je tenčí ze dvou.
Normální prostor s pomlčkou | levá, pravá |
---|---|
Tenký prostor s pomlčkou | vlevo, odjet — že jo |
Vlasový prostor s em pomlčkou | levá, pravá |
Žádné místo s pomlčkou | levá, pravá |
Formátování hodnot veličin
The Mezinárodní systém jednotek (SI) předepisuje vložení mezery mezi číslo a a jednotka měření a mezi jednotkami ve složených jednotkách. Jako oddělovač tisíců by měl být použit úzký prostor. Vidět symboly a čísla jednotek.
Výpočetní aplikace
Programovací jazyky
v programovací jazyk syntaxe, mezery se často používají k výslovnému oddělení žetony. Ve většině jazyků je s více prázdnými znaky zacházeno stejně jako s jedním prázdným znakem (mimo uvozovky); takové jazyky se nazývají volná forma. V několika jazycích, včetně Haskell, occam, ABC, a Krajta, mezery a odsazení se používají pro syntaktické účely. V satirickém jazyce Mezery, prázdné znaky jsou jediné platné znaky pro programování, zatímco ostatní znaky jsou ignorovány.
Nadměrné využívání mezer, zvláště koncové mezery na konci řádků, je považován za obtěžování. Správné použití mezer však může usnadnit čtení kódu a pomoci seskupit logiku související.
Většina jazyků rozpoznává pouze znaky ASCII jako mezery nebo v některých případech také nové řádky Unicode, ale ne většina znaků uvedených výše. The Jazyk C. definuje mezery mezi znaky jako „mezera, vodorovná karta, nový řádek, vertikální karta a podávání formulářů“.[27] The HTTP síťový protokol vyžaduje použití různých typů mezer v různých částech protokolu, například: pouze znak mezery v souboru postavení line, CRLF na konci řádku a „linear whitespace“ v hodnotách záhlaví.[28]
Uživatelské rozhraní příkazového řádku
V příkazech zpracovaných uživatelem příkazové procesory např. ve skriptech a po zadání může mezerový znak způsobit problémy, protože má dvě možné funkce: jako součást příkazu nebo parametru nebo jako parametr nebo název oddělovač. Nejednoznačnosti lze zabránit buď zákazem vložených mezer, nebo uzavřením názvu vloženými mezerami mezi uvozovkami.
Značkovací jazyky
Některé značkovací jazyky, například SGML, zachovat mezery tak, jak jsou psány.
Webové značkovací jazyky jako XML a HTML zacházejte s mezerami speciálně, včetně mezer, pro pohodlí programátorů. Jeden nebo více znaků mezery načtených odpovídajícími procesory zobrazení času značkovací jazyky jsou sbaleny do 0 nebo 1 prostoru, v závislosti na jejich sémantickém kontextu. Například dvojité (nebo více) mezery v textu se sbalí do jednoho prostoru a mezery, které se objeví na obou stranách znaku „=
„který odděluje název atributu od jeho hodnoty, nemá žádný vliv na interpretaci dokumentu. Koncové značky prvků mohou obsahovat koncové mezery a značky prázdných prvků v XML mohou obsahovat mezery před“/>
". V těchto jazycích zbytečné mezery zvětšují velikost souboru, a tak mohou zpomalit síťové přenosy. Na druhou stranu zbytečné mezery mohou také nenápadně označit kód, podobný, ale méně zřejmý než komentáře v kódu. To může být žádoucí prokázat an porušení licence nebo autorských práv, kterých se dopustil kopírování a vkládání.
V hodnotách atributů XML se se sekvencemi mezerových znaků zachází jako s jednou mezerou, když dokument čte analyzátor.[29] Analyzátor tímto způsobem nezmění mezery v obsahu elementu XML, ale aplikace přijímající informace z analyzátoru se může rozhodnout použít podobná pravidla na obsah elementu. Autor dokumentu XML může použít xml: space = "uchovat"
atribut na prvku, který dá syntaktickému analyzátoru pokyn, aby odradil následnou aplikaci od změny mezer v obsahu daného prvku.
Ve většině Prvky HTML, sekvence mezer je považována za jedinou oddělovač slov, který se může projevit jako jeden znak mezery při vykreslování textu v jazyce, který obvykle vloží takový prostor mezi slova.[30] Odpovídající vykreslovací moduly HTML jsou povinny použít doslovnější zacházení s mezerami v rámci několika předepsaných prvků, například před
tag a jakýkoli prvek, pro který CSS byl použit k aplikaci před
-jako zpracování mezer. V takových prvcích nebudou znaky mezery „sbaleny“ do oddělovačů mezi slovy.
V XML i HTML je neporušený prostor znak spolu s dalšími nestandardními mezerami není považován za skládací „mezery“, takže se na něj nevztahují výše uvedená pravidla.
Názvy souborů
Takové použití je podobné víceslovným názvům souborů napsaných pro operační systémy a aplikace, které jsou zaměňovány kódy vloženého prostoru - takové názvy souborů místo toho používají podtržítko (_) jako oddělovač slov, as_in_this_phrase.
Další takový symbol byl U + 2422 ␢ PRÁZDNÝ SYMBOL. Toto bylo používáno v prvních letech počítačového programování při psaní na kódovacích formulářích. Keypunch operátoři okamžitě rozpoznali symbol jako „explicitní prostor“.[16] Bylo použito v BCDIC,[16] EBCDIC,[16] a ASCII-1963.[16]
Viz také
- Návrat vozíku
- Em (typografie)
- En (typografie)
- Krmivo pro formuláře
- Odsazený styl
- Posuv řádku
- Nový řádek
- Styl programování
- Prosigns pro Morseovu abecedu
- Regulární výraz # Třídy znaků pro třídu prázdných znaků.
- Mezerník
- Mezera (interpunkce)
- Klávesa Tab
- Ořezávání (počítačové programování)
- Mezery (programovací jazyk)
- Prostor s nulovou šířkou
Reference
- ^ „Standard Unicode“. Konsorcium Unicode.
- ^ "Standardy návrhu znaků - mezery". Normy návrhu znaků. Microsoft. 1998–1999. Archivovány od originál 23. srpna 2000. Citováno 2009-05-18.
- ^ Unicode Standard 5.0, tištěné vydání, str.205
- ^ „Obecná interpunkce“ (PDF). Standard Unicode 5.1. Unicode Inc.. 1991–2008. Citováno 2009-05-13.
- ^ Sargent, Murray III (2006-08-29). „Unicode téměř prostý textový kód matematiky (verze 2)“. Technická poznámka Unicode č. 28. Unicode Inc.. str. 19–20. Citováno 2009-05-19.
- ^ Gillam, Richard (2002). Unicode Demystified: Praktický programátorský průvodce standardem kódování. Addison-Wesley. ISBN 0-201-70052-2.
- ^ A b Hickson, Iane. "12.5 Odkazy na pojmenované znaky". Standard HTML. WHATWG.
- ^ Wolfram. „ [NegativeThickSpace]“. Jazyková dokumentace Wolfram.
- ^ Wolfram. „ [NegativeMediumSpace]“. Jazyková dokumentace Wolfram.
- ^ Wolfram. „ [NegativeThinSpace]“. Jazyková dokumentace Wolfram.
- ^ Wolfram. „ [NegativeVeryThinSpace]“. Jazyková dokumentace Wolfram.
- ^ Faltstrom, P., ed. (Srpen 2010). „Nulová šířka bez spojení“. Body kódu Unicode a mezinárodní názvy domén pro aplikace (IDNA). IETF. sek. A.1. doi:10.17487 / RFC5892. RFC 5892. Citováno 4. září 2019.
- ^ Faltstrom, P., ed. (Srpen 2010). „Truhlář s nulovou šířkou“. Body kódu Unicode a internacionalizované názvy domén pro aplikace (IDNA). IETF. sek. A.2. doi:10.17487 / RFC5892. RFC 5892. Citováno 4. září 2019.
- ^ „Unicode Standard Annex # 44, Unicode Character Database“.
- ^ A b C d E F Evropská asociace výrobců počítačů (1968-11-28). Grafické znázornění řídicích znaků 7bitové kódované znakové sady ECMA pro výměnu informací (PDF). ECMA-17.
- ^ A b C d E F G h Mackenzie, Charles E. (1980). Kódované znakové sady, historie a vývoj. Řada programovacích systémů (1. vyd.). Addison-Wesley Publishing Company, Inc. 41, 47, 52, 102–103, 117, 119, 130, 132, 141, 148, 150–151, 212, 424. ISBN 978-0-201-14460-4. LCCN 77-90165. Citováno 2016-05-22. [1]
- ^ „American Standard Code for Information Interchange, ASA X3.4-1963“. American Standards Association (JAKO). 1963-06-17.
- ^ Niklaus Wirth, Programování v Modula-2
- ^ „Uživatelská příručka Cambridge Z88“. 4,7 (4. vydání). Cambridge Computer Limited. 2016 [1987]. Základní pojmy - klávesnice. Archivováno od originálu 2016-12-12. Citováno 2016-12-12.
- ^ A b C „Uživatelská příručka Cambridge Z88“. 4,0 (4. vydání). Cambridge Computer Limited. 1987. Dodatek D. Archivováno od originálu 2016-12-12. Citováno 2016-12-12.
- ^ A b C „Uživatelská příručka Cambridge Z88“. 4,7 (4. vydání). Cambridge Computer Limited. 2015 [1987]. Dodatek D. Archivováno od originálu 2016-12-12. Citováno 2016-12-12.
- ^ Chung, Jaemin (30.03.2017). Návrh na přidání informativní poznámky k U + 3164 HANGUL FILLER (PDF). Konsorcium Unicode. UTC L2 / 17-081.
- ^ Hangul Jamo (PDF). Konsorcium Unicode. 2020-10-25.
- ^ „ibm-933_P110-1995“. ICU Demonstration - Converter Explorer. Mezinárodní komponenty pro Unicode.
- ^ „ibm-933_P110-1995 (hlavní bajty 0E84)“. ICU Demonstration - Converter Explorer. Mezinárodní komponenty pro Unicode.
- ^ Použití různých typů pomlček je znázorněno např. V Chicago Style Style, §§ 6.80, 6.83–6.86
- ^ http://www.open-std.org/jtc1/sc22/wg14/www/docs/n1548.pdf Oddíl 6.4 odst. 3
- ^ Fielding, R .; a kol., „2.2 Základní pravidla“, Hypertext Transfer Protocol — HTTP / 1.1, RFC 2616
- ^ „3.3.3 Normalizace hodnoty atributu“. Extensible Markup Language (XML) 1.0 (páté vydání). World Wide Web Consortium.
- ^ „9.1 Mezery“. Specifikace W3CHTML 4.01. World Wide Web Consortium.