Mezera znak - Whitespace character

v programování, mezery je jakýkoli charakter nebo řada znaků, které představují vodorovně nebo svisle prostor v typografie. Při vykreslení znak mezery neodpovídá viditelné značce, ale obvykle zabírá oblast na stránce. Například společný bílý znak U + 0020 PROSTOR (taky ASCII 32) představuje a prázdné místo interpunkční znak v textu, používaný jako a rozdělovač slov v západní skripty.

Přehled

Relativní šířky různých prostorů v Unicode

U mnoha rozvržení klávesnice lze zadat vodorovný prázdný znak pomocí a mezerník. Horizontální mezery lze také zadat na mnoha klávesnicích pomocí Záložka ↹ klíč, i když se délka prostoru může lišit. Vertikální prázdné znaky jsou trochu rozmanitější, pokud jde o způsob jejich kódování, ale nejzřetelnější při psaní je ↵ Vstupte výsledek, který v aplikačních programech vytvoří sekvenci kódu „nového řádku“. Místo toho by mohly říkat starší klávesnice Vrátit se, zkrácená na klávesnici psacího stroje, což znamená „Carriage-Return“, který vygeneroval elektromechanický návrat k levému dorazu (CR kód v ASCII-hex & 0D;) a posun řádku nebo přechod na další řádek (kód LF v ASCII-hex & 0A;); v některých aplikacích se tyto nezávisle používaly k kreslení displejů založených na textových buňkách na monitorech nebo k tisku na tiskárnách s naváděním traktoru - které by mohly také obsahovat reverzní pohyby / sekvence kódů umístění umožňující textovým výstupním zařízením dosáhnout složitějšího výstupu. Mnoho časných počítačových her používalo tyto kódy k vykreslení obrazovky (např. Království Kroz ) a software pro zpracování textu by to použil k výrobě tištěných efektů, jako jsou tučné písmo, podtržení a přeškrtnutí.

Termín „mezery“ je založen na výsledném vzhledu obyčejného papír. Jsou však kódovány uvnitř aplikace, mezery mohou být zpracovány stejně jako jakýkoli jiný znakový kód a programy mohou provádět správnou akci, jak je definována pro kontext, ve kterém se vyskytují.

Definice a dvojznačnost

Nejběžnější mezery lze zadávat pomocí mezerník nebo klávesa tab. V závislosti na kontextu, zalomení řádku generované návratem nebo zadejte klíč lze také považovat za mezeru.

Unicode

V následující tabulce je uvedeno dvacet pět znaků definovaných jako mezery („WSpace = Y“, „WS“) znaky v Unicode Databáze znaků.^[1] Sedmnáct používá definici mezer konzistentní s algoritmem pro obousměrné psaní („Obousměrný typ znaků = WS“) a jsou známé jako znaky „Bidi-WS“. Lze použít i zbývající znaky, ale nejsou tohoto typu „Bidi“.

Poznámka: V závislosti na prohlížeči a použitých písmech k zobrazení následující tabulky se nemusí všechny mezery zobrazit správně.

Znaky Unicode s vlastností White_Space^[A]^[b]
název	Kódový bod		Šířka pole	Může se zlomit ?	v IDN ?	Skript	Blok	Všeobecné kategorie	Poznámky
tabulka znaků	U + 0009	9		Ano	Ne	Běžný	Základní latinka	Jiný, řízení	HT, Horizontální tab. HTML / XML pojmenovaná entita: `& Tab;`, Latex: ' tab'
posuv řádku	U + 000A	10	Je konec řádku			Běžný	Základní latinka	Jiný, řízení	LF, Posuv řádku. HTML / XML pojmenovaná entita: `&Nový řádek;`
řádkování	U + 000B	11	Je konec řádku			Běžný	Základní latinka	Jiný, řízení	VT, Vertikální tab
krmivo formuláře	U + 000C	12	Je konec řádku			Běžný	Základní latinka	Jiný, řízení	FF, Krmivo pro formuláře
návrat vozíku	U + 000D	13	Je konec řádku			Běžný	Základní latinka	Jiný, řízení	ČR, Návrat vozíku
prostor	U + 0020	32		Ano	Ne	Běžný	Základní latinka	Oddělovač, prostor	Nejběžnější (normální prostor ASCII)
další řádek	U + 0085	133	Je konec řádku			Běžný	Latinka-1 Doplněk	Jiný, řízení	NEL, Další řádek
prostor bez přestávky	U + 00A0	160		Ne	Ne	Běžný	Latinka-1 Doplněk	Oddělovač, prostor	Nerozbitný prostor: shodné s U + 0020, ale ne bod, ve kterém může být čára přerušena. HTML / XML pojmenovaná entita: `& nbsp;`LaTeX: '\ '
ogham mezera	U + 1680	5760		Ano	Ne	Ogham	Ogham	Oddělovač, prostor	Používá interword separace v Ogham text. Normálně svislá čára ve svislém textu nebo vodorovná čára ve vodorovném textu, ale může to být také prázdné místo v písmech bez stopky. Vyžaduje písmo Ogham.
en quad	U + 2000	8192		Ano	Ne	Běžný	Všeobecné Interpunkce	Oddělovač, prostor	Šířka jedné en. U + 2002 je kanonicky ekvivalentní tomuto znaku; U + 2002 je preferován.
em quad	U + 2001	8193		Ano	Ne	Běžný	Všeobecné Interpunkce	Oddělovač, prostor	Také známý jako „skopové čtyřkolky“. Šířka jedné em. U + 2003 je kanonicky ekvivalentní tomuto znaku; U + 2003 je preferováno.
en prostor	U + 2002	8194		Ano	Ne	Běžný	Všeobecné Interpunkce	Oddělovač, prostor	Také známý jako „ořech“. Šířka jedné en. U + 2000 En Quad je kanonicky ekvivalentní tomuto znaku; U + 2002 je preferován. HTML / XML pojmenovaná entita: `& ensp;`LaTeX: ' enspace'
em prostor	U + 2003	8195		Ano	Ne	Běžný	Všeobecné Interpunkce	Oddělovač, prostor	Také známý jako „skopové maso“. Šířka jedné em. U + 2001 Em Quad je kanonicky ekvivalentní tomuto znaku; U + 2003 je preferováno. HTML / XML pojmenovaná entita: `& emsp;`, LaTeX: ' quad'
prostor tři na jednoho	U + 2004	8196		Ano	Ne	Běžný	Všeobecné Interpunkce	Oddělovač, prostor	Také známý jako „hustý prostor“. Jedna třetina široká. HTML / XML pojmenovaná entita: `& emsp13;`
prostor čtyři na jednoho	U + 2005	8197		Ano	Ne	Běžný	Všeobecné Interpunkce	Oddělovač, prostor	Také známý jako „střed vesmíru“. Jedna čtvrtina z nich je široká. HTML / XML pojmenovaná entita: `& emsp14;`
šest na jednoho prostoru	U + 2006	8198		Ano	Ne	Běžný	Všeobecné Interpunkce	Oddělovač, prostor	Jedna šestina široká. V počítačové typografii se někdy rovná U + 2009.
figurální prostor	U + 2007	8199		Ne	Ne	Běžný	Všeobecné Interpunkce	Oddělovač, prostor	Prostor obrázku. Ve fontech s jednotnými číslicemi, která se rovná šířce jedné číslice. HTML / XML pojmenovaná entita: `& numsp;`
interpunkční prostor	U + 2008	8200		Ano	Ne	Běžný	Všeobecné Interpunkce	Oddělovač, prostor	Široká jako úzká interpunkce v písmu, tj. Šířka posunu tečky nebo čárky.^[2] HTML / XML pojmenovaná entita: `& puncsp;`
tenký prostor	U + 2009	8201		Ano	Ne	Běžný	Všeobecné Interpunkce	Oddělovač, prostor	Tenký prostor; jedna pětina (někdy jedna šestina) široké. Doporučeno pro použití jako oddělovač tisíců pro opatření provedená s SI jednotky. Na rozdíl od U + 2002 až U + 2008 se jeho šířka může při sazbě upravit.^[3] HTML / XML pojmenovaná entita: `& thinsp;`; LaTeX: ','
vlasový prostor	U + 200A	8202		Ano	Ne	Běžný	Všeobecné Interpunkce	Oddělovač, prostor	Tenčí než tenký prostor. HTML / XML pojmenovaná entita: `& hairsp;` (nefunguje ve všech prohlížečích)
oddělovač řádků	U + 2028	8232	Je konec řádku			Běžný	Všeobecné Interpunkce	Oddělovač, čára
oddělovač odstavců	U + 2029	8233	Je konec řádku			Běžný	Všeobecné Interpunkce	Oddělovač, odstavec
úzký prostor bez přerušení	U + 202F	8239		Ne	Ne	Běžný	Všeobecné Interpunkce	Oddělovač, prostor	Úzký prostor bez přerušení. Podobná funkce jako U + 00A0 No-Break Space. Při použití s mongolštinou je jeho šířka obvykle jedna třetina normálního prostoru; v jiných souvislostech se jeho šířka někdy podobá šířce Tenký prostor (U + 2009).
střední matematický prostor	U + 205F	8287		Ano	Ne	Běžný	Všeobecné Interpunkce	Oddělovač, prostor	MMSP. Používá se v matematických vzorcích. Čtyři osmnáctiny em.^[4] V matematické typografii jsou šířky mezer obvykle uvedeny v integrálních násobcích osmnáctiny em a 4/18 em může být použito v několika situacích, například mezi A a + a mezi + a b ve výrazu a + b.^[5] HTML / XML pojmenovaná entita: `& MediumSpace;`
ideografický prostor	U + 3000	12288		Ano	Ne	Běžný	Symboly CJK a Interpunkce	Oddělovač, prostor	Široký jako a CJK znaková buňka (plná šířka ). Používá se například v tai tou.

Související znaky Unicode bez vlastnosti White_Space
název	Kódový bod		Šířka pole	Může se zlomit ?	v IDN ?	Skript	Blok	Všeobecné kategorie	Poznámky
oddělovač mongolských samohlásek	U + 180E	6158	᠎	Ano	Ne	mongolský	mongolský	Jiný, Formát	MVS. Znak malého prostoru, který se v mongolštině používá k tomu, aby poslední dva znaky slova získaly různé tvary.^[6] Již není klasifikován jako znak mezery (tj. V kategorii Zs) v Unicode 6.3.0, i když tomu tak bylo v předchozích verzích standardu.
prostor s nulovou šířkou	U + 200B	8203		Ano	Ne	?	Všeobecné Interpunkce	Jiný, Formát	ZWSP, prostor nulové šířky. Používá se k označení hranic slov do systémů zpracování textu při použití skriptů, které nepoužívají explicitní mezery. Je to podobné jako u měkká pomlčka, s tím rozdílem, že druhý se používá k označení hranic slabiky, a měl by zobrazit viditelnou pomlčku, když se na ní řádek zalomí. HTML / XML pojmenovaná entita: `& ZeroWidthSpace;`^[7]^[C]
nulová šířka bez spojení	U + 200C	8204	‌	Ano	Kontextově závislé^[12]	?	Všeobecné Interpunkce	Jiný, Formát	ZWNJ, nulová šířka bez spojení. Při umístění mezi dva znaky, které by jinak byly spojeny, způsobí ZWNJ, aby byly vytištěny v jejich konečné a počáteční podobě. HTML / XML pojmenovaná entita: `& zwnj;`
truhlář s nulovou šířkou	U + 200D	8205	‍	Ano	Kontextově závislé^[13]	?	Všeobecné Interpunkce	Jiný, Formát	ZWJ, truhlář s nulovou šířkou. Při umístění mezi dva znaky, které by jinak nebyly spojeny, způsobí ZWJ jejich tisk v připojených formách. Lze také použít k samostatnému zobrazení spojovacích formulářů. V závislosti na tom, zda se ve výchozím nastavení očekává ligatura nebo spojka, lze buď vyvolat (jako v emodži a v sinhálštině ) nebo potlačit (jako v Devanagari ) substituce jediným glyfem, zatímco stále umožňuje použití jednotlivých spojovacích forem (na rozdíl od ZWNJ). HTML / XML pojmenovaná entita: `& zwj;`
slovo truhlář	U + 2060	8288	⁠	Ne	Ne	?	Všeobecné Interpunkce	Jiný, Formát	WJ, slovo truhlář. Podobně jako U + 200B, ale ne bod, ve kterém může být čára přerušena. HTML / XML pojmenovaná entita: `&Bez přestávky;`
nulová šířka nerozbitného prostoru	U + FEFF	65279		Ne	Ne	?	arabština Prezentace Formuláře-B	Jiný, Formát	Nerozbitný prostor s nulovou šířkou. Používá se především jako Byte Order Mark. Použití jako indikace nerozbitnosti je od Unicode 3.2 zastaralé; místo toho viz U + 2060.

^ White_Space je binární vlastnost Unicode.^[14] ^ „Unicode 13.0 UCD: PropList.txt“. 2019-11-27. Citováno 2020-03-12. ^ Ačkoli `& ZeroWidthSpace;` je jedna entita s názvem HTML5 pro U + 200B, další názvy `NegativeMediumSpace`, `NegativeThickSpace`, `NegativeThinSpace` a `NegativeVeryThinSpace` (což jsou jména použitá v Wolfram jazyk pro prostory s negativním posunem, které mapuje na Oblast pro soukromé použití )^[8]^[9]^[10]^[11] jsou také definovány HTML5 jako aliasy pro U + 200B (např. `& NegativeMediumSpace;`).^[7]

Náhradníci

Unicode také poskytuje některé viditelné znaky, které lze použít k reprezentaci různých znaků mezer v kontextech, kde musí být zobrazen viditelný symbol:

Unicode znaky ilustrující prostor (viditelné)
Kód	Desetinný	název	Blok	Zobrazit	Popis
U + 00B7	183	Prostřední tečka	Doplněk latinky-1	·	Interpunct Pojmenovaná entita: `& middot;`
U + 21A1	8609	Šipka se dvěma hlavami dolů	Šipky	↡	ECMA-17 / ISO 2047 symbol pro podávání formuláře (konec stránky)^[15]
U + 2261	8810	Stejný jako	Matematický Operátoři	≡	Mezi další použití patří symbol ECMA-17 / ISO 2047 pro řádkový posuv^[15]
U + 237D	9085	Otevřená krabice přes rameno	Různé technické	⍽	Používá se k označení a NBSP
U + 23CE	9166	Symbol návratu	Různé technické	⏎	Symbol pro a návratový klíč, který zadá zalomení řádku
U + 2409	9225	Symbol pro vodorovnou tabulku	Ovládací obrázky	␉	Nahrazuje znak tabulátoru
U + 240A	9226	Symbol pro posuv řádku	Ovládací obrázky	␊	Náhrady za řádek
U + 240B	9227	Symbol pro vertikální tabulku	Ovládací obrázky	␋	Náhrady za svislou záložku (řádková záložka)
U + 240 ° C	9228	Symbol pro podávání formuláře	Ovládací obrázky	␌	Náhražky za zdroj formuláře (konec stránky)
U + 240D	9229	Symbol pro návrat vozíku	Ovládací obrázky	␍	Náhražky za vrácení vozíku
U + 2420	9248	Symbol pro prostor	Ovládací obrázky	␠	Nahrazuje prostor ASCII
U + 2422	9250	Prázdný symbol	Ovládací obrázky	␢	aka „náhradní prázdné místo“,^[16] použito v BCDIC,^[16] EBCDIC,^[16] ASCII-1963^[16]^[17] atd. jako symbol pro oddělovač slov
U + 2423	9251	Otevřít krabici	Ovládací obrázky	␣	Použito v tiskací písmeno rukopis minimálně od 80. let, kdy je nutné výslovně uvést počet mezerových znaků (např. při programování perem a papírem). Používá se v učebnici (vydané 1982, 1984, 1985, 1988, Springer-Verlag) Modula-2,^[18] programovací jazyk, kde vesmírné kódy vyžadují výslovnou indikaci. Používá se také na klávesnici^{[n 1]} z Texas Instruments TI-8X série z grafické kalkulačky. Pojmenovaná entita: `&prázdný;`
U + 2424	9252	Symbol pro nový řádek	Ovládací obrázky	␤	Nahrazuje zalomení řádku
U + 25B3	9651	Bílý trojúhelník směřující nahoru	Geometrické tvary	△	Mezi další použití patří symbol ECMA-17 / ISO 2047 pro prostor ASCII^[15]
U + 2A5B	10843	Logické Nebo se středním dříkem	Doplňkové Matematický Operátoři	⩛	Mezi další použití patří symbol ECMA-17 / ISO 2047 pro svislou záložku (řádková záložka)^[15]
U + 2AAA	10922	Menší než	Doplňkové Matematický Operátoři	⪪	Mezi další použití patří symbol ECMA-17 / ISO 2047 pro návrat vozíku^[15]
U + 2AAB	10923	Větší než	Doplňkové Matematický Operátoři	⪫	Mezi další použití patří symbol ECMA-17 / ISO 2047 pro znak tabulátoru^[15]

^ Nad nulovým klíčem „0“ nebo záporným „(-)“.

Přesný prostor

The Cambridge Z88 poskytl speciální "přesný prostor" (kódový bod 160 aka 0xA0) (vyvolaný klávesovou zkratkou ⌑+PROSTOR,^[19]) zobrazený jako „...“ ovladačem displeje operačního systému.^[20]^[21] Proto byl také znám jako „tečkovaný prostor“ ve spojení s BBC BASIC.^[20]^[21]
Pod kódovým bodem 224 (0xE0) počítač také poskytl speciální symbol SPACE se třemi znaky v celé buňce "SPC" (analogicky k Unicode pro celou buňku U + 2420).^[20]^[21]

Prázdné mezery

The Braillovo písmo Blok Unicode obsahuje U + 2800 ⠀ BRAILLE PATTERN BLANK (HTML⠀), a Braillovo písmo vzor bez vyvýšených teček. Některá písma zobrazují znak jako mezeru s pevnou šířkou, standard Unicode však výslovně uvádí, že nepůsobí jako mezera.
Unicode obsahuje a Hangul Filler znak v Kompatibilita Hangul Jamo blok (U + 3164 ㅤ HANGUL FILLER (HTMLㅤ)). Toto je klasifikováno jako písmeno, ale zobrazeno jako prázdné místo, jako blok Hangul bez jamo. Používá se v KS X 1001 Hangul kombinující sekvence, ale ne v kombinujícím systému jamo Unicode.^[22].
Ekvivalentní postava Hangul Jungseong Filler je součástí Blok Hangul Jamo (U + 1160 ᅠ VÝPLŇ HANGUL JUNGSEONG (HTMLᅠ))^[23].
Navíc, a Hangul Filler s poloviční šířkou je součástí Formuláře s poloviční a plnou šířkou (U + FFA0 ﾠ PLNICÍ HANGULOVÝ VÝPLNOVÝ VÝPLŇ (HTMLﾠ)), který se používá při mapování z kódování, které obsahuje znaky obou Johab (nebo Wansung ) a N-byte Hangul (nebo jeho EBCDIC protějšek), jako je IBM-933, který zahrnuje jak plniva Johab, tak EBCDIC.^[24]^[25]

Mezery a digitální typografie

Zobrazení na obrazovce

Textové editory, textové procesory, a software pro stolní publikování se liší v tom, jak představují mezery na obrazovce a jak představují mezery na koncích řádků delší než šířka obrazovky nebo sloupce. V některých případech jsou mezery zobrazeny jednoduše jako prázdné místo; v ostatních případech je může zastupovat interpunktní nebo jiné symboly. K vytváření mezer lze použít mnoho různých znaků (popsaných níže) a mezery mohou ovlivnit i funkce bez znaků (například nastavení okrajů a záložek).

Univerzální prostor s proměnnou šířkou

V počítači kódování znaků existuje normál univerzální prostor (Znak Unicode U + 0020), jehož šířka se bude lišit v závislosti na designu písma. Typické hodnoty se pohybují od 1/5 em do 1/3 em (v digitální typografii an em se rovná nominální velikosti písma, takže u 10bodového písma bude prostor pravděpodobně mezi 2 a 3,3 body). Sofistikovaná písma mohou mít různě velké mezery pro tučné, kurzíva a malé písmena a často skladatelé ručně upraví šířku mezery v závislosti na velikosti a výtečnosti textu.

Kromě tohoto univerzálního prostoru je možné kódovat prostor určité šířky. V následující tabulce najdete kompletní seznam.

Vlasové mezery kolem pomlček

Em pomlčky používané jako závorky, a en pomlčky jsou-li použity jako slovní spojenci, jsou obvykle nastaveny souvisle s textem.^[26] Taková pomlčka však může být volitelně obklopena a vlasový prostor, U + 200A nebo tenký prostor, U + 2009. Vlasový prostor lze zapsat do HTML pomocí odkazy na číselné znaky & # x200A; nebo  nebo pojmenovaná entita & hairsp;, ale od roku 2016 dosud není v prohlížečích všeobecně podporována.^{[Aktualizace]}^{[který? ]} The tenký prostor je pojmenovaná entita & thinsp; a číselné odkazy & # x2009; nebo  . Tyto prostory jsou mnohem tenčí než normální prostor (kromě a jednoprostorové (neproporcionální) písmo ), přičemž vlasový prostor je tenčí ze dvou.

Normální prostor versus vlasy a tenké mezery (vykreslený vaším prohlížečem)
Normální prostor s pomlčkou	levá, pravá
Tenký prostor s pomlčkou	vlevo, odjet — že jo
Vlasový prostor s em pomlčkou	levá, pravá
Žádné místo s pomlčkou	levá, pravá

Formátování hodnot veličin

The Mezinárodní systém jednotek (SI) předepisuje vložení mezery mezi číslo a a jednotka měření a mezi jednotkami ve složených jednotkách. Jako oddělovač tisíců by měl být použit úzký prostor. Vidět symboly a čísla jednotek.

Výpočetní aplikace

Programovací jazyky

v programovací jazyk syntaxe, mezery se často používají k výslovnému oddělení žetony. Ve většině jazyků je s více prázdnými znaky zacházeno stejně jako s jedním prázdným znakem (mimo uvozovky); takové jazyky se nazývají volná forma. V několika jazycích, včetně Haskell, occam, ABC, a Krajta, mezery a odsazení se používají pro syntaktické účely. V satirickém jazyce Mezery, prázdné znaky jsou jediné platné znaky pro programování, zatímco ostatní znaky jsou ignorovány.

Nadměrné využívání mezer, zvláště koncové mezery na konci řádků, je považován za obtěžování. Správné použití mezer však může usnadnit čtení kódu a pomoci seskupit logiku související.

Většina jazyků rozpoznává pouze znaky ASCII jako mezery nebo v některých případech také nové řádky Unicode, ale ne většina znaků uvedených výše. The Jazyk C. definuje mezery mezi znaky jako „mezera, vodorovná karta, nový řádek, vertikální karta a podávání formulářů“.^[27] The HTTP síťový protokol vyžaduje použití různých typů mezer v různých částech protokolu, například: pouze znak mezery v souboru postavení line, CRLF na konci řádku a „linear whitespace“ v hodnotách záhlaví.^[28]

Uživatelské rozhraní příkazového řádku

V příkazech zpracovaných uživatelem příkazové procesory např. ve skriptech a po zadání může mezerový znak způsobit problémy, protože má dvě možné funkce: jako součást příkazu nebo parametru nebo jako parametr nebo název oddělovač. Nejednoznačnosti lze zabránit buď zákazem vložených mezer, nebo uzavřením názvu vloženými mezerami mezi uvozovkami.

Značkovací jazyky

Některé značkovací jazyky, například SGML, zachovat mezery tak, jak jsou psány.

Webové značkovací jazyky jako XML a HTML zacházejte s mezerami speciálně, včetně mezer, pro pohodlí programátorů. Jeden nebo více znaků mezery načtených odpovídajícími procesory zobrazení času značkovací jazyky jsou sbaleny do 0 nebo 1 prostoru, v závislosti na jejich sémantickém kontextu. Například dvojité (nebo více) mezery v textu se sbalí do jednoho prostoru a mezery, které se objeví na obou stranách znaku „=„který odděluje název atributu od jeho hodnoty, nemá žádný vliv na interpretaci dokumentu. Koncové značky prvků mohou obsahovat koncové mezery a značky prázdných prvků v XML mohou obsahovat mezery před“/>". V těchto jazycích zbytečné mezery zvětšují velikost souboru, a tak mohou zpomalit síťové přenosy. Na druhou stranu zbytečné mezery mohou také nenápadně označit kód, podobný, ale méně zřejmý než komentáře v kódu. To může být žádoucí prokázat an porušení licence nebo autorských práv, kterých se dopustil kopírování a vkládání.

V hodnotách atributů XML se se sekvencemi mezerových znaků zachází jako s jednou mezerou, když dokument čte analyzátor.^[29] Analyzátor tímto způsobem nezmění mezery v obsahu elementu XML, ale aplikace přijímající informace z analyzátoru se může rozhodnout použít podobná pravidla na obsah elementu. Autor dokumentu XML může použít xml: space = "uchovat" atribut na prvku, který dá syntaktickému analyzátoru pokyn, aby odradil následnou aplikaci od změny mezer v obsahu daného prvku.

Ve většině Prvky HTML, sekvence mezer je považována za jedinou oddělovač slov, který se může projevit jako jeden znak mezery při vykreslování textu v jazyce, který obvykle vloží takový prostor mezi slova.^[30] Odpovídající vykreslovací moduly HTML jsou povinny použít doslovnější zacházení s mezerami v rámci několika předepsaných prvků, například před tag a jakýkoli prvek, pro který CSS byl použit k aplikaci před-jako zpracování mezer. V takových prvcích nebudou znaky mezery „sbaleny“ do oddělovačů mezi slovy.

V XML i HTML je neporušený prostor znak spolu s dalšími nestandardními mezerami není považován za skládací „mezery“, takže se na něj nevztahují výše uvedená pravidla.

Názvy souborů

Takové použití je podobné víceslovným názvům souborů napsaných pro operační systémy a aplikace, které jsou zaměňovány kódy vloženého prostoru - takové názvy souborů místo toho používají podtržítko (_) jako oddělovač slov, as_in_this_phrase.

Další takový symbol byl U + 2422 ␢ PRÁZDNÝ SYMBOL. Toto bylo používáno v prvních letech počítačového programování při psaní na kódovacích formulářích. Keypunch operátoři okamžitě rozpoznali symbol jako „explicitní prostor“.^[16] Bylo použito v BCDIC,^[16] EBCDIC,^[16] a ASCII-1963.^[16]

Viz také

Reference

^ „Standard Unicode“. Konsorcium Unicode.
^ "Standardy návrhu znaků - mezery". Normy návrhu znaků. Microsoft. 1998–1999. Archivovány od originál 23. srpna 2000. Citováno 2009-05-18.
^ Unicode Standard 5.0, tištěné vydání, str.205
^ „Obecná interpunkce“ (PDF). Standard Unicode 5.1. Unicode Inc.. 1991–2008. Citováno 2009-05-13.
^ Sargent, Murray III (2006-08-29). „Unicode téměř prostý textový kód matematiky (verze 2)“. Technická poznámka Unicode č. 28. Unicode Inc.. str. 19–20. Citováno 2009-05-19.
^ Gillam, Richard (2002). Unicode Demystified: Praktický programátorský průvodce standardem kódování. Addison-Wesley. ISBN 0-201-70052-2.
^ ^A ^b Hickson, Iane. "12.5 Odkazy na pojmenované znaky". Standard HTML. WHATWG.
^ Wolfram. „ [NegativeThickSpace]“. Jazyková dokumentace Wolfram.
^ Wolfram. „ [NegativeMediumSpace]“. Jazyková dokumentace Wolfram.
^ Wolfram. „ [NegativeThinSpace]“. Jazyková dokumentace Wolfram.
^ Wolfram. „ [NegativeVeryThinSpace]“. Jazyková dokumentace Wolfram.
^ Faltstrom, P., ed. (Srpen 2010). „Nulová šířka bez spojení“. Body kódu Unicode a mezinárodní názvy domén pro aplikace (IDNA). IETF. sek. A.1. doi:10.17487 / RFC5892. RFC 5892. Citováno 4. září 2019.
^ Faltstrom, P., ed. (Srpen 2010). „Truhlář s nulovou šířkou“. Body kódu Unicode a internacionalizované názvy domén pro aplikace (IDNA). IETF. sek. A.2. doi:10.17487 / RFC5892. RFC 5892. Citováno 4. září 2019.
^ „Unicode Standard Annex # 44, Unicode Character Database“.
^ ^A ^b ^C ^d ^E ^F Evropská asociace výrobců počítačů (1968-11-28). Grafické znázornění řídicích znaků 7bitové kódované znakové sady ECMA pro výměnu informací (PDF). ECMA-17.
^ ^A ^b ^C ^d ^E ^F ^G ^h Mackenzie, Charles E. (1980). Kódované znakové sady, historie a vývoj. Řada programovacích systémů (1. vyd.). Addison-Wesley Publishing Company, Inc. 41, 47, 52, 102–103, 117, 119, 130, 132, 141, 148, 150–151, 212, 424. ISBN 978-0-201-14460-4. LCCN 77-90165. Citováno 2016-05-22. [1]
^ „American Standard Code for Information Interchange, ASA X3.4-1963“. American Standards Association (JAKO). 1963-06-17.
^ Niklaus Wirth, Programování v Modula-2
^ „Uživatelská příručka Cambridge Z88“. 4,7 (4. vydání). Cambridge Computer Limited. 2016 [1987]. Základní pojmy - klávesnice. Archivováno od originálu 2016-12-12. Citováno 2016-12-12.
^ ^A ^b ^C „Uživatelská příručka Cambridge Z88“. 4,0 (4. vydání). Cambridge Computer Limited. 1987. Dodatek D. Archivováno od originálu 2016-12-12. Citováno 2016-12-12.
^ ^A ^b ^C „Uživatelská příručka Cambridge Z88“. 4,7 (4. vydání). Cambridge Computer Limited. 2015 [1987]. Dodatek D. Archivováno od originálu 2016-12-12. Citováno 2016-12-12.
^ Chung, Jaemin (30.03.2017). Návrh na přidání informativní poznámky k U + 3164 HANGUL FILLER (PDF). Konsorcium Unicode. UTC L2 / 17-081.
^ Hangul Jamo (PDF). Konsorcium Unicode. 2020-10-25.
^ „ibm-933_P110-1995“. ICU Demonstration - Converter Explorer. Mezinárodní komponenty pro Unicode.
^ „ibm-933_P110-1995 (hlavní bajty 0E84)“. ICU Demonstration - Converter Explorer. Mezinárodní komponenty pro Unicode.
^ Použití různých typů pomlček je znázorněno např. V Chicago Style Style, §§ 6.80, 6.83–6.86
^ http://www.open-std.org/jtc1/sc22/wg14/www/docs/n1548.pdf Oddíl 6.4 odst. 3
^ Fielding, R .; a kol., „2.2 Základní pravidla“, Hypertext Transfer Protocol — HTTP / 1.1, RFC 2616
^ „3.3.3 Normalizace hodnoty atributu“. Extensible Markup Language (XML) 1.0 (páté vydání). World Wide Web Consortium.
^ „9.1 Mezery“. Specifikace W3CHTML 4.01. World Wide Web Consortium.

externí odkazy

Seznam vlastností databáze znaků Unicode

[wsdef-2] White_Space je binární vlastnost Unicode.^[14]

[ws-3] „Unicode 13.0 UCD: PropList.txt“. 2019-11-27. Citováno 2020-03-12.

[14] Ačkoli & ZeroWidthSpace; je jedna entita s názvem HTML5 pro U + 200B, další názvy NegativeMediumSpace, NegativeThickSpace, NegativeThinSpace a NegativeVeryThinSpace (což jsou jména použitá v Wolfram jazyk pro prostory s negativním posunem, které mapuje na Oblast pro soukromé použití )^[8]^[9]^[10]^[11] jsou také definovány HTML5 jako aliasy pro U + 200B (např. & NegativeMediumSpace;).^[7]

[22] Nad nulovým klíčem „0“ nebo záporným „(-)“.

[1] „Standard Unicode“. Konsorcium Unicode.

[4] "Standardy návrhu znaků - mezery". Normy návrhu znaků. Microsoft. 1998–1999. Archivovány od originál 23. srpna 2000. Citováno 2009-05-18.

[5] Unicode Standard 5.0, tištěné vydání, str.205

[6] „Obecná interpunkce“ (PDF). Standard Unicode 5.1. Unicode Inc.. 1991–2008. Citováno 2009-05-13.

[7] Sargent, Murray III (2006-08-29). „Unicode téměř prostý textový kód matematiky (verze 2)“. Technická poznámka Unicode č. 28. Unicode Inc.. str. 19–20. Citováno 2009-05-19.

[Gillam-8] Gillam, Richard (2002). Unicode Demystified: Praktický programátorský průvodce standardem kódování. Addison-Wesley. ISBN 0-201-70052-2.

[html5entity-9] A ^b Hickson, Iane. "12.5 Odkazy na pojmenované znaky". Standard HTML. WHATWG.

[10] Wolfram. „ [NegativeThickSpace]“. Jazyková dokumentace Wolfram.

[11] Wolfram. „ [NegativeMediumSpace]“. Jazyková dokumentace Wolfram.

[12] Wolfram. „ [NegativeThinSpace]“. Jazyková dokumentace Wolfram.

[13] Wolfram. „ [NegativeVeryThinSpace]“. Jazyková dokumentace Wolfram.

[15] Faltstrom, P., ed. (Srpen 2010). „Nulová šířka bez spojení“. Body kódu Unicode a mezinárodní názvy domén pro aplikace (IDNA). IETF. sek. A.1. doi:10.17487 / RFC5892. RFC 5892. Citováno 4. září 2019.

[16] Faltstrom, P., ed. (Srpen 2010). „Truhlář s nulovou šířkou“. Body kódu Unicode a internacionalizované názvy domén pro aplikace (IDNA). IETF. sek. A.2. doi:10.17487 / RFC5892. RFC 5892. Citováno 4. září 2019.

[17] „Unicode Standard Annex # 44, Unicode Character Database“.

[ECMA-17-18] A ^b ^C ^d ^E ^F Evropská asociace výrobců počítačů (1968-11-28). Grafické znázornění řídicích znaků 7bitové kódované znakové sady ECMA pro výměnu informací (PDF). ECMA-17.

[Mackenzie_1980-19] A ^b ^C ^d ^E ^F ^G ^h Mackenzie, Charles E. (1980). Kódované znakové sady, historie a vývoj. Řada programovacích systémů (1. vyd.). Addison-Wesley Publishing Company, Inc. 41, 47, 52, 102–103, 117, 119, 130, 132, 141, 148, 150–151, 212, 424. ISBN 978-0-201-14460-4. LCCN 77-90165. Citováno 2016-05-22. [1]

[ASCII-1963-20] „American Standard Code for Information Interchange, ASA X3.4-1963“. American Standards Association (JAKO). 1963-06-17.

[21] Niklaus Wirth, Programování v Modula-2

[Cambridge_UG_Keyboard-23] „Uživatelská příručka Cambridge Z88“. 4,7 (4. vydání). Cambridge Computer Limited. 2016 [1987]. Základní pojmy - klávesnice. Archivováno od originálu 2016-12-12. Citováno 2016-12-12.

[Cambridge_UG40_AppendixD-24] A ^b ^C „Uživatelská příručka Cambridge Z88“. 4,0 (4. vydání). Cambridge Computer Limited. 1987. Dodatek D. Archivováno od originálu 2016-12-12. Citováno 2016-12-12.

[Cambridge_UG_AppendixD-25] A ^b ^C „Uživatelská příručka Cambridge Z88“. 4,7 (4. vydání). Cambridge Computer Limited. 2015 [1987]. Dodatek D. Archivováno od originálu 2016-12-12. Citováno 2016-12-12.

[26] Chung, Jaemin (30.03.2017). Návrh na přidání informativní poznámky k U + 3164 HANGUL FILLER (PDF). Konsorcium Unicode. UTC L2 / 17-081.

[27] Hangul Jamo (PDF). Konsorcium Unicode. 2020-10-25.

[28] „ibm-933_P110-1995“. ICU Demonstration - Converter Explorer. Mezinárodní komponenty pro Unicode.

[29] „ibm-933_P110-1995 (hlavní bajty 0E84)“. ICU Demonstration - Converter Explorer. Mezinárodní komponenty pro Unicode.

[30] Použití různých typů pomlček je znázorněno např. V Chicago Style Style, §§ 6.80, 6.83–6.86

[31] ttp://www.open-std.org/jtc1/sc22/wg14/www/docs/n1548.pdf Oddíl 6.4 odst. 3

[32] Fielding, R .; a kol., „2.2 Základní pravidla“, Hypertext Transfer Protocol — HTTP / 1.1, RFC 2616

[33] „3.3.3 Normalizace hodnoty atributu“. Extensible Markup Language (XML) 1.0 (páté vydání). World Wide Web Consortium.

[34] „9.1 Mezery“. Specifikace W3CHTML 4.01. World Wide Web Consortium.

[1]

[A]

[b]

[2]

[3]

[4]

[5]

[6]

[7]

[C]

[12]

[13]

[14]

[8]

[9]

[10]

[11]

[15]

[16]

[17]

[18]

[n 1]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]