Základní latinka (blok Unicode) - Basic Latin (Unicode block)

Ovládací prvky C0 a Základní latinka
RozsahU + 0000..U + 007F
(128 kódových bodů)
LetadloBMP
Skriptylatinský (52 znaků)
Běžný (76 znaků)
Hlavní abecedyAngličtina
francouzština
Němec
španělština
vietnamština
Sady symbolůArabské číslice
Interpunkce
Přiřazeno128 kódových bodů
33 Ovládání nebo formátování
Nepoužitý0 vyhrazených kódových bodů
Zdrojové standardyISO / IEC 8859, ISO 646
Historie verzí Unicode
1.0.0128 (+128)
Poznámka: [1][2]

The Základní latinka nebo Ovládací prvky C0 a základní latinka Blok Unicode je první blok Unicode standard a jediný blok, který je zakódován do jednoho bajtu v UTF-8. Blok obsahuje všechny písmena a kontrolní kódy kódování ASCII. Pohybuje se od U + 0000 do U + 007F, obsahuje 128 znaků a obsahuje Ovládací prvky C0, ASCII interpunkce a symboly, ASCII číslice, oba velká písmena a malá písmena z anglická abeceda a a kontrolní znak.

Blok Basic Latin byl do současné podoby zahrnut z verze 1.0.0 standardu Unicode, bez přidání nebo úpravy znakového repertoáru.[3] Název bloku v Unicode 1.0 byl ASCII.[4]

Tabulka znaků

KódVýsledekPopisAkronym
Ovládací prvky C0
U + 0000Nulový charakterNUL
U + 0001Začátek okruhuSOH
U + 0002Začátek textuSTX
U + 0003Znak konce textuETX
U + 0004Znak konce přenosuEOT
U + 0005Charakter dotazuENQ
U + 0006Potvrdit charakterACK
U + 0007Bell postavaBEL
U + 0008BackspaceBS
U + 0009Vodorovná kartaHT
U + 000APosuv řádkuLF
U + 000BSvislá kartaVT
U + 000CKrmivo pro formulářeFF
U + 000DNávrat vozíkuČR
U + 000EPosun venTAK
U + 000FPosun dovnitřSI
U + 0010Únik datovým spojemDLE
U + 0011Ovládání zařízení 1DC1
U + 0012Ovládání zařízení 2DC2
U + 0013Ovládání zařízení 3DC3
U + 0014Ovládání zařízení 4DC4
U + 0015Znak s negativním potvrzenímNAK
U + 0016Synchronní nečinnostSYN
U + 0017Konec přenosového blokuETB
U + 0018Zrušit znakUMĚT
U + 0019Konec médiaEM
U + 001ANáhradní postavaSUB
U + 001BÚniková postavaESC
U + 001COddělovač souborůFS
U + 001DOddělovač skupinGS
U + 001ESeparátor záznamůRS
U + 001FOddělovač jednotekNÁS
ASCII interpunkce a symboly
U + 0020 ProstorSP
U + 0021!VykřičníkEXC
U + 0022"UvozovkaQUO
U + 0023#Znak čísla
U + 0024$Znak dolaru
U + 0025%Znak procenta
U + 0026&Ampersand
U + 0027'Apostrof
U + 0028(Levá závorka
U + 0029)Pravá závorka
U + 002A*Hvězdička
U + 002B+Znaménko plus
U + 002C,Čárka
U + 002D-Pomlčka-minus
U + 002E.Tečka nebo doba
U + 002F/Solidus nebo Rozřezat
ASCII číslice
U + 00300Digit Zero
U + 00311Číslice jedna
U + 00322Číslice dvě
U + 00333Číslice tři
U + 00344Číslice čtyři
U + 00355Číslice pět
U + 00366Číslice šest
U + 00377Číslice sedm
U + 00388Číslice osm
U + 00399Číslice devět
ASCII interpunkce a symboly
U + 003A:Dvojtečka
U + 003B;Středník
U + 003C<Znaménko méně než
U + 003D=Znaménko rovnosti
U + 003E>Znamení větší než
U + 003F?Otazník
U + 0040@Na znamení nebo Obchodní ve společnosti
Velká latinská abeceda
U + 0041ALatinské velké písmeno A
U + 0042BLatinské velké písmeno B
U + 0043CLatinské velké písmeno C.
U + 0044DLatinské velké písmeno D
U + 0045ELatinské velké písmeno E.
U + 0046FLatinské velké písmeno F
U + 0047GLatinské velké písmeno G
U + 0048HLatinské velké písmeno H
U + 0049Latinské velké písmeno I
U + 004AJLatinské velké písmeno J
U + 004BK.Latinské velké písmeno K
U + 004CLLatinské velké písmeno L
U + 004DMLatinské velké písmeno M.
U + 004ENLatinské velké písmeno N
U + 004FÓLatinské velké písmeno O
U + 0050PLatinské velké písmeno P
U + 0051QLatinské velké písmeno Q
U + 0052RLatinské velké písmeno R.
U + 0053SLatinské velké písmeno S.
U + 0054TLatinské velké písmeno T
U + 0055ULatinské velké písmeno U
U + 0056PROTILatinské velké písmeno V
U + 0057ŽLatinské velké písmeno W.
U + 0058XLatinské velké písmeno X
U + 0059YLatinské velké písmeno Y
U + 005AZLatinské velké písmeno Z
ASCII interpunkce a symboly
U + 005B[Levá hranatá závorka
U + 005CObrácené lomítko [A]
U + 005D]Pravá hranatá závorka
U + 005E^Circumflex přízvuk
U + 005F_Nízká čára
U + 0060`Hrobový přízvuk
Malá latinská abeceda
U + 0061ALatinské malé písmeno A
U + 0062bLatinské malé písmeno B
U + 0063CLatinské malé písmeno C.
U + 0064dLatinské malé písmeno D
U + 0065ELatinské malé písmeno E.
U + 0066FLatinské malé písmeno F
U + 0067GLatinské malé písmeno G
U + 0068hLatinské malé písmeno H
U + 0069iLatinské malé písmeno I.
U + 006AjLatinské malé písmeno J.
U + 006BkLatinské malé písmeno K.
U + 006ClLatinské malé písmeno L
U + 006DmLatinské malé písmeno M.
U + 006EnLatinské malé písmeno N
U + 006FÓLatinské malé písmeno O
U + 0070strLatinské malé písmeno P
U + 0071qLatinské malé písmeno Q
U + 0072rLatinské malé písmeno R.
U + 0073sLatinské malé písmeno S.
U + 0074tLatinské malé písmeno T
U + 0075uLatinské malé písmeno U
U + 0076protiLatinské malé písmeno V
U + 0077wLatinské malé písmeno W.
U + 0078XLatinské malé písmeno X
U + 0079yLatinské malé písmeno Y
U + 007AzLatinské malé písmeno Z
ASCII interpunkce a symboly
U + 007B{Levá složená závorka
U + 007C|Svislá čára
U + 007D}Pravá složená závorka
U + 007E~Vlkodlak
Kontrolní znak
U + 007FVymazatDEL
A Písmeno U + 005C () se může v japonských / korejských písmech mýlit s Unicode (zvláště pak znakem Yen (¥) nebo Won (₩)) (zejména UTF-8 ) jako starší znaková sada, která nahradila zpětné lomítko těmito znaky.[5]

Podnadpisy

Blok C0 Controls a Basic Latin obsahuje šest podnadpisů.[6]

Ovládací prvky C0

The C0 Ovládací prvky, označované jako C0 ASCII kontrolní kódy ve verzi 1.0, se dědí z ASCII a dalších 7bitových a 8bitových kódovacích schémat. Názvy aliasů pro ovládací prvky C0 jsou převzaty z ISO / IEC 6429: 1992 Standard.[6]

ASCII interpunkce a symboly

Tato podpoložka odkazuje na standardní interpunkční znaky, jednoduché matematické operátory a symboly jako znak dolaru, procenta, ampersand, podtržítko a roura.[6]

ASCII číslice

Podnadpis ASCII číslic obsahuje standardní evropské číselné znaky 1–9 a 0.[6]

Velká latinská abeceda

Podnadpis latinské abecedy Velká písmena obsahuje standardní 26písmennou latinku bez přízvuku v majuskula.[6]

Malá latinská abeceda

Podnadpis Malá latinská abeceda obsahuje standardní 26písmennou latinku bez přízvuku v nepatrný.[6]

Kontrolní znak

Podnadpis Řídicí znak obsahuje znak „Odstranit“.[6]

Počet symbolů, písmen a kontrolních kódů

V tabulce níže je uveden počet písmena, symboly a kontrolní kódy v každé z podnadpisů v bloku C0 Controls a Basic Latin.

Typ podpoložkyPočet symbolůRozsah znaků
Ovládací prvky C032 řídicích kódůU + 0000 až U + 001F
ASCII interpunkce a symboly33 interpunkčních znamének a symbolůU + 0020 až U + 002F, U + 003A až U + 0040, U + 005B až U + 0060 a U + 007B až U + 007E
ASCII číslice10 číslicU + 0030 až U + 0039
Velká latinská abeceda26 latinských písmen bez přízvuku v majuskula.U + 0041 až U + 005A
Malá latinská abeceda26 nepatřičných latinských písmen v minuskule.U + 0061 až U + 007A
Kontrolní znak1 kontrolní kód obsahující znak „Odstranit“.U + 007F

Blok

Ovládací prvky C0 a základní latinka[1]
Oficiální tabulka kódů konsorcia Unicode (PDF)
 0123456789ABCDEF
U + 000x NUL SOH STX ETX EOT ENQ ACK BEL BS HT LF VT FF ČR TAK SI
U + 001x DLE DC1 DC2 DC3 DC4 NAK SYN ETB UMĚT EM SUB ESC FS GS RS NÁS
U + 002x SP!"#$%&'()*+,-./
U + 003x0123456789:;<=>?
U + 004x@ABCDEFGHJK.LMNÓ
U + 005xPQRSTUPROTIŽXYZ[]^_
U + 006x`AbCdEFGhijklmnÓ
U + 007xstrqrstuprotiwXyz{|}~ DEL
Poznámky
1.^ Od verze Unicode 13.0

Varianty

Několik znaků je definováno jako vykreslení standardizovaná varianta pokud následují varianty ukazatelů.

Varianta je definována pro nulu s krátkým diagonálním zdvihem: U + 0030 DIGIT ZERO, U + FE00 VS1 (0︀).[7][8]

Za dvanácti znaky (#, * a číslice) může následovat U + FE0E VS15 nebo U + FE0F VS16 pro vytvoření emodži varianty.[9][10][11][12]Oni jsou klíčenka základní znaky, například # ️⃣ (U + 0023 ZNAMENÍ ČÍSLA U + FE0F VS16 U + 20E3 KOMBINACE PŘIHLÁŠENÍ KEYCAP). Verze VS15 je „textová prezentace“, zatímco verze VS16 je „ve stylu emoji“.[8]

Sekvence variací emodži
U +0023002A0030003100320033003400350036003700380039
základna#*0123456789
základna + VS15 + klíčenka#︎⃣*︎⃣0︎⃣1︎⃣2︎⃣3︎⃣4︎⃣5︎⃣6︎⃣7︎⃣8︎⃣9︎⃣
základna + VS16 + klíčenka#️⃣*️⃣0️⃣1️⃣2️⃣3️⃣4️⃣5️⃣6️⃣7️⃣8️⃣9️⃣

Dějiny

Následující dokumenty související s Unicode zaznamenávají účel a proces definování konkrétních znaků v bloku Základní latinka:

VerzeKonečné body kódu[A]PočetUTC IDL2 IDWG2 IDDokument
1.0.0U + 0000..007F128(být odhodlán)
UTC / 1999-013Karlsson, Kent (1999-05-27), Tildes a micro sign decompositions
L2 / 99-176RMoore, Lisa (04.11.1999), „Mapování případů mikroskopů“, Zápis ze společného zasedání UTC / L2 v Seattlu, 8. – 10. Června 1999
L2 / 04-145Starner, David (2004-04-30), C s příklady znaků tahu ze zprávy BAE 1884 (Dorsey)
L2 / 04-202Anderson, Deborah (06.06.2004), Slashed C Feedback
N3046Suignard, Michel (2006-02-22), Vylepšení formální definice řídicích znaků
N3103 (pdf, doc )Umamaheswaran, V. S. (2006-08-25), "M48.33", Nepotvrzené zápisy ze schůze WG 2 48, Mountain View, CA, USA; 2006-04-24 / 27
L2 / 11-043Freytag, Asmus; Karlsson, Kent (02.02.2011), Návrh na opravu chyb a nesrovnalostí v určitých přiřazeních vlastností u super a indexovaných písmen
L2 / 11-160PRI # 181 Změna obecné kategorie dvanácti postav, 2011-05-02
L2 / 11-261R2Moore, Lisa (2011-08-16), „Consensus 128-C3“, UTC # 128 / L2 # 225 minut, Přijměte doporučení Kena Whistlera v L2 / 11-281 týkající se aliasů jmen pro kontrolní znaky s přidáním zkratek BEL a NUL.
L2 / 11-438[b][C]N4182Edberg, Peter (22.12.2011), Sekvence variací emodži (revize L2 / 11-429)
L2 / 15-107Moore, Lisa (2015-05-12), „Consensus 143-C5“, UTC # 143 minut, Přidejte 12 sekvencí klíčových kláves v emoji-data.txt jako provizorní pojmenované sekvence v Unicode 8.0.
L2 / 15-268Beeton, Barbara; Freytag, Asmus; Iancu, Laurențiu; Sargent, Murray (2015-10-30), Návrh reprezentace lomené nulové varianty prázdné sady
L2 / 15-301[d][C]Pournader, Roozbeh (01.11.2015), Návrh 278 standardizovaných variačních sekvencí pro emodži
L2 / 15-254Moore, Lisa (2015-11-16), „B.12.1.2 Návrh na zastoupení sekané nulové varianty prázdné sady“, UTC # 145 minut
L2 / 17-294N4914Lunde, Ken (2017-08-14), Návrh na přidání standardizované variační sekvence pro U + FF10 FULLWIDTH DIGIT ZERO
  1. ^ Navrhované názvy kódových bodů a znaků se mohou lišit od konečných kódových bodů a jmen znaků
  2. ^ Viz také L2 / 10-458, L2 / 11-414, L2 / 11-415, a L2 / 11-429
  3. ^ A b Odkazovat na sekce historie bloku Různé symboly a piktogramy pro další dokumenty související s emodži
  4. ^ Viz také L2 / 15-198 a L2 / 15-275

Viz také

Reference

  1. ^ "Databáze znaků Unicode". Standard Unicode. Citováno 2016-07-09.
  2. ^ „Výčet verzí standardu Unicode“. Standard Unicode. Citováno 2016-07-09.
  3. ^ Standardní verze Unicode 1.0, svazek 1. Addison-Wesley Publishing Company, Inc. 1990. ISBN  0-201-56788-1.
  4. ^ „3.8: Grafy po blocích“ (PDF). Standard Unicode. verze 1.0. Konsorcium Unicode.
  5. ^ Řazení všeho: Kdy zpětné lomítko není zpětné lomítko?
  6. ^ A b C d E F G „Tabulky kódů Unicode 6.2“ (PDF). Standard Unicode. Citováno 1. dubna 2013.
  7. ^ Beeton, Barbara; Freytag, Asmus; Iancu, Laurențiu; Sargent, Murray (2015-10-30). „L2 / 15-268: Návrh na reprezentaci lomené nulové varianty prázdné sady“ (PDF).
  8. ^ A b „Variační sekvence emodži UTS # 51“. Konsorcium Unicode.
  9. ^ Edberg, Peter (22.12.2011). „L2 / 11-438: Emoji Variation Sequences (revize L2 / 11-429)“ (PDF).
  10. ^ Pournader, Roozbeh (01.11.2015). „L2 / 15-301: Návrh 278 standardizovaných variačních sekvencí pro emodži“ (PDF).
  11. ^ „UTR # 51: Unicode Emoji“. Konsorcium Unicode. 2020-02-11.
  12. ^ „UCD: Emoji Data for UTR # 51“. Konsorcium Unicode. 2020-01-28.