Unicode: verschil tussen versies

Verwijderde inhoud Toegevoegde inhoud
→‎Codering: correctie en verduidelijking
Regel 71:
 
== Codering ==
De Unicodestandaard kent aan elk teken een volgnummer toe, dat geschreven wordt als U+xxxx, U+xxxxx of U+xxxxxx, waarin de x'en de 4 tot 6 [[Hexadecimaal|hexadecimale]] cijfers van het volgnummer zijn (voorloopnullen worden dus in ieder geval toegevoegd om aan te vullen tot vier hexadecimale cijfers, extra voorloopnullen zijn optioneel). De codes die gekoppeld zijn of kunnen worden aan een teken lopen van U+0000 (0) tot en met U+D7FF (55.295) en van U+E000 (57.344) tot en met U+10FFFF (1.114.111). Dat zijn 55.296 + 8.192 = 63.488 (0xF800) tekens met een code tot en met twee bytes, plus 1.048.576 (0x100000) andere, in totaal 1.112.064 (0x10F800). De onderbreking bestaat uit 2048 (0x800) codes die ten behoeve van gunstige eigenschappen van de UTF-16-codering niet gebruikt worden.
 
Unicode biedt verschillende methoden om deze waarden te representeren (''encoding forms''):
Regel 86:
!Opmerkingen
|-
|U+0000..U+007F<br />(128 = 0x80 ASCII-equivalenten)
|00000000 00000000<br />00000000 0aaaaaaa
|00000000 0aaaaaaa
Regel 92:
|
|-
|U+0080..U+07FF<br />(1.920 = 0x780 [[codepunt]]en)
|00000000 00000000<br />00000bbb aaaaaaaa
|00000bbb aaaaaaaa
Regel 98:
|
|-
|U+0800..U+D7FF en U+E000..U+FFFF<br />(61.440 = 0xF000 codepunten)
|00000000 00000000 <br />bbbbbbbb aaaaaaaa
|bbbbbbbb aaaaaaaa
Regel 104:
|
|-
|U+010000..U+10FFFF<br />(1.048.576 = 0x100000 supplementaire codepunten)
|00000000 000ccccc <br />bbbbbbbb aaaaaaaa
|110110dd ddbbbbbb <br />110111bb aaaaaaaa