Unicode: verschil tussen versies

Verwijderde inhoud Toegevoegde inhoud
Madyno (overleg | bijdragen)
Geen bewerkingssamenvatting
Regel 75:
Unicode biedt verschillende methoden om deze waarden te representeren (''encoding forms''):
* [[UTF-32]]: Tekens worden opgeslagen als 32-bits getal. Een nadeel is dat ook kleine codes vier bytes vergen.
* [[UTF-16]]: Tekens worden opgeslagen als een of twee 16-bits getallen, afhankelijk van de hun toegekende waarde. UTF-16 is een uitbreiding van [[UCS-2]], de codering van Unicode t/m versie 1.1. Voor de tekens die worden opgeslagen als twee 16-bits getallen, worden alleen de 2.0482048 16-bits getallen gebruikt die niet afzonderlijk worden gebruikt voor de opslag van een teken,. waardoorDaardoor voorblijven het laatsteer 63.488 16-bits getallen resterenover voor deze codering. <!--Wat betekent de volgende zin??-->Van deze 2.0482048 16-bits getallen worden er 1.0241024 uitsluitend gebruikt als eerste van de twee getallen, en 1.0241024 uitsluitend als tweede, wat 1.048.576 combinaties oplevert.
* [[UTF-8]]: Tekens worden opgeslagen als een tot vier 8-bits getallen, afhankelijk van de hun toegekende waarde. Voor de tekens die worden opgeslagen als twee tot vier 8-bits getallen, worden niet de 128 8-bits getallen gebruikt die afzonderlijk worden gebruikt voor de opslag van een teken. Van de resterende 128 8-bits getallen worden er 64 uitsluitend gebruikt voor de vervolg-8-bits getallen voor tekens die worden opgeslagen als twee tot vier 8-bits getallen. Van de resterende 64 8-bits getallen worden er 32 uitsluitend gebruikt voor het eerste 8-bits getal voor de 1.920 tekens die worden opgeslagen als twee 8-bits getallen, 16 uitsluitend voor het eerste 8-bits getal voor de 61.568 tekens die worden opgeslagen als drie 8-bits getallen, 8 uitsluitend voor het eerste 8-bits getal voor de 1.048.576 tekens die worden opgeslagen als vier 8-bits getallen, en 8 niet gebruikt. In deze codering worden ASCII-tekens onveranderd gecodeerd, en vergen daardoor minder geheugen dan met UTF-16 (een in plaats van twee bytes), maar vrij grote codes vergen meer geheugen (drie in plaats van twee bytes).
 
<small>