Unicode

ett projekt för hantering av bokstäver och tecken från världens alla språk. – Unicode ger varje tecken som finns i minst ett språk ett eget nummer. Detta är inte okomplicerat, eftersom tecken i två olika skriftsystem kan se likadana ut (till exempel latinets C och ryska C – se glyf), men ha olika ljudvärde eller annan funktion (se karaktär). Och samma tecken i ett och samma språk kan se olika ut i olika samman­hang. För närvarande ingår över 110 000 tecken från över hundra skrift­­system i Unicode. – Unicode skiljer inte mellan typografiska varianter av samma tecken, men däremot mellan betydelseskiljande varianter som stora och små bokstäver (björn är till exempel inte samma ord som Björn). – Unicode är inte namnet på ett sätt att koda tecken så att de kan hanteras av datorer, men det finns teckenkodningssystem som bygger på Unicode, nämligen UTF‑8, UTF‑16 och UTF‑32 (se UTF) samt det föråldrade UCS‑2. – Se unicode.org. – Unicode ligger till grund för teckenkodningen i de flesta nyare system. Det ersätter äldre teckenkodningar som ASCII, som bara har plats för ett litet antal tecken. Unicode numrerar tecknen på samma sätt som standarden ISO/IEC 10646 (länk). – Unicode drivs av Unicode Consortium (länk), som grundades 1988. – Se också Noto, Pango och Script encoding initiative.

[tecken] [ändrad 8 februari 2023]

Dagens ord: 2021-12-21