Unicode

projekt för hantering av bokstäver och tecken från världens alla språk. För när­varande ingår över 110 000 tecken från över hundra skrift­­system i Unicode. – Unicode ger varje tecken i varje språk ett eget nummer. Detta är inte okomplicerat, eftersom tecken i två olika skriftsystem kan se likadana ut (se glyf), men ha olika ljudvärde eller annan funktion (se karaktär). Och samma tecken i ett och samma språk kan se olika ut i olika samman­hang. – Unicode skiljer inte mellan typografiska varianter av samma tecken, men däremot mellan betydelseskiljande varianter som stora och små bokstäver (björn är till exempel inte samma ord som Björn). – Unicode är inte namnet på ett sätt att koda tecken så att de kan hanteras av datorer, men det finns teckenkodningssystem som bygger på Unicode, nämligen UTF‑8, UTF‑16 och UTF‑32 (se UTF) samt det föråldrade UCS‑2. – Se unicode.org. – Unicode ligger till grund för teckenkodningen i de flesta nyare system. Det ersätter äldre teckenkodningar som ASCII, som bara har plats för ett litet antal tecken. Unicode numrerar tecknen på samma sätt som standarden ISO/IEC 10646. – Se också Noto, Pango och Script encoding initiative.

[tecken] [ändrad 20 mars 2018]

Dagens ord: 2021-12-21