Unicode

projekt för hantering av bokstäver och tecken från världens alla språk. För när­varande ingår över 110 000 tecken från över hundra skrift­­system i Unicode. – Uni­code ger varje tecken i varje språk ett eget nummer. Detta är inte okompli­cerat, eftersom tecken i två olika skriftsystem kan se likadana ut (se glyf), men ha olika ljudvärde eller annan funktion (se karaktär). Och samma tecken i ett och samma språk kan se olika ut i olika samman­hang. – Uni­code skiljer inte mellan typo­grafiska varianter av samma tecken, men däremot mellan betydelse­skiljande varianter som stora och små bok­stäver (björn är till exempel inte samma ord som Björn). – Unicode är inte namnet på ett sätt att koda tecken så att de kan hanteras av datorer, men det finns tecken­kodnings­system som bygger på Unicode, nämligen UTF‑8, UTF‑16 och UTF‑32 (se UTF) samt det föråldrade UCS‑2. – Se unicode.org. – Unicode ligger till grund för teckenkodningen i de flesta nyare system. Det ersätter äldre teckenkodningar som ASCII, som bara har plats för ett litet antal tecken. Unicode numrerar tecknen på samma sätt som stan­darden ISO/IEC 10646. – Se också Noto, Pango och Script encoding initiative.

[tecken] [ändrad 20 mars 2018]

Dagens ord: 2018-03-21