tokenisering

  1. – i it-säkerhet: ersättning av känsliga data med tecken­följder som är oanvänd­bara för utom­stå­ende, om de kommer över dem. – Med känsliga data menas främst person­upp­gifter och lösen­ord. Tokenisering används också för kontokortsbetalningar. De känsliga uppgifterna byts av en särskild funktion i sys­temet ut mot slump­mässiga tecken­följder (tokens) som fungerar enbart inom ramen för säker­hets­systemet. – Se ut­för­lig beskriv­ning i Wikipedia. – Token­ization är inte samma sak som kryp­te­ring;
  2. – i språkvetenskap: uppdelning av en text i delar som kan behandlas som ord eller andra betydelsebärande teckensträngar. Ibland också det att man ersätter varje sådan del med ett kodord. Används i text­analys som första ledet i taggning. (Läs också om lexem, betydelse 1.)

[it-säkerhet] [språkteknik] [ändrad 25 januari 2018]

stilometri

stilanalys – studiet av individuella och gruppmässiga kännetecken i tal och skriven text med statistiska metoder, numera med datorprogram. – Syftet är att fastställa vem som har skrivit texten (är det verkligen Shakespeare), eller vad som är typiskt för större grupper, som kvinnor och män. Normalt bortser man från uppenbara ledtrådar, som att den som skriver om makeup troligen är kvinna och att den som skriver om hylsnycklar troligen är man. Sådant är lätt att fuska med. I stället studerar man subtila skillnader som val av småord och kommatering. – På engelska: stylometry. – Läs också om Anonymouth och om kodstilometri.

[språkteknik] [ändrad 5 februari 2019]

skriftprofil

(writeprint) – ordval, stavning och annat som kännetecknar skribenter. – Skriftprofilen kan fastställas med statistiska metoder och kan användas vid bedömningen av vem som har, eller inte har, skrivit en text. – Även stilometriska kännetecken (handstil, uppställning av text) kan ingå i skriftprofilen. – Engelska writeprint anspelar på fingerprint. – Se också profil.

[språkteknik] [ändrad 28 april 2021]