stor språkmodell

(large language model, LLM) – program som framställer texter baserade på mycket stora textmängder. – Texterna kan verka vara skrivna av människor och de handlar om givna ämnen. De är en sammanställningar av utdrag ur ett stort antal texter. – Stora språkmodeller är en fortsättning på språkmodeller (language models) som, enkelt uttryckt, är program som fyller i nästa ord i en mening (textförslag), baserat på statistisk analys av annan text. Ju mer text programmet har att utgå från, desto bättre blir förslagen. I stora språkmodeller handlar det inte bara om nästa ord, utan om hela fraser. Underlaget kan vara miljoner texter hämtade från Google eller Wikipedia. Stora språkmodeller kan generera hela uppsatser och artiklar. De kan verka vara skrivna av människor, men det har påpekats att texterna brukar bli tråkiga och livlösa. Ett annat problem är att stora språkmodeller kritiklöst tar in fördomar och desinformation från de stora textmängder som de utgår ifrån. Ytterligare ett problem är att studenter kan använda sådana program för att fuska när de ska lämna in uppsatser. – En känd stor språkmodell är GPT-3.

[språkteknik] [11 december 2022]

Dagens ord: 2022-12-19