stokastisk papegoja

kritisk beteckning på textgeneratorer baserade på stora språkmodeller:

  • – Papegoja därför att textgeneratorer sammanfogar yttranden med sannolikhetsbaserade metoder utan att ”förstå” vad de skriver. De har inte heller någon insikt i vad den mänskliga läsaren har för förkunskaper eller underförstådda förväntningar. En chatt med en dialogrobot som ChatGPT är därför inte som ett samtal mellan människor;
  • Stokastisk därför att det ingår ett element av slumpmässighet. Textgeneratorn utgår från en enorm mängd text, insamlad från internet, och väljer ut ord och fraser som verkar passa till den mänskliga användarens fråga med en kombination av sannolikhetsanalys och slumpmässigt urval.

– Uttrycket stokastisk papegoja användes i artikeln ”On the dangers of stochastic parrots: Can language models be too big?” från 2021 av bland andra Timrit Gebru och Shmargaret Schmitchell: dl.acm.org/doi…

[generativ ai] [generativt språk] [ändrad 26 april 2023]

korpus

stor textmängd insamlad för språkvetenskapliga tillämpningar. – På engelska: corpus.

[språkteknik] [24 mars 2023]