Kosmos-1

ett språksystem som kan känna igen, beskriva och bearbeta innehållet i bilder. – Kosmos‑1 kan enligt uppgift ge förklaringar till sådant som visas på bilder (”varför gråter pojken?”), lösa matematiska uppgifter som visas på foton, klara bildbaserade IQ‑test, beskriva frisyrer och läsa av klockor och mätinstrument från bilder. Kosmos‑1 har utvecklats av Microsoft och visades upp i mars 2023. Det är en så kallad stor språkmodell. – Se artikel i Ars Technica och denna vetenskapliga artikel: arxiv.org/abs…. – IDG:s artiklar om Kosmos‑1: länk.

[generativt språk] [5 mars 2023]

Antkare, Ike

en icke existerande forskare som 2010 var en av världens mest citerade vetenskapsmän. – ”Ike Antkare” (I can’t care) skapades av datorforskaren Cyril Labbé (länk). Labbé publicerade över 100 artiklar under ”Ike Antkares” namn. Alla var skrivna av textgeneratorn SCIgen och saknade vettigt innehåll. Men artiklarna innehöll massor med källhänvisningar till varandra. (Det är däremot osäkert ifall någon forskare faktiskt hade läst artiklarna.) Resultatet blev att ”Ike Antkare” fick hög placering i h‑index, ett rankningssystem för vetenskapsmän. ”Ike Antkare” var som högst nummer 21 på listan – högre än Albert Einstein. – Labbés syfte var att visa att rankningssystem som h‑index är värdelösa. – Se artikeln ”Ike Antkare one of the great stars in the scientific firmament” (länk) av Cyril Labbé. – Cyril Labbé har avslöjat ett stort antal publicerade ”vetenskapliga” artiklar som i själva verket är producerade av SCIgen. Han har utvecklat ett program som känner igen sådana artiklar – se scigendetection.imag.fr.

[bluff och båg] [fiktiva personer] [generativt språk] [1 mars 2023]

GPTZero

ett system som uppges kunna upptäcka ifall en text är skriven av språkmodellen ChatGPT. – Eftersom ChatGPT kan generera trovärdiga texter på akademisk nivå kan det användas för fusk. Det kan vara svårt eller omöjligt för en mänsklig bedömare att avgöra om texten är skriven av en människa eller av ChatGPT – i varje fall utan att fråga ut den påstådda skribenten. – GPTZero analyserar texten genom att jämföra den med vad ChatGPT brukar generera. Ju mer den testade texten liknar en typisk ChatGPT‑text i struktur, desto mer sannolikt är det att den faktiskt är genererad av ChatGPT. – GPTZero har utvecklats av den amerikanska studenten Edward Tian och presenterades i januari 2023. – Se gpt3demo….

[ai] [bluff och båg] [språkteknik] [12 januari 2023]

ChatGPT

ett AI‑baserat system som kan generera texter som verkar vara skrivna av människor. – ChatGPT kan föra en skriftlig dialog (chatta) med en människa. Det kan också på begäran framställa längre texter, som akademiska uppsatser, om olika ämnen med trovärdigt resultat. Det kan också översätta. – ChatGPT (skrivs också Chat GPT) har utvecklats av företaget OpenAI och släpptes i november 2022. Det är en vidareutveckling av GPT‑3. – Det uppges i januari 2023 att Microsoft, som är delägare i OpenAI, kommer att integrera ChatGPT i sökmotorn Bing. – Abonnemangstjänsten ChatGPT+ tillkännagavs i februari 2023. Den är inledningsvis bara tillgänglig i USA. Se openai.com/blog…. – I grunden har ChatGPT ingen förståelse av vad det skriver, eller av vad den mänskliga motparten skriver. Systemet bygger på maskininlärning baserad på enorma insamlade textmängder och sammanställning och modifiering av passande textbitar. Men till skillnad från liknande system kan ChatGPT ”hålla sig till ämnet”. I en chatt kommer det till exempel ihåg vad det har skrivit tidigare. – Det finns en uppenbar risk att studenter och andra använder ChatGPT för att skriva fuskuppsatser – läs om GPTZero. – Sångaren och låtskrivaren Nick Cave sågar ChatGPT: redhandfiles.com…. – Se chatgptonline.net. – IDG:s artiklar om ChatGPT: länk.

[ai] [generativt språk] [ändrad 1 februari 2023]

VALL-E

ett system för talsyntes som kan efterlikna individuella röster. – Med maskininlärning har VALL‑E ”lyssnat på” 60 000 timmar inspelat engelskt tal och lärt sig om uttal, röstläge, betoning, intonation och annat med variationer. Systemet behöver sedan, enligt uppgift, bara få tillgång några sekunder av en bestämd persons tal för att kunna imitera den personens röst vid uppläsning av skriven text. – VALL‑E har utvecklats av forskare på Microsoft och presenterades i januari 2023 – se denna artikel. – Microsoft uppges när detta skrivs (januari 2023) inte ha några planer på att släppa VALL‑E som produkt eller för testning. Företaget vill först se till att VALL‑E inte kan missbrukas genom att användas för djupfejk. – Namnet anspelar på DALL-E.

[användargränssnitt] [experimentell teknik] [språkteknik] [11 januari 2023]

stor språkmodell

(large language model, LLM) – program som framställer texter baserade på mycket stora textmängder. – Texterna kan verka vara skrivna av människor och de handlar om givna ämnen. De är en sammanställningar av utdrag ur ett stort antal texter. – Stora språkmodeller är en fortsättning på språkmodeller (language models) som, enkelt uttryckt, är program som fyller i nästa ord i en mening (textförslag), baserat på statistisk analys av annan text. Ju mer text programmet har att utgå från, desto bättre blir förslagen. I stora språkmodeller handlar det inte bara om nästa ord, utan om hela fraser. Underlaget kan vara miljoner texter hämtade från Google eller Wikipedia. Stora språkmodeller kan generera hela uppsatser och artiklar. De kan verka vara skrivna av människor, men det har påpekats att texterna brukar bli tråkiga och livlösa. Ett annat problem är att stora språkmodeller kritiklöst tar in fördomar och desinformation från de stora textmängder som de utgår ifrån. Ytterligare ett problem är att studenter kan använda sådana program för att fuska när de ska lämna in uppsatser. – En känd stor språkmodell är GPT-3.

[språkteknik] [11 december 2022]

Erica

en människoliknande robot som bland annat används i försök att lära robotar när de ska skratta. – Syftet är att lära dialogrobotar när det är lämpligt att skratta i ett samtal. I synnerhet gäller det skratt som inte beror på direkta skämt – man skrattar i stället för att man är uppspelt, generad eller bara för att någon annan skrattar. Försöken med Erica pågår under 2022 på universitetet i Kyoto (kyoto‑u.ac…) under ledning av Koji Inoue (sap.ist…). – Läs mer på www.frontiersin.org/articles…. (Observera att roboten Erica utvecklades som en generell forskningsplattform redan 2015, alltså inte bara för skrattprojektet – se robots.ieee.org/robots….)

[dialogrobotar] [språkteknik] [15 september 2022]