VALL-E

ett system för talsyntes som kan efterlikna individuella röster. – Med maskininlärning har VALL‑E ”lyssnat på” 60 000 timmar inspelat engelskt tal och lärt sig om uttal, röstläge, betoning, intonation och annat med variationer. Systemet behöver sedan, enligt uppgift, bara få tillgång några sekunder av en bestämd persons tal för att kunna imitera den personens röst vid uppläsning av skriven text. – VALL‑E har utvecklats av forskare på Microsoft och presenterades i januari 2023 – se denna artikel. – Microsoft uppges när detta skrivs (januari 2023) inte ha några planer på att släppa VALL‑E som produkt eller för testning. Företaget vill först se till att VALL‑E inte kan missbrukas genom att användas för djupfejk. – Namnet anspelar på DALL-E.

[användargränssnitt] [experimentell teknik] [språkteknik] [11 januari 2023]

stor språkmodell

(large language model, LLM) – program som framställer texter baserade på mycket stora textmängder. – Texterna kan verka vara skrivna av människor och de handlar om givna ämnen. De är en sammanställningar av utdrag ur ett stort antal texter. – Stora språkmodeller är en fortsättning på språkmodeller (language models) som, enkelt uttryckt, är program som fyller i nästa ord i en mening (textförslag), baserat på statistisk analys av annan text. Ju mer text programmet har att utgå från, desto bättre blir förslagen. I stora språkmodeller handlar det inte bara om nästa ord, utan om hela fraser. Underlaget kan vara miljoner texter hämtade från Google eller Wikipedia. Stora språkmodeller kan generera hela uppsatser och artiklar. De kan verka vara skrivna av människor, men det har påpekats att texterna brukar bli tråkiga och livlösa. Ett annat problem är att stora språkmodeller kritiklöst tar in fördomar och desinformation från de stora textmängder som de utgår ifrån. Ytterligare ett problem är att studenter kan använda sådana program för att fuska när de ska lämna in uppsatser. – En känd stor språkmodell är GPT-3.

[generativt språk] [11 december 2022]

Erica

en människoliknande robot som bland annat används i försök att lära robotar när de ska skratta. – Syftet är att lära dialogrobotar när det är lämpligt att skratta i ett samtal. I synnerhet gäller det skratt som inte beror på direkta skämt – man skrattar i stället för att man är uppspelt, generad eller bara för att någon annan skrattar. Försöken med Erica pågår under 2022 på universitetet i Kyoto (kyoto‑u.ac…) under ledning av Koji Inoue (sap.ist…). – Läs mer på www.frontiersin.org/articles…. (Observera att roboten Erica utvecklades som en generell forskningsplattform redan 2015, alltså inte bara för skrattprojektet – se robots.ieee.org/robots….)

[dialogrobotar] [språkteknik] [15 september 2022]

BlenderBot

en dialogrobot från Facebooks moderbolag Meta. – BlenderBot lanserades i augusti 2022. Liksom andra dialogrobotar sätter den samman svar på frågor genom att söka igenom enorma textmängder på internet efter passande formuleringar. Detta ledde snabbt till att BlenderBot kom med synpunkter som Meta troligen inte hade tänkt sig, eller önskat. Bland annat kritiserade den Metas ägare Mark Zuckerberg och Facebook samt stämde in i diverse konspirationsteorier. – Den version som släpptes i augusti 2022 var BlenderBot 3. Den är när detta skrivs bara tillgänglig i USA. – Se ai.facebook.com/blog….

[artificiell skenbar intelligens] [dialogrobotar] [språkteknik] [11 augusti 2022]

NLLB-200

ett system för maskinöversättning som uppges kunna översätta mellan 200 olika språk. – NLLB-200, som presenterades i juli 2022, har utvecklats av Facebooks moderbolag Meta i gruppen för artificiell intelligens. Ett mål är att göra maskinöversättning tillgänglig för språk som talas av få personer, eller som sällan används på internet – NLLB står för No language left behind. Detta till skillnad från den mest kända tjänsten för maskinöversättning, Google Translate, som fungerar bäst på språk som är väl representerade på internet, som engelska och svenska, men som till exempel klarar bara ett fåtal afrikanska språk. Källkoden till NLLB-200 finns på GitHublänk. – Se ai.facebook.com/blog…. – IDG:s artiklar om NLLB-200: länk.

[förkortningar på N] [maskinöversättning] [8 juli 2022]