BlenderBot

en dialogrobot från Facebooks moderbolag Meta. – BlenderBot lanserades i augusti 2022. Liksom andra dialogrobotar sätter den samman svar på frågor genom att söka igenom enorma textmängder på internet efter passande formuleringar. Detta ledde snabbt till att BlenderBot kom med synpunkter som Meta troligen inte hade tänkt sig, eller önskat. Bland annat kritiserade den Metas ägare Mark Zuckerberg och Facebook samt stämde in i diverse konspirationsteorier. – Den version som släpptes i augusti 2022 var BlenderBot 3. Den är när detta skrivs bara tillgänglig i USA. – Se ai.facebook.com/blog….

[artificiell skenbar intelligens] [dialogrobotar] [språkteknik] [11 augusti 2022]

NLLB-200

ett system för maskinöversättning som uppges kunna översätta mellan 200 olika språk. – NLLB-200, som presenterades i juli 2022, har utvecklats av Facebooks moderbolag Meta i gruppen för artificiell intelligens. Ett mål är att göra maskinöversättning tillgänglig för språk som talas av få personer, eller som sällan används på internet – NLLB står för No language left behind. Detta till skillnad från den mest kända tjänsten för maskinöversättning, Google Translate, som fungerar bäst på språk som är väl representerade på internet, som engelska och svenska, men som till exempel klarar bara ett fåtal afrikanska språk. Källkoden till NLLB-200 finns på GitHublänk. – Se ai.facebook.com/blog…. – IDG:s artiklar om NLLB-200: länk.

[förkortningar på N] [maskinöversättning] [8 juli 2022]

LaMDA

en dialogrobot från Google. – LaMDA, som presenterades 2021, har utvecklats för att efterlikna riktiga, informella samtal mellan människor. Det innebär att ett samtal kan handla om en sak i början för att sedan handla om något helt annat, och så vidare. Tidigare dialogrobotar kan inte byta spår på det sättet. – LaMDA står för Language model for dialog applications. – En forskare på Google, Blake Lemoine (cajundiscordian.medium.com), stängdes i juni 2022 av från sitt arbete, men med lön, efter att han påstått att LaMDA är en tänkande och kännande varelse. Lemoine har också publicerat dialoger med LaMDA utan tillåtelse och försökt anlita en advokat som ska representera LaMDA. – Se Googles blogg (blog.google…) och denna vetenskapliga artikel: arxiv.org/pdf….– Lemoine avskedades i juli 2022. – LaMDA ska inte förväxlas med lambda.

[ai] [dialogrobotar] [språkteknik] [ändrad 23 juli 2022]

textmatchning

sökning efter likheter mellan olika textdokument. – Syftet är ofta att upptäcka plagiat eller fusk. Textmatchning görs med datorprogram, ofta genom webbaserade tjänster. En given text – ofta en vetenskaplig artikel eller en uppsats – jämförs med ett stort antal texter från webben.  Programmen letar inte enbart efter exakt likalydande text, utan kan utgå från ett ”fingeravtryck” av texten, baserat på vilka ord som är vanliga och andra mönster. – Textmatchning är inget säkert sätt att upptäcka plagiat och fusk. I synnerhet i tekniska och naturvetenskapliga artiklar finns det nämligen många stående uttryck och formuleringar som många skribenter använder utan att det därför är plagiat. Misstänkta fall av plagiat och fusk måste därför alltid granskas av en kompetent mänsklig bedömare. – Tjänster för textmatching är bland andra Ithenticate (ithenticate.com) och Ouriginal (ouriginal.com) (tidigare Urkund). – På engelska: text matching. Man talar också om plagiarism detection. – Se artikel från 2022 i tidskriften Curie. – Läs också om robust hashing.

[källkritik] [språkteknik] [upphovsrätt] [ändrad 15 juni 2022]

GPT-3

ett system som kan producera text som verkar vara skriven av människor. – GPT‑3 bygger på ett enormt system för maskininlärning, baserat på mängder av autentisk text. Om en användare matar in början på en text ger GPT‑3 förslag om hur texten ska fortsätta. Man kan också ge GPT‑3 förebilder för den text man önskar få skriven. Systemet fungerar utan mänsklig handledning. – Ett problem, som påpekades av forskare kort efter att GPT‑3 presenterades (se denna länk), är att systemet kan producera alla slags text. Det kan alltså framställa falska nyheter, spam och näthat – allt baserat på inslag i de väldiga textmassor, insamlade från internet, som används för maskininlärningen. – GPT‑3 presenterades 2020, och är utvecklat av företaget OpenAI (openai.com). Samma år köpte Microsoft exklusiv licens till GPT‑3. Andra kan använda GPT‑3 genom ett API, men bara Microsoft har tillgång till det underliggande systemet. GPT står för generative pre‑trained transformer. Det finns två tidigare liknande system. Ibland talar man om GPT-n. – Se openai.com/blog/openai-api.

[förkortningar på G] [maskininlärning] [språkteknik] [23 mars 2022]

Fabricius

en tjänst som tolkar hieroglyfer. – Den webbaserade tjänsten tar artificiell intelligens till hjälp för att tyda hieroglyfer. Man kan också använda den för att lära sig mer om hieroglyfer, och det går också att skicka enklare meddelanden, skrivna med hieroglyfer. – Fabricius lanserades 2020 och är ett samarbete mellan Google och det australiska centret för egyptologi vid Macquarie University (mq.edu.au…), Ubisoft (ubisoft.com) and Psycle Interactive (psycle.com). – Se artsexperiments.withgoogle.com/fabricius.

[språk] [8 februari 2021]