Anonymouth

ett program som gör det svårare att identifiera författaren av en text. –Anonymouth analyserar först texter skrivna av en skribent för att hitta ord och formuleringar som är typiska för den skribenten. (Det kallas för stilometri.) Sedan ersätter Anonymouth sådana ord och formuleringar med andra, som har samma innebörd, men som inte är kännetecknande för skribenten. Exempel på sådana förändringar, gjorda med Anonymouth, finns i denna artikel i tidskriften New Republic. Programmet utvecklades 2009 av Rachel Greenstadt (länk) med flera på Drexel University i Philadelphia. Koden till Anonymouth finns på GitHub.

[dold identitet] [språkteknik] [ändrad 5 februari 2019]

Scunthorpeproblemet

the Scunthorpe problem – beteckning på idiotisk filtrering av fula ord. Invån­are i den engelska staden Scunthorpe fick 1996 inte registrera konton på America Online eftersom stadens namn innehåller ordet cunt (fitta). (Stadens namn stavades 1086 Escumesthorp, vilket väl också hade fastnat i filtret.) Andra operatörer lär senare ha upprepat dumheten. Wikipedia har en lång lista med liknande exempel på artificiell stupiditet. – Se också apyware, clbuttic och the Cupertino effect.

[fel] [kuriosa] [språkteknik] [ändrad 12 mars 2017]

textförslag

(autocomplete) – datorgenererat förslag till hur ett ord eller en mening ska fortsätta. Det används i synnerhet i program för SMS, chatt och inläsning av text. Textförslag baseras dels på ordlistor, dels på statistik över vad folk brukar skriva.

[språkteknik] [ändrad 19 september 2020]

neural maskinöversättning

en teknik för maskinöversättning som utförs av ett artificiellt neuronnät. – Neural maskinöversättning görs av ett artificiellt neuronnät som har tränats på stora mängder text på källspråket och målspråket. Det är en tredje teknik för maskinöversättning efter den regel- och lexikonstyrda och den statistiska. Google började använda neural maskin­över­sätt­ning hösten 2016 i Google Translate, först enbart för översättning mellan engelska och kinesiska. Enligt en undersökning minskar tekniken antalet fel med upp till 60 procent (se denna länk). Nackdelen med neural maskinöversättning är, liksom med allt som görs med artificiella neuron­nät, att det görs i en ”svart låda”. Det går därför inte att se varför nätverket översätter som det gör, eller att instruera det att göra enstaka ändringar. – På engelska: neural machine translation, NMT. – Läs mer i denna artikel från Google.

[ai] [språkteknik] [ändrad 27 oktober 2021]

Hello Barbie

en talande Barbiedocka som kan föra samtal med människor. – Dockan har ett system för taligenkänning som har utvecklats av företaget Toytalk, som 2016 bytte namn till Pullstring, och som 2019 köptes av Apple. För att kunna föra dialog måste dockan vara ansluten till internet med wi‑fi. – Hello Barbie har fått hård kritik, bland annat för att den gör intrång på barns och familjers rätt till privatliv. Alla dialoger mellan barnet och dockan sparas på Toytalks servrar. Kritiker anser att dockans samtal med barnen kan locka ur barnet uppgifter om familj och vänner som en vuxen troligen inte skulle lämna ut. Barnets föräldrar kan också begära ut inspelningar av barnets dialog med dockan. – Se tillverkaren Mattels webbsidor.

[leksaker] [personlig integritet] [språkteknik] [ändrad 2 augusti 2019]