textmatchning

sökning efter likheter mellan olika textdokument. – Syftet är ofta att upptäcka plagiat eller fusk. Textmatchning görs med datorprogram, ofta genom webbaserade tjänster. En given text – ofta en vetenskaplig artikel eller en uppsats – jämförs med ett stort antal texter från webben. Programmen letar inte enbart efter exakt likalydande text, utan kan utgå från ett ”fingeravtryck” av texten, baserat på vilka ord som är vanliga och andra mönster. – Textmatchning är inget säkert sätt att upptäcka plagiat och fusk. I synnerhet i tekniska och naturvetenskapliga artiklar finns det nämligen många stående uttryck och formuleringar som många skribenter använder utan att det därför är plagiat. Misstänkta fall av plagiat och fusk måste därför alltid granskas av en kompetent mänsklig bedömare. – Tjänster för textmatching är bland andra Ithenticate (ithenticate.com) och Ouriginal (ouriginal.com) (tidigare Urkund). – På engelska: text matching. Man talar också om plagiarism detection. – Se artikel från 2022 i tidskriften Curie. – Läs också om robust hashing.

[källkritik] [språkteknik] [upphovsrätt] [ändrad 15 juni 2022]

GPT-3

ett system som kan producera text som verkar vara skriven av människor. – GPT‑3 bygger på ett enormt system för maskininlärning, baserat på mängder av autentisk text. Om en användare matar in början på en text ger GPT‑3 förslag om hur texten ska fortsätta. Man kan också ge GPT‑3 förebilder för den text man önskar få skriven. Systemet fungerar utan mänsklig handledning. – Ett problem, som påpekades av forskare kort efter att GPT‑3 presenterades (se denna länk), är att systemet kan producera alla slags text. Det kan alltså framställa falska nyheter, spam och näthat – allt baserat på inslag i de väldiga textmassor, insamlade från internet, som används för maskininlärningen. – GPT‑3 presenterades 2020, och är utvecklat av företaget OpenAI. Samma år köpte Microsoft exklusiv licens till GPT‑3. Andra kan använda GPT‑3 genom ett API, men bara Microsoft har tillgång till det underliggande systemet. GPT står för generative pre‑trained transformer. Det finns två tidigare liknande system. Ibland talar man om GPT-n. – Läs också om ChatGPT. – Se openai.com/blog/openai-api.

[förkortningar på G] [generativ AI] [generativt språk] [ändrad 12 januari 2023]

ISO

Internationella standardiseringsorganisationen, International organization for standardization – ett internationellt organ för industriella och kommersiella standarder. – ISO grundades 1947 och består av nationella standardiseringsorgan i över 160 länder samt representanter för några storföretag. ISO räknar sig inte som ett mellanstatligt samarbete, utan som en oberoende organisation. – Notera att ISO är en pseudoförkortning. Den valdes eftersom det inte gick att hitta en förkortning som passade på flera språk. (Det svenska namnet är troligen valt i efterhand för att passa till ISO.) – Se iso.org. – Med ISO/IEC betecknas standarder som ISO publicerar gemensamt med International electrotechnical commission, IEC (iec.ch).

[iso] [organisationer] [pseudoförkortningar] [14 mars 2022]

URLLC

ultra reliable low latency communicationsextremt tillförlitlig kommunikation med låg latens – en aspekt av 5g som bland annat innebär att fördröjningen mellan sändare och mottagare inte får överstiga en millisekund. Detta är viktigt eftersom 5g till stor del är tänkt att användas för kommunikation mellan maskiner, till exempel självkörande bilar. Det är också nödvändigt att kommunikationen är tillförlitlig, det vill säga fungerar varje gång. – Se till exempel IEEE:s webbsidor: länk.

[förkortningar på U] [mobilt] [sakernas internet] [6 mars 2022]