textmatchning

sökning efter likheter mellan olika textdokument. – Syftet är ofta att upptäcka plagiat eller fusk. Textmatchning görs med datorprogram, ofta genom webbaserade tjänster. En given text – ofta en vetenskaplig artikel eller en uppsats – jämförs med ett stort antal texter från webben.  Programmen letar inte enbart efter exakt likalydande text, utan kan utgå från ett ”fingeravtryck” av texten, baserat på vilka ord som är vanliga och andra mönster. – Textmatchning är inget säkert sätt att upptäcka plagiat och fusk. I synnerhet i tekniska och naturvetenskapliga artiklar finns det nämligen många stående uttryck och formuleringar som många skribenter använder utan att det därför är plagiat. Misstänkta fall av plagiat och fusk måste därför alltid granskas av en kompetent mänsklig bedömare. – Tjänster för textmatching är bland andra Ithenticate (ithenticate.com) och Ouriginal (ouriginal.com) (tidigare Urkund). – På engelska: text matching. Man talar också om plagiarism detection. – Se artikel från 2022 i tidskriften Curie. – Läs också om robust hashing.

[källkritik] [språkteknik] [upphovsrätt] [ändrad 15 juni 2022]

Dagens ord: 2022-04-20