ordstamsigenkänning

(stemming) – igenkänning av den viktigaste delen av ett ord, stammen, med hjälp av dator­­program. Till exempel att skatorna kommer av skata. – Syftet är att man ska hitta och vid behov sammanföra böjningsformer av samma ord. – Exempel: om man utgår från ordet katten hittar man med ordstamsigenkänning ordstammen katt, och då kan man också hitta böjnings­former som katter och katterna. Det är (oftast) relativt enkelt på engelska, men krångligare på svenska, där vi har gott om böjningar som cykel—cyklar och fot—fötter. Men även engelska har svårigheter om man breddar betydelsen av ordstamsigenkänning till att också gälla böjningsformer som be, am, are, is, was, were. – Ordstamsigenkänning är en form av språk­teknologi och används i data­lingvistik. – Ordstamsigenkänning är praktiskt använd­bar i sök­motorer, för maskinöversättning och i program som söker information i textmassor. – Program för ordstamsigenkänning kallas på engelska för stemmers. Det finns två huvudtyper: lexikala, som bygger på ordlistor med böjningsformer, och algoritmiska, som bygger på regler. Praktiskt användbara program använder båda metoderna.

[språkteknik] [sökningar] [ändrad 15 februari 2018]

Dagens ord: 2019-06-15