(bag of words – BoW) – ett sätt att sammanfatta en text i datoriserad språkbehandling. – I en påse med ord räknar man hur många gånger varje ord förekommer i texten, men man tar ingen hänsyn till ordföljd eller grammatiska regler. Detta kan ge tillräcklig information för maskininlärning eller för identifiering av spam eller annan klassificering av textdokument. – Mer i denna introduktion: machinelearningmastery.com….
[språkteknik] [14 maj 2023]