parsning

försvenskning av engelska parsing; to parse – att parsa – uppdelning av något i mindre delar varefter delarna sedan gås igenom systematiskt, en i taget. I språkvetenskap (dataling­vistik) innebär pars­ning att man delar upp texter, meningar och ord i mindre delar för att man ska kunna tolka deras inne­börd och klar­lägga de språk­liga regler som tillämpas, ofta med hjälp av datorbaserade hjälp­medel. – Termen används i besläktad be­ty­delse inom program­me­ring – se parser.

[programmering] [språkteknik] [ändrad 30 november 2019]

ordstamsigenkänning

(stemming) – igenkänning av den viktigaste delen av ett ord, stammen, med hjälp av dator­­program. Till exempel att skatorna kommer av skata. – Syftet är att man ska hitta och vid behov sammanföra böjningsformer av samma ord. – Exempel: om man utgår från ordet katten hittar man med ordstamsigenkänning ordstammen katt, och då kan man också hitta böjnings­former som katter och katterna. Det är (oftast) relativt enkelt på engelska, men krångligare på svenska, där vi har gott om böjningar som cykel—cyklar och fot—fötter. Men även engelska har svårigheter om man breddar betydelsen av ordstamsigenkänning till att också gälla böjningsformer som be, am, are, is, was, were. – Ordstamsigenkänning är en form av språk­teknologi och används i data­lingvistik. – Ordstamsigenkänning är praktiskt använd­bar i sök­motorer, för maskinöversättning och i program som söker information i textmassor. – Program för ordstamsigenkänning kallas på engelska för stemmers. Det finns två huvudtyper: lexikala, som bygger på ordlistor med böjningsformer, och algoritmiska, som bygger på regler. Praktiskt användbara program använder båda metoderna.

[språkteknik] [sökningar] [ändrad 15 februari 2018]

audio indexing

ljudfilsindexering – identifiering av orden i en ljudfil (med användning av taligenkänning) och samman­ställning av ett skriftligt index över orden så att man kan söka i ljud­filen som i en textfil. – Se också audio mining.

[språkteknik] [ändrad 17 november 2019]

läsa

  1. – om datorer: att hämta in­for­ma­tion eller in­struk­tioner från en teknisk anord­ning eller från ett lag­rings­medium. Varje slags teknisk om­­vand­ling av för­­hål­landen i ytter­­världen till impulser som en dator (eller annan digital an­ord­ning) kan be­arbeta kan kallas för att datorn läser: DVD‑spelaren läser (eller spelar upp) en DVD. Inläsning är när datorn måste läsa och spara (i arbets­­minnet) en större data­mängd för att sedan kunna bearbeta den;
  2. (read) – rättighet för en viss användare eller grupp av användare att läsa i ett it‑system. Rättigheten att läsa är en inställning som är knuten till resursen, inte till användare. Det innebär att en användare eller grupp får öppna filerna och visa inne­hållet (text, bild, ljud), men inte får ändra, radera eller kopiera filen (såvida inte ytter­ligare rättig­heter ger tillstånd till det). De andra två grund­­lägg­ande rättig­­het­erna är rätt att skriva och att exe­kvera (köra). – Se också rwx;
  3. – se maskinläsning för när en dator läser text skriven med vanliga bokstäver på papper.

– På engelska: read (i alla betydelserna).

[datalagring] [it-system] [it-säkerhet] [språkteknik] [ändrad 10 september 2019]

core

  1. – om processorer: se kärna;
  2. – core memory, core storagekärnminne – äldre typ av arbets­minne som bestod av magnetiser­bara järnringar, cores, i ett rutnät. Under 1960‑talet ersattes kärn­minnen successivt av halv­ledar­minnen, men på engelska användes core trots det länge som be­teckning på arbets­minnet;
  3. – se Dublin Core;
  4. – se CoreOS;
  5. – core som i hardcore (om någon eller något som har en hård kärna, alltså som är hård, grov, rå, fanatisk). Ordet har flyttats över till andra ord, ibland utan hänsyn till grund­bety­delsen kärna. – Se till exempel bore­core. – Läs också denna artikel i Washingtonian: länk.
  6. – För engelska kernel, se också kärna.

[lagringsmedier] [linux] [processorer] [språkteknik] [språktips] [trender] [ändrad 5 november 2017]

Cupertino effect

bisarr stavnings­rättelse – tokig ändring som görs av ett rätt­­stavnings­­pro­­gram. – Cuper­tino­­effekten heter så därför att ett vanligt rätt­­stavnings­­pro­gram brukar ändra ”cooperatino” (vanlig fel­­skrivning av cooperation) till Cupertino (stad i Silicon Valley). – Be­­nämningen har upp­stått bland EU:s över­­sättare och skribenter. – Den minst lika vanliga fel­­skrivningen ”coperation” brukar bli copulation. – Läs också om apywareclbuttic och Scunthorpeproblemet.

[fel] [kuriosa] [språkteknik]

Wolfram Alpha

ett slags sökmotor som har utvecklats av Stephen Wolfram, och som kan svara på skriftliga frågor. Den blev till­­gänglig för all­­män­­heten i maj 2009. Wolfram Alpha ska kunna förstå frågor ställda i natur­ligt språk (engelska och sedan 2018 även japanska) och ge ett korrekt svar. Till exempel ”where is Tim­buktu?” och ”when did Charles XII die?”. Det är alltså ingen tradi­tio­nell sök­­motor, snarare en ”svars­­motor”. – Se wolframalpha.com. – Jäm­för med IBM:s Watson och med Amazon Echo, Apples Siri, Facebook M†, Microsofts Cortana och Soundhounds Hound.

[ai] [språkteknik] [sökmotorer] [ändrad 10 september 2018]

semantik

  1. – i språkvetenskap och filosofi: läran om ordens betydelser. Det är den ursprung­liga betydelsen;
  2. – i systemutveckling: de termer som används i beskrivningen av it‑system och hur man använder dem, och som har väl definierade betydelser i det sammanhanget. En väl ut­formad semantik gör att man på ett klart och entydigt sätt kan beskriva de före­mål, processer och begrepp som kan existera och behandlas inom ramarna för systemet (se också ontologi);
  3. – om datorteknik som behandlar text i naturliga språk: ordens betydelser, så som en människa förstår dem, till skillnad från orden som godtyckliga följder av tecken. – Läs också om den semantiska webben.

– På engelska: semantics.

[filosofi] [språk] [systemutveckling] [ändrad 3 juni 2020]

dialogrobot

(chatbot) – datorprogram som ska kunna föra en vettig dialog med människor, till exempel svara på frågor. – Dialogrobotar används i seriösa samman­hang, till exempel för rutin­mässig kund­tjänst och teknisk support. Det är inte nödvändigt att dialog­robotar uppfattas som människor, utan de kan ses som en förbättrad variant av talsvar. – Ordet robot syftar har på att programmet agerar själv­ständigt på ett till synes intelligent sätt, utan mänsklig styrning. (Det är alltså ingen plåtgubbe.) En dialog­robot som används i chatt på internet kan också kallas för chatt­robot, på engelska chatbot eller chatterbot. – Under namnet bottar blev dialogrobotar en trend under 2016. – Se också Eugene Goostman, Elbot, Eliza, Loebnerpriset, Tay†, Turingtest, Watson och XiaoIce.

[ai] [mjukvarurobotar] [språkteknik] [ändrad 9 februari 2020]