ordstamsigenkänning

(stemming) – automatisk igenkänning av den viktigaste delen av ett ord, stammen, med användning av datorprogram. Till exempel att skatorna kommer av skata. – Syftet är att man ska hitta och vid behov sammanföra böjningsformer av samma ord. – Exempel: om man utgår från ordet katten hittar man med ordstamsigenkänning ordstammen katt, och då kan man också hitta böjningsformer som katter och katterna. Det är (oftast) relativt enkelt på engelska, men krångligare på svenska, där vi har gott om böjningar som cykel—cyklar och fot—fötter. Men även engelska har svårigheter om man breddar betydelsen av ordstamsigenkänning till att också gälla böjningsformer som be, am, are, is, was, were. – Ordstamsigenkänning är en form av språk­teknik och används i datalingvistik. – Ordstamsigenkänning är praktiskt användbar i sökmotorer, för maskinöversättning och i program som söker information i textmassor. – Program för ordstamsigenkänning kallas på engelska för stemmers. Det finns två huvudtyper: lexikala, som bygger på ordlistor med böjningsformer, och algoritmiska, som bygger på regler. Praktiskt användbara program använder båda metoderna.

[språkteknik] [sökningar] [ändrad 15 februari 2018]

AWK

ett program för sökning i text. Med kryptiska men enkla tecken anger man vilken text som awk ska leta efter, och vad pro­­gram­met ska göra om det hittar det sökta – till exempel skriva ut text­­raden som den sökta texten finns på. AWK brukar följa med Unix och Unix­­kom­pa­tibla program. – AWK är upp­­kallat efter sina skapare Alfred Aho, Peter Wein­berger och Brian Kernighan. – Utförlig beskrivning finns i Wikipedia.

[förkortningar på A] [sökningar] [unix] [ändrad 13 november 2020]

skalmatchning

eller bara matchning, på engelska: globbing eller filename globbing – sökning efter filer med hjälp av jokertecken. – Exempel: filnamnet globbing.* har joker­­tecknet *. Det står för noll, ett eller flera val­­fria tecken. Det kan därför motsvaras av filerna globbing.doc, globbing.jpg, globbing.htm och så vidare. – Skalmatchning är ett kraftfullt sätt att hitta information, men det används också för sabotage: sabotören sätter igång jättelika sökningar med skalmatchning så att systemet inte orkar med. Den amerikanska it‑säkerhetsorganisationen CERT har en beskriv­ning här.

[attacker] [sökningar] [ändrad 15 oktober 2019]

gallring

(pruning, på svenska också: beskärning) – borttagande av onödiga delar. – Inom it används ordet om algoritmer för automatisk sökning, klassificering och beslutsfattande samt om artificiella neuronnät. När det gäller sökningar och liknande innebär gallring att man tar bort sökkriterier som inte behövs för sökningen, eller som kanske krånglar till den i onödan. I en algoritm som klassificerar fåglar finns det till exempel inget behov av ett kriterium för tänder (vilket kan ha funnits med från början som ett arv från ett mer generellt system). Det kan också visa sig att ett sökkriterium aldrig används, eller inte har någon betydelse för resultatet. Eller det kan visa sig att två sökkriterier ger samma utfall, och då räcker det med ett av dem. Man kan också behöva gallra för att minska antalet möjliga utfall. När det gäller artificiella neuronnät innebär gallring att man från nätverket tar bort noder som inte påverkar resultatet av beräkningarna.

[ai] [sökningar] [ändrad 9 februari 2020]

hashtabell

tabell som automatiskt sorterar stora data­mängder på ett sätt som ger snabba svar på sökningar (frågor). Söktiden blir ungefär samma för alla data, och det är enkelt att utöka en hash­tabell. – En hashtabell delar upp datamängden i ett antal delar, så kallade hinkar (buckets), på ett sådant sätt att det blir ungefär lika stor mängd data i varje hink. Varje uppgift (varje post) i tabellen tilldelas en nyckel, och nyckeln avgör vilken hink uppgiften placeras i. Nyckeln beräknas matematiskt utifrån uppgiftens sökord. När någon gör en sökning på samma sökord upprepar programmet den matematiska beräkningen, får fram nyckeln och söker sedan i den ”hink” som motsvarar nyckeln. Detta spar tid jämfört med att söka igenom alla hinkarna. – Målet är att alla ”hinkar” ska vara lika stora och förbli lika stora när tabellen växer. Man väljer därför en metod för beräkning av nycklar som ger en jämn fördelning. Eftersom arbetet utförs av en dator behöver fördelningen inte vara förutsägbar för människor. – Namnet hashtabell kommer av den matematiska termen hash (kondensat), men man behöver inte beräkna nyckeln genom att göra ett kondensat, det finns andra sätt. – Se också distribuerad hashtabell. – Mer i Wikipedia. – På engelska: hash table.

[databaser] [sökningar] [ändrad 29 november 2019]

escape

i datorteknik: avbrott, eller skifte; som verb: avbryta för, undanta:

  1. Esc-tangenten på tangentbordet var ursprungligen till för att användaren skulle kunna stoppa en program­körning. Det gjordes när programmet hade fastnat i en slinga, alltså gick och gick utan att bli färdigt. Den användningen är en kvarleva från äldre tangentbord och fungerar sällan i nyare program. (I stället brukar man använda tangentkombinationen ctrl‑alt‑delete.) – Esc‑tangenten är ibland märkt med tecknet ⎋;
  2. – i en del program kan man använda Esc-tangenten för att avbryta, alltså att stänga aktiva fönster och backa ut ur ett pågående jobb;
  3. – i programmering betyder instruk­tionen escape att det kommer ett skifte mellan program­kod och text skriven i naturligt språk för människor (alltså kom­men­tarer till koden). Eftersom både text och programkod skrivs med tangent­bordet behövs ett sätt att markera vad som är vad. En escape sequence anger att de tecken som följer är instruktioner, inte text. I ASCII‑tabellen finns en escape character (avbrottstecken, skiftestecken), tecken nummer 27, som har denna funktion. Escape a charactercitera ett tecken, avbryta för ett tecken, undanta ett tecken – alltså: markera att tecknet ska skrivas som det är, inte tolkas som del av program­kod. – Se också utkommen­tera;
  4. – när man formulerar sökvillkor vid sökningar på webben eller i databaser används skiftestecken ibland för att ange att tecken som * och ? ska tolkas som vanliga tecken, citeras, inte tolkas som jokertecken.

– Utanför datorteknik betyder escape oftast flykt, rymning. I fysik talar man om escape velocity, flykthastighet – den hastighet som en rymdfarkost måste ha för att kunna lämna jordens gravitationsfält. Det uttrycket används ibland om när en produkt eller ett företag börjar bli framgångsrikt.

[användargränssnitt] [programmering] [sökmotorer] [sökningar] [tangentbord] [ändrad 24 januari 2021]

icke-girig

(non-greedy) – om sökvillkor: som bara hittar de ord eller fraser som exakt svarar mot sök­vill­koret. – Termen icke‑girig an­vänds när man söker efter text med reguljära ut­tryck. Enkelt exempel: om man söker efter ordet ”päron” med ett icke‑girigt reguljärt ut­tryck får man bara träff på ordet ”päron”. Men med alternativet, ett girigt reguljärt ut­tryck får man också träff på ord som ”päron­träd”, ”päron­träds­beskärning” och ”päronträdsbeskärnings­konsulent”.

[sökningar] [ändrad 3 september 2020]

uttömmande

om problemlösning: att systematiskt pröva alla tänk­­bara lösningar. (Alterna­tivet är att ana­ly­sera problemet för att ringa in de mest sannolika lösningarna och pröva dem först.) – På engelska: ex­haustive, även brute force; jämför också med war. – Se också ut­­töm­mande attack och uttömmande sökning.

[attacker] [sökningar] [ändrad 14 september 2020]

vänstertrunkering

borttagning av början av ett ord vid sökning. (Ordets början står ju till vänster.) Ett vanligt skäl till att man gör så är att man söker efter sammansatta ord som slutar på samma ord, eller efter ord som rimmar. Exem­pel: genom att söka på *trunkering får du träff på både vänstertrunkering och högertrunkering, samt på enbart trunkering. Man trun­kerar ordet i början (till vänster) och sätter dit ett jokertecken, vanligtvis aste­risk. – På engelska: left-hand truncation.

[sökningar] [ändrad 24 maj 2020]