(stemming) – automatisk igenkänning av den viktigaste delen av ett ord, stammen, med användning av datorprogram. Till exempel att skatorna kommer av skata. – Syftet är att man ska hitta och vid behov sammanföra böjningsformer av samma ord. – Exempel: om man utgår från ordet katten hittar man med ordstamsigenkänning ordstammen katt, och då kan man också hitta böjningsformer som katter och katterna. Det är (oftast) relativt enkelt på engelska, men krångligare på svenska, där vi har gott om böjningar som cykel—cyklar och fot—fötter. Men även engelska har svårigheter om man breddar betydelsen av ordstamsigenkänning till att också gälla böjningsformer som be, am, are, is, was, were. – Ordstamsigenkänning är en form av språkteknik och används i datalingvistik. – Ordstamsigenkänning är praktiskt användbar i sökmotorer, för maskinöversättning och i program som söker information i textmassor. – Program för ordstamsigenkänning kallas på engelska för stemmers. Det finns två huvudtyper: lexikala, som bygger på ordlistor med böjningsformer, och algoritmiska, som bygger på regler. Praktiskt användbara program använder båda metoderna.
[språkteknik] [sökningar] [ändrad 15 februari 2018]
ett söksystem för internt bruk på organisationer. Det har utvecklats i öppen källkod av Apache software foundation, och räknas som det mest spridda söksystemet för företag. – Apache Solr används bland annat i IBM:s Verse. – Solr ska uttalas som engelska solar. – Se lucene.apache.org/solr.
[sökningar] [ändrad 9 november 2018]
ett program för sökning i text. Med kryptiska men enkla tecken anger man vilken text som awk ska leta efter, och vad programmet ska göra om det hittar det sökta – till exempel skriva ut textraden som den sökta texten finns på. AWK brukar följa med Unix och Unixkompatibla program. – AWK är uppkallat efter sina skapare Alfred Aho, Peter Weinberger och Brian Kernighan. – Utförlig beskrivning finns i Wikipedia.
[förkortningar på A] [sökningar] [unix] [ändrad 13 november 2020]
eller bara matchning, på engelska: globbing eller filename globbing – sökning efter filer med hjälp av jokertecken. – Exempel: filnamnet globbing.* har jokertecknet *. Det står för noll, ett eller flera valfria tecken. Det kan därför motsvaras av filerna globbing.doc, globbing.jpg, globbing.htm och så vidare. – Skalmatchning är ett kraftfullt sätt att hitta information, men det används också för sabotage: sabotören sätter igång jättelika sökningar med skalmatchning så att systemet inte orkar med. Den amerikanska it‑säkerhetsorganisationen CERT har en beskrivning här.
[attacker] [sökningar] [ändrad 15 oktober 2019]
(pruning, på svenska också: beskärning) – borttagande av onödiga delar. – Inom it används ordet om algoritmer för automatisk sökning, klassificering och beslutsfattande samt om artificiella neuronnät. När det gäller sökningar och liknande innebär gallring att man tar bort sökkriterier som inte behövs för sökningen, eller som kanske krånglar till den i onödan. I en algoritm som klassificerar fåglar finns det till exempel inget behov av ett kriterium för tänder (vilket kan ha funnits med från början som ett arv från ett mer generellt system). Det kan också visa sig att ett sökkriterium aldrig används, eller inte har någon betydelse för resultatet. Eller det kan visa sig att två sökkriterier ger samma utfall, och då räcker det med ett av dem. Man kan också behöva gallra för att minska antalet möjliga utfall. När det gäller artificiella neuronnät innebär gallring att man från nätverket tar bort noder som inte påverkar resultatet av beräkningarna.
[ai] [sökningar] [ändrad 9 februari 2020]
tabell som automatiskt sorterar stora datamängder på ett sätt som ger snabba svar på sökningar (frågor). Söktiden blir ungefär samma för alla data, och det är enkelt att utöka en hashtabell. – En hashtabell delar upp datamängden i ett antal delar, så kallade hinkar (buckets), på ett sådant sätt att det blir ungefär lika stor mängd data i varje hink. Varje uppgift (varje post) i tabellen tilldelas en nyckel, och nyckeln avgör vilken hink uppgiften placeras i. Nyckeln beräknas matematiskt utifrån uppgiftens sökord. När någon gör en sökning på samma sökord upprepar programmet den matematiska beräkningen, får fram nyckeln och söker sedan i den ”hink” som motsvarar nyckeln. Detta spar tid jämfört med att söka igenom alla hinkarna. – Målet är att alla ”hinkar” ska vara lika stora och förbli lika stora när tabellen växer. Man väljer därför en metod för beräkning av nycklar som ger en jämn fördelning. Eftersom arbetet utförs av en dator behöver fördelningen inte vara förutsägbar för människor. – Namnet hashtabell kommer av den matematiska termen hash (kondensat), men man behöver inte beräkna nyckeln genom att göra ett kondensat, det finns andra sätt. – Se också distribuerad hashtabell. – Mer i Wikipedia. – På engelska: hash table.
[databaser] [sökningar] [ändrad 29 november 2019]
i datorteknik: avbrott, eller skifte; som verb: avbryta för, undanta:
- – Esc-tangenten på tangentbordet var ursprungligen till för att användaren skulle kunna stoppa en programkörning. Det gjordes när programmet hade fastnat i en slinga, alltså gick och gick utan att bli färdigt. Den användningen är en kvarleva från äldre tangentbord och fungerar sällan i nyare program. (I stället brukar man använda tangentkombinationen ctrl‑alt‑delete.) – Esc‑tangenten är ibland märkt med tecknet ⎋;
- – i en del program kan man använda Esc-tangenten för att avbryta, alltså att stänga aktiva fönster och backa ut ur ett pågående jobb;
- – i programmering betyder instruktionen escape att det kommer ett skifte mellan programkod och text skriven i naturligt språk för människor (alltså kommentarer till koden). Eftersom både text och programkod skrivs med tangentbordet behövs ett sätt att markera vad som är vad. En escape sequence anger att de tecken som följer är instruktioner, inte text. I ASCII‑tabellen finns en escape character (avbrottstecken, skiftestecken), tecken nummer 27, som har denna funktion. Escape a character – citera ett tecken, avbryta för ett tecken, undanta ett tecken – alltså: markera att tecknet ska skrivas som det är, inte tolkas som del av programkod. – Se också utkommentera;
- – när man formulerar sökvillkor vid sökningar på webben eller i databaser används skiftestecken ibland för att ange att tecken som * och ? ska tolkas som vanliga tecken, citeras, inte tolkas som jokertecken.
– Utanför datorteknik betyder escape oftast flykt, rymning. I fysik talar man om escape velocity, flykthastighet – den hastighet som en rymdfarkost måste ha för att kunna lämna jordens gravitationsfält. Det uttrycket används ibland om när en produkt eller ett företag börjar bli framgångsrikt.
[användargränssnitt] [programmering] [sökmotorer] [sökningar] [tangentbord] [ändrad 24 januari 2021]
(non-greedy) – om sökvillkor: som bara hittar de ord eller fraser som exakt svarar mot sökvillkoret. – Termen icke‑girig används när man söker efter text med reguljära uttryck. Enkelt exempel: om man söker efter ordet ”päron” med ett icke‑girigt reguljärt uttryck får man bara träff på ordet ”päron”. Men med alternativet, ett girigt reguljärt uttryck får man också träff på ord som ”päronträd”, ”päronträdsbeskärning” och ”päronträdsbeskärningskonsulent”.
[sökningar] [ändrad 3 september 2020]
om problemlösning: att systematiskt pröva alla tänkbara lösningar. (Alternativet är att analysera problemet för att ringa in de mest sannolika lösningarna och pröva dem först.) – På engelska: exhaustive, även brute force; jämför också med war. – Se också uttömmande attack och uttömmande sökning.
[attacker] [sökningar] [ändrad 14 september 2020]
borttagning av början av ett ord vid sökning. (Ordets början står ju till vänster.) Ett vanligt skäl till att man gör så är att man söker efter sammansatta ord som slutar på samma ord, eller efter ord som rimmar. Exempel: genom att söka på *trunkering får du träff på både vänstertrunkering och högertrunkering, samt på enbart trunkering. Man trunkerar ordet i början (till vänster) och sätter dit ett jokertecken, vanligtvis asterisk. – På engelska: left-hand truncation.
[sökningar] [ändrad 24 maj 2020]