relevans

om sökningar: hur bra resultatet av en sökning stämmer med sökvillkoren eller med vad den sökande tros söka efter. – Länge utgick man från att ju fler gånger som ett sökord förekom på en webbsida, desto mer relevant skulle sidan anses vara – men det kriteriet har blivit oanvändbart på grund av sökordspackning. Rankningssystem som PageRank utgår i stället från en bedömning av webbsidornas anseende, baserat på hur många andra sidor som länkar till dem. Andra faktorer som sökmotorn känner till när det gäller den sökandes preferenser kan också spela in. Sökresultat från sökmotorer brukar ordnas med de svar som bedöms som mest relevanta först. – På engelska: relevancy.

[sökningar] [sökmotorer] [ändrad 5 december 2019]

Nutch

Apache Nutch – projekt som utvecklar en spindel med öppen källkod. En spindel (web crawler) är  ett program som samlar in underlag till en sökmotor. Projektet Nutch, som påbörjades 2003 av amerikanen Doug Cutting, skulle från början utveckla en komplett alternativ sökmotor, men gick över till att enbart utveckla en spindel. Nutch kan alltså användas för att driva sökmotorer. Projektet togs 2010 över av Apache software foundation. – Se nutch.apache.org.

[sökmotorer] [öppen källkod] [ändrad 1 mars 2018]

Overture

en avvecklad amerikansk sökmotor, startad 1998 under namnet GoTo, senare absorberad av Yahoo. – Overture var först med betalda place­ringar, alltså det att företag kunde betala för att få topplaceringar i resultat­listorna. År 2000 gick Overture över till att leverera sökresultat (fortfarande med betalda placeringar) till andra sökmotorer. I februari 2003 köpte Overture den tidigare ledande sök­motorn Altavista† (sedan dess nerlagd), och i juli samma år blev Overture i sin tur köpt av Yahoo, och bytte då namn till Yahoo Search Marketing, se Yahoos (numera Verizon Media Groups) webbsidor.

[sökmotorer] [uppköpt] [ändrad 25 november 2019]

fråga

(query, även: search) – om data­baser: begäran om information ur en databas. – En fråga kan gälla ett urval information, eller att informationen ska ordnas på ett visst sätt. En fråga kan också, i svensk terminologi, vara en ändring eller strykning. – Fråga är den traditionella svenska termen för engelska query. – En fråga kan begära ett urval av information (ge mig en lista på alla kunder i databasen som bor i Malmö), att informationen ska sorteras på ett visst sätt (efter efternamn, efter postnummer) eller en kombination av villkor. Man kan också använda sökbegräns­are, vilket innebär att bara en angiven del av databasen ska genomsökas. Frågor till en databas kan ställas av en användare eller av ett annat program. – En fråga som ”ta fram namn och adress till alla villaägare som är mellan 30 och 50 och kör Volvo, och sortera dem efter ålder” uttrycks då i ett frågespråk (query language) som SQL. Andra operationer, som att lägga till, ändra eller ta bort information i en databas kallas också ofta för frågor. – Läs också om lagrade procedurer och vyer (som är två olika saker). – Ordet sökning används mest av icke‑professionella användare och om sökningar i databaser som Google. Skillnaden mellan frågor i databaser och sökningar med sökmotorer är att frågorna i en databas formuleras med utgångspunkt i databasens strukturerade uppbyggnad. Exempel: vill man ha en lista över alla som bor i staden Nora räcker det med att söka efter Nora i fältet ”Postort”. Man behöver inte söka igenom hela data­basen efter ordet Nora, och man får därför bara träff på staden Nora, inte på alla som heter Nora i förnamn. Sökningar i sökmotorer är däremot som regel fritextsökningar, eftersom webbsidor och textdokument inte brukar vara strukturerade – det finns inget enkelt sätt att avgöra ifall Nora syftar på en kvinna eller på en stad, utan det får användaren räkna ut själv. – Se också uppslagning (look‑up).

[databaser] [sökmotorer] [sökningar] [ändrad 4 september 2018]

HITS

metod för att rangordna resultaten av sökningar på webben, utvecklad av Jon Kleinberg på 1990-talet. – HITS blev grunden för Googles sidrankningsmetod PageRank. HITS byggde i sin tur på en liknande metod, Clever, som Kleinberg hade utvecklat på IBM Research. – I HITS klassades vissa webb­sidor som nav (hubs), nämligen sidor som hade många länkar till andra sidor. Andra sidor klassades som auktoriteter (authorities), nämligen sidor som många andra sidor hade länkar till. – Se Klein­bergs artikel ”Hubs, authorities and communities” (länk), publicerad 1999. – HITS uppges vara en förkortning för Hyperlink-induced topic search.

[förkortningar på H] [rankning] [ändrad 5 september 2018]

PageRank

Googles system för rang­­ordning av sök­­resultat, utvecklad av Googles grundare Sergey Brin och Larry Page (se arkiverad uppsats). – Page­Rank bedömer hur intressant en sida är för användaren baserat dels på hur många andra sidor som länkar till den sidan, dels på hur många andra sidor som den sidan länkar till. Den första värderingen av hur intressanta sidorna är tas som start­värden för en andra utvärdering: hur intressanta är de sidor som denna sida länkar till, och hur intressanta är de sidor som länkar till denna sida. Detta upp­repas i flera om­gångar. En ingående beskrivning finns i Wikipedia. Innehållet på sidorna (till exempel hur många gånger sökordet förekommer) tas däremot inte till grund för bedömningen, vilket motiveras med att det är enkelt att manipulera. – Page­Rank är en vidare­utveckling av HITS, som utvecklades av Jon Kleinberg. – Page­Rank används fortfarande som generellt namn på Googles rankningsalgoritmer, fast det troligen inte finns mycket kvar av den ursprungliga algoritmen. I själva verket använder Google numera flera algoritmer för att bedöma webbsidor. Google strävar (liksom andra sökmotorer) nämligen efter att undvika sidor som är gjorda enbart för att locka besökare till en annan sida.

[rankning] [ändrad 5 september 2018]

jokertecken

(wild card) – tecken som står för obestämda tecken (vilka tecken som helst, eventuellt inget tecken), och som används vid sökningar i databaser och med sökmotorer på webben. Det finns två vanliga jokertecken:

– Fråge­tecken brukar stå för exakt ett val­fritt tecken, och aste­risk brukar stå för noll, ett eller flera valfria tecken. – Ex­em­pel: h?nd ger träff på hand, hind hund och händ. Men katt* ger träff på ord som katt, Kattegatt, katten, katterna och kattsand. – Läs också om skalmatchning och högertrunkering. – När man söker med så kallade reguljära uttryck använder man andra tecken. – Se också Datatermgruppen (länk).

[sökningar] [ändrad 8 mars 2020]