Wayback machine

en sökmotor för sparade sidor på internet. – Syftet är att bevara så många webb­sidor som möjligt i det skick som de hade när de lästes in. – Wayback machine drivs ideellt av orga­nisa­tionen Internet archive. 2018 hade den 338 miljarder sparade webbsidor. – Namnet: Anspelar på the Wabac machine, en tids­maskin från den tecknade tv‑serien The Rocky and Bull­winkle show (se Wikipedia) som visades i början av 1960‑talet. – Se archive.org.

[arkiv och bibliotek] [sök­motorer] [ändrad 19 september 2018]

Robots exclusion protocol

instruktioner om att vissa (eller alla) webbadresser på en webb­plats inte ska kart­läggas av sök­­motorer. Kallas ofta för robots.txt efter den textfil som innehåller in­struk­tion­erna, och som sök­motor­ernas spindlar ska kunna läsa och följa. – Tillämpning av Robots exclusion protocol är fri­villigt, och det finns ingen garanti för att alla besök­ande spindlar rättar sig efter instruktion­erna i robots.txt. Pro­to­kollet är inte enbart avsett för sök­motorer, utan även för andra som auto­mat­iskt samlar in in­forma­tion på webb­sidor. – Proto­kollet kan ange att en del sidor får kart­läggas, men inte andra. Det kan också speci­fikt ute­stänga vissa spindlar, men släppa in andra, och det kan ange att besöken inte får ske för ofta. Kallas också för Robots exclusion standard. – Läs mer på robotstxt.org. – Se också ACAP och nofollow. – Sitemaps är kom­ple­mentet: in­struk­tioner om vilka sidor som finns att kartlägga.

[sökmotorer] [webbpublicering] [ändrad 6 november 2018]

eller-förval

(default to OR) – om sök­ningar: det att sök­ningar med två eller flera ord antas inne­hålla villkoret OR (se in­klu­siv dis­junk­tion). – Exempel: skriver man hund katt i sök­fältet tolkas det som hund ELLER katt. Det innebär att man får träff på do­ku­ment som inne­håller (1) ordet hund, men inte katt, (2) ordet katt, men inte hund, och på (3) do­ku­ment med båda orden. Det brukar ge många fler träffar än al­ter­na­tivet, och-förval, som används i sökmotorer. Eller-förval är van­lig­are i sökningar i do­ku­ment, till exempel i Adobe Reader.

[logik] [sökningar] [sökmotorer] [ändrad 14 augusti 2018]

Live Search

avvecklad sökmotor från Microsoft, sedan 2009 ersatt av Bing. – Startade 1998 som MSN Search med teknik från Inktomi. Microsoft utvecklade sedan en egen sökmotorteknik som togs i drift i början av 2005. I september 2006 bytte tjänsten namn till Windows Live Search, sedan bara Live Search. 2009 avvecklades tjänsten när Bing lanserades.

[nerlagt] [sökmotorer]

[ändrad 23 maj 2018]

 

filterbubbla

(filter bubble) – det att sök­motorer och sociala medier an­­passar den informa­tion vi får från inter­net till vad de har räknat ut om våra in­tressen och vär­de­ringar. – In­­for­ma­tionen filt­re­ras för att passa vår smak och våra värderingar, och resul­tatet blir att vi lever i en ”bubbla” av in­for­ma­tion som inte ut­manar oss. – Termen filter­­bubbla skapades av ameri­kanen Eli Pariser i hans bok Filter bubble: what the internet is hiding from you (2011), senare utgiven som Filter bubble: How the new personalized web is changing what we read and how we think (länk). – Läs också om cyberbalkanisering.

[sociala medier] [sökmotorer] [ändrad 28 mars 2018]

 

Excite

en amerikansk sökmotor och webbportal som har funnits sedan 1995. – Excite var i mitten av 1990-talet en av de ledande sajterna på internet, men den har minskat i betydelse. Före­taget grundades 1994 under namnet Architext, men bytte namn till Excite vid lanseringen. I slutet av 1990-talet gick Excite med förlust, och köptes då av internet­operatören Athome Networks (@Home). Tillsammans blev de Excite@Home, som 2001 gick i konkurs. Före­taget iWon återupp­livade tjänsten samma år genom att ta över både namnet och användarna. 2004 köpte Ask Jeeves (numera Ask.com) det nya Excite och gick senare samman med Infospace, numera Blucora (blucora.com), om att driva tjänsten. – I Europa finns Excite Europe (excite‑europe.com), som är ett tyskt marknadsföringsföretag. – Se excite.com och search.excite.com.

[sökmotorer] [ändrad 7 juli 2019]

relevans

om sökningar: hur bra resultatet av en sökning stämmer med sökvillkoren eller med vad den sökande tros söka efter. – Länge utgick man från att ju fler gånger som ett sökord förekom på en webbsida, desto mer relevant skulle sidan anses vara – men det kriteriet har blivit oanvändbart på grund av sökordspackning. Rankningssystem som PageRank utgår i stället från en bedömning av webbsidornas anseende, baserat på hur många andra sidor som länkar till dem. Andra faktorer som sökmotorn känner till om när det gäller den sökandes preferenser kan också spela in. Sökresultat från sökmotorer brukar ordnas med de mest relevanta svaren först. – På engelska: relevancy.

[sökningar] [sökmotorer] [ändrad 5 september 2018]

och-förval

(default to AND) – om sök­motorer: det att sökningar med två eller flera ord antas inne­hålla det logiska vill­koret AND (se kon­junk­tion). Skriver man alltså hund katt i sök­fältet tolkar sök­motorn det som hund OCH katt. Det gör att sök­motorn då söker efter webb­sidor som inne­håller båda orden, inte bara ett av dem. (Men orden behöver inte stå intill varandra i texten, se fras.) – Och‑för­val brukar ge färre, men mer re­le­vanta, träffar än alternativet, eller‑för­val. – Och-för­val är det van­li­gaste i sök­motorer, och används på Bing, Google och Yahoo.

[logik] [sökningar] [sökmotorer] [ändrad 8 juni 2017]

Nutch

Apache Nutch – projekt som utvecklar en spindel med öppen källkod. En spindel (web crawler) är  ett program som samlar in underlag till en sökmotor. Projektet Nutch, som påbörjades 2003 av amerikanen Doug Cutting, skulle från början utveckla en komplett alternativ sökmotor, men gick över till att enbart utveckla en spindel. Nutch kan alltså användas för att driva sökmotorer. Projektet togs 2010 över av Apache software foundation. – Se nutch.apache.org.

[sökmotorer] [öppen källkod] [ändrad 1 mars 2018]