Wayback machine

ett arkiv med sökbara kopior av miljarder webbsidor. – Syftet är att bevara så många webbsidor som möjligt i det skick som de hade när de lästes in. Det finns vanligtvis en serie kopior av samma webbsida, kopierade vid olika tider. – Wayback machine, som grundades 2001, drivs ideellt av organisationen Internet archive. I början av 2020 hade den 431 miljarder sparade webbsidor. – Namnet: Anspelar på the Wabac machine, en tidsmaskin från den tecknade tv‑serien The Rocky and Bullwinkle show (se Wikipedia) som visades i början av 1960‑talet. – Se archive.org. – Länkar till webbsidor som inte längre finns på sin ursprungliga plats, men som är bevarade på Wayback Machine, är i denna ordlista markerade med ordet Arkiverad. – Läs också om Wayforward machine.

[arkiv och bibliotek] [sök­motorer] [ändrad 10 oktober 2021]

Sitemaps

maskinläsbara förteckningar över de webb­adresser på en webbplats som är till­gäng­liga för sök­motorer. – Sitemaps hjälper spindlar att hitta så mycket information som möjligt på webbplatsen. En sitemap är en XML‑fil som räknar upp webbadresserna på webbplatsen med information om när de senast har ändrats, hur ofta de brukar ändras och hur viktiga de anses vara. Site­maps är ett protokoll för informationsutbyte mellan webbplatsen och sökmotorerna. Syftet är att under­lätta för sökmotorerna (deras spindlar) att hitta allt på webbplatsen. – Sitemaps har fast­ställts i samarbete mellan Google, MSN och Yahoo. – Se sitemaps.org. – Jämför med ACAP och Robots exclusion protocol, som är till för att ange vad sökmotorerna inte ska kartlägga.

[sökmotorer] [webbpublicering] [xml] [ändrad 9 februari 2018]

Robots exclusion protocol

instruktioner om att vissa (eller alla) webbadresser på en webbplats inte ska kart­läggas av sök­­motorer. – Robots exclusion protocol kallas ofta för robots.txt efter den textfil som innehåller instruktionerna, och som sökmotorernas spindlar, här kallade robotar, ska kunna läsa och följa. – Tillämpning av Robots exclusion protocol är frivilligt, och det finns ingen garanti för att alla besökande spindlar rättar sig efter instruktion­erna i robots.txt. Protokollet är inte enbart avsett för sökmotorer, utan även för andra som automatiskt samlar in information på webbsidor. – Protokollet ger möjlighet att ange att en del sidor får kartläggas, men inte andra. Det kan också specifikt utestänga vissa spindlar, men släppa in andra, och det kan ange att besöken inte får ske för ofta. Kallas också för Robots exclusion standard. – Läs mer på robotstxt.org. – Se också ACAP och nofollow. – Sitemaps är komplementet: instruktioner om vilka sidor som finns att kartlägga.

[sökmotorer] [webbpublicering] [ändrad 9 februari 2020]

eller-förval

(default to OR) – om sökningar: det att sök­ningar med två eller flera ord antas inne­hålla villkoret OR (se in­klu­siv dis­junk­tion). – Exempel: skriver man hund katt i sök­fältet tolkas det som hund ELLER katt. Det innebär att man får träff på do­ku­ment som inne­håller (1) ordet hund, men inte katt, (2) ordet katt, men inte hund, och på (3) do­ku­ment med båda orden. Det brukar ge många fler träffar än alternativet, och‑förval, som ofta används i sökmotorer. Eller‑förval är van­lig­are i sökningar i do­ku­ment, till exempel i Adobe Reader.

[logik] [sökningar] [sökmotorer] [ändrad 14 augusti 2018]

Live Search

en avvecklad sökmotor från Microsoft, sedan 2009 ersatt av Bing. – Startade 1998 som MSN Search med teknik från Inktomi. Microsoft utvecklade sedan en egen sökmotorteknik som togs i drift i början av 2005. I september 2006 bytte tjänsten namn till Windows Live Search, sedan bara Live Search. 2009 avvecklades tjänsten när Bing lanserades.

[nerlagt] [sökmotorer] [ändrad 23 maj 2018]

 

filterbubbla

det att sök­motorer och sociala medier an­­passar den information som var och en av oss får från internet till vad de har räknat ut om våra intressen och värderingar. – Informationen filtre­ras för att passa vår smak och våra värderingar, och resultatet blir att vi lever i en ”bubbla” av information som inte utmanar oss. – Termen filterbubbla, på engelska filter bubble, skapades av amerikanen Eli Pariser (elipariser.org) i hans bok Filter bubble: what the internet is hiding from you (2011), senare utgiven som Filter bubble: How the new personalized web is changing what we read and how we think (länk). – Läs också om cyberbalkanisering. – Filterbubbla var ett av årets nyord 2016 enligt Språkrådet (länk) och Språktidningen (länk).

[sociala medier] [sökmotorer] [årets nyord] [ändrad 1 maj 2022]

Excite

en amerikansk sökmotor och webbportal som har funnits sedan 1995. – Excite var i mitten av 1990-talet en av de ledande sajterna på internet, men den har minskat i betydelse. Före­taget grundades 1994 under namnet Architext, men bytte namn till Excite vid lanseringen. I slutet av 1990-talet gick Excite med förlust, och köptes då av internet­operatören Athome Networks (@Home). Tillsammans blev de Excite@Home, som 2001 gick i konkurs. Före­taget iWon återupp­livade tjänsten samma år genom att ta över både namnet och användarna. 2004 köpte Ask Jeeves (numera Ask.com) det nya Excite och gick senare samman med Infospace, numera Blucora (blucora.com), om att driva tjänsten. – I Europa finns Excite Europe (excite‑europe.com), som är ett tyskt marknadsföringsföretag. – Se search.excite.com.

[sökmotorer] [ändrad 22 februari 2023]

relevans

om sökningar: hur bra resultatet av en sökning stämmer med sökvillkoren eller med vad den sökande tros söka efter. – Länge utgick man från att ju fler gånger som ett sökord förekom på en webbsida, desto mer relevant skulle sidan anses vara – men det kriteriet har blivit oanvändbart på grund av sökordspackning. Rankningssystem som PageRank utgår i stället från en bedömning av webbsidornas anseende, baserat på hur många andra sidor som länkar till dem. Andra faktorer som sökmotorn känner till när det gäller den sökandes preferenser kan också spela in. Sökresultat från sökmotorer brukar ordnas med de svar som bedöms som mest relevanta först. – På engelska: relevancy.

[sökningar] [sökmotorer] [ändrad 5 december 2019]