webbskrapning

(web scraping) – att utvinna information direkt från webbsidor med hjälp av speciella program. Exempel på webbskrapning är de tjänster som gör automatiska prisjämförelser mellan postorderföretag på internet. Det kallas för skrapning därför att programmen hämtar information från webbsidor, inte från de bakomliggande databaserna. Webbskrapning påminner om den indexering som sökmotorer gör när de samlar in innehållet på webbsidor. Skillnaden är att sökmotorer samlar in allt de hittar på webbsidorna, medan program för webbskrapning letar efter särskilda typer av information.

doorway page

webbsida som enbart finns för att vilseleda sökmotorer och deras användare. Den användare som klickar på länken till en doorway page i en lista med sökresultat hamnar på en annan sida än den doorway page som sökmotorn har indexerat. Sökmotorns rankning av en doorway page styrs av innehållet, som är skräddarsytt enbart för det ändamålet. Andra besökare till sidan än sökmotorns spindel skickas direkt vidare till en annan sida med helt annat innehåll. Detta är möjligt eftersom webbservern kan programmeras att skilja mellan sökmotorers spindlar och andra besökare, och förse dem med helt olika sidor, trots att de efterfrågar samma sida. Det är en metod i spamdexing.

anti-phrasing

om sökmotorer: att användarna formulerar sökfraserna som ett fåtal nyckelord, inte som kompletta frågor.

organiskt sökresultat

om sökmotorer: själva listan över webbsidor som svarar mot användarens sökning. Detta till skillnad från reklam och sponsrade länkar. Det organiska sökresultatet tas fram av själva sök­motorn, medan sponsrade länkar och reklam tas fram av andra program med ledning av användarens sökning och annat man vet om användaren.

osynligt bläck

(invisible ink) – text på webbsida i samma färg som bak­grunden. Det blir osynligt för besökare på webb­sidor men kan läsas av sök­motorer, så de osynliga orden hamnar i sök­motorns index. Detta är ett sätt att vilse­leda sök­motorernas an­vändare. Se också falsk­skyltning.

preheader

på webbsidor och i e-post: kort samman­fatt­ning av innehållet, avsedd att visas i listor. – Pre­headern är till exempel den text som visas i för­hands­visning av e-post i vissa e-post­klienter, eller som visas i sök­resul­taten i en sök­motor. En preheader kan genereras auto­matiskt från första meningen eller meningarna i med­delan­dets brödtext, men ibland kan den skrivas ”för hand”. Det kan löna sig att ägna upp­märk­sam­het åt preheaders för att locka läsare. Om preheadern väljs med automatik blir det ofta admi­nistra­tiva budskap som ”Om det här mejlet är svårt att läsa, klicka här”.

Shodan

sökmotor som kartlägger datorer, servrar och nät­utrustning på inter­net. – Till skillnad från Google och andra sök­motorer bryr sig Shodan inte om inne­hållet på webb­platser. Den följer bara länkarna mellan datorer, servrar och annan utrustning på inter­net. Under­sökningar med Shodan har visat att it-system för viktiga sam­hälls­funktioner, som kraft­verk och dammar, ofta är oskyddade för intrång. – Sho­dan utvecklades av den amerikanska pro­gram­meraren John Matherly, och har varit i drift sedan 2009. – Shodan åtar sig att göra under­sökningar på beställning av före­tag, till exempel att upp­täcka oskyddade anslutningar för telnet. – Se shodan.io.

Graph Search

facebooks sökmotor för informationen på Facebook. Den indexerar allt som skrivits på Facebook. Det är en semantisk sökmotor: den söker inte bara efter de ord som användaren har angett i sökningen, utan efter information som användaren bedöms söka efter. Ett enkelt exempel är att om man söker på ”lunch” så får man även information om restauranger. Sökresultaten begränsas till användarens kontakter och kan också begränsas geografiskt. En betaversion av Graph Search togs i bruk i januari 2013. Graph Search gick först under arbetsnamnet Unicorn. – Se Facebooks webbsidor.