semantiska webben

(the semantic web) – satsning på att förse webbsidor med beskrivningar av innehållet, så att sökningar på webben kan bli enklare och mer intuitiva. Beskrivningarna ska vara maskinläsbara och användas av sökmotorer. – Syftet är att komma bort från begränsningarna i sökmotorer (index) som Google, som hittar sidor bara om de innehåller de ord som användaren frågar efter. Med den semantiska webben ska man också kunna söka med ord som beskriver innehållet. Den ska automatisera det manuella arbetet bakom webbkataloger som Yahoo. – Exempel: om du vill hitta dikter på webben kommer du inte långt med att söka på ”dikt”, för de flesta dikter innehåller inte ordet dikt. På den semantiska webben ska dikterna vara försedda med en innehållsdeklaration som säger att ”detta är en dikt”, och som dessutom kopplar termen dikt till andra termer som beskriver olika slags litteratur. – Satsningen på att skapa den semantiska webben leds av Tim Berners‑Lee, se här. – Projektet utvecklar standarder för beskrivningar av sidor och för ämneskataloger (ontologier). Be­skriv­ning­arna av sidorna ska läggas i sidornas rdf-filer. Där finns också länkar till den ämneskatalog som används. – Läs också om språket owl. – Kom­bi­na­tionen av beskrivningar och ämneskataloger gör det möjligt för en sök­motor att göra intelligenta sökningar. Om man söker på husdjur på den semantiska webben kan sökmotorn hitta sidor om siameser, även om ordet husdjur inte står på de sidorna. Ämneskatalogen kan nämligen tala om att ’husdjur’ omfattar ’katter’ och att ’katter’ i sin tur omfattar ’siameser’ – alltså är siameser ett slags husdjur. Den semantiska webben ger alla möjlighet att utforma egna ämneskataloger, men the Dublin core börjar bli en inofficiell standard. – Den semantiska webben förutsätter att sidorna och ämneskatalogerna skrivs i xml och att sidorna förses med rdf-filer. Ämneskatalogerna utformas på samma sätt som klasserna i objekt­orient­e­rade system, och beskrivs i relationsdatabaser. – Se också mikroformat och grddl. – Svagheten i systemet är att det krävs extra­arbete för att anpassa en webbsida till den semantiska webben. I många fall är det inte värt besväret, och för miljoner existerande webbsidor kommer det inte att göras. Troligen kommer systemet bara att användas på webbplatser där den förbättrade sökbarheten verkligen tillför något. I stället kommer sökmotorerna att använda avancerade tekniker, baserade på artificiell intelligens, för att ge liknande resultat. Ett annat sätt att förse webbsidor med beskrivande etiketter är att låta besökarna göra det, så kallade taggonomier. – En utförlig artikel i Scientific American om den semantiska webben, skriven av Tim Berners‑Lee, finns här. En webbkurs i semantiska webben från företaget Cambridge Semantics, finns här. – Se­man­tiska webben kallas ibland för webb 3.0, en beteckning som också har en annan betydelse.