semantiska webben

(the semantic web) – projekt för att förse webbsidor med beskrivningar av innehållet, så att sökningar på webben kan bli enklare och mer intuitiva. – Beskrivningarna ska vara maskinläsbara och användas av sökmotorer. – Syftet är att komma bort från begränsningarna i sökmotorer (index) som Google, som hittar sidor bara om de innehåller de ord som användaren frågar efter. Med den semantiska webben ska man också kunna söka med ord som beskriver innehållet. Den ska automatisera det manuella arbetet bakom webbkataloger som Yahoo. – Exempel: om du vill hitta dikter på webben kommer du inte långt med att söka på ”dikt”, för de flesta dikter innehåller inte ordet dikt. På den semantiska webben skulle dikterna vara försedda med en innehållsdeklaration som säger att ”detta är en dikt”, och som dessutom kopplar termen dikt till andra termer som beskriver olika slags litteratur. – Satsningen på att skapa den semantiska webben leds av Tim Berners‑Lee, se här. – Projektet utvecklar standarder för beskrivningar av sidor och för ämneskataloger (ontologier). Beskrivningarna av sidorna ska läggas i sidornas RDF-filer. Där finns också länkar till den ämneskatalog som används. – Läs också om språket OWL. – Kombinationen av beskrivningar och ämneskataloger gör det möjligt för en sökmotor att göra intelligenta sökningar. Om man skulle söka på husdjur på den semantiska webben skulle sökmotorn kunna hitta sidor om siameser, även om ordet husdjur inte står på de sidorna. Ämneskatalogen kan nämligen tala om att ’husdjur’ omfattar ’katter’ och att ’katter’ i sin tur omfattar ’siameser’ – alltså är siameser ett slags husdjur. Den semantiska webben ger alla möjlighet att utforma egna ämneskataloger, men the Dublin core börjar bli en inofficiell standard. – Den semantiska webben förutsätter att sidorna och ämneskatalogerna skrivs i XML, och att sidorna förses med RDF‑filer. Ämneskatalogerna utformas på samma sätt som klasserna i objektorienterade system, och beskrivs i relationsdatabaser. – Se också mikroformat, GRDDL och länkade data. – Svagheten i systemet är att det krävs extraarbete för att anpassa en webbsida till den semantiska webben. I många fall är det inte värt besväret, och för miljoner existerande webbsidor kommer det inte att göras. Troligen kommer systemet bara att användas på webbplatser där den förbättrade sökbarheten verkligen tillför något. I stället kommer sökmotorerna att använda avancerade tekniker, baserade på artificiell intelligens, för att ge liknande resultat. Ett annat sätt att förse webbsidor med beskrivande etiketter är att låta besökarna göra det, så kallade taggonomier. – En utförlig artikel i Scientific American om den semantiska webben, skriven av Tim Berners‑Lee, finns här. – Semantiska webben kallas ibland för webb 3.0, en beteckning som också används i en annan betydelse.

[semantiska webben] [språk] [xml] [ändrad 24 februari 2023]