semantiska webben

(the semantic web) – projekt för att förse webbsidor med beskrivningar av innehållet, så att sökningar på webben kan bli enklare och mer intuitiva. Beskrivningarna ska vara maskinläsbara och användas av sökmotorer. – Syftet är att komma bort från begränsningarna i sökmotorer (index) som Google, som hittar sidor bara om de innehåller de ord som användaren frågar efter. Med den semantiska webben ska man också kunna söka med ord som beskriver innehållet. Den ska automatisera det manuella arbetet bakom webbkataloger som Yahoo. – Exempel: om du vill hitta dikter på webben kommer du inte långt med att söka på ”dikt”, för de flesta dikter innehåller inte ordet dikt. På den semantiska webben skulle dikterna vara försedda med en innehållsdeklaration som säger att ”detta är en dikt”, och som dessutom kopplar termen dikt till andra termer som beskriver olika slags litteratur. – Satsningen på att skapa den semantiska webben leds av Tim Berners‑Lee, se här. – Projektet utvecklar standarder för beskrivningar av sidor och för ämneskataloger (ontologier). Be­skriv­ning­arna av sidorna ska läggas i sidornas RDF-filer. Där finns också länkar till den ämneskatalog som används. – Läs också om språket OWL. – Kombinationen av beskrivningar och ämneskataloger gör det möjligt för en sökmotor att göra intelligenta sökningar. Om man skulle söka på husdjur på den semantiska webben skulle sökmotorn kunna hitta sidor om siameser, även om ordet husdjur inte står på de sidorna. Ämneskatalogen kan nämligen tala om att ’husdjur’ omfattar ’katter’ och att ’katter’ i sin tur omfattar ’siameser’ – alltså är siameser ett slags husdjur. Den semantiska webben ger alla möjlighet att utforma egna ämneskataloger, men the Dublin core börjar bli en inofficiell standard. – Den semantiska webben förutsätter att sidorna och ämneskatalogerna skrivs i XML, och att sidorna förses med RDF‑filer. Ämneskatalogerna utformas på samma sätt som klasserna i objektorienterade system, och beskrivs i relationsdatabaser. – Se också mikroformat och GRDDL. – Svagheten i systemet är att det krävs extraarbete för att anpassa en webbsida till den semantiska webben. I många fall är det inte värt besväret, och för miljoner existerande webbsidor kommer det inte att göras. Troligen kommer systemet bara att användas på webbplatser där den förbättrade sökbarheten verkligen tillför något. I stället kommer sökmotorerna att använda avancerade tekniker, baserade på artificiell intelligens, för att ge liknande resultat. Ett annat sätt att förse webbsidor med beskrivande etiketter är att låta besökarna göra det, så kallade taggonomier. – En utförlig artikel i Scientific American om den semantiska webben, skriven av Tim Berners‑Lee, finns här. – Se­man­tiska webben kallas ibland för webb 3.0, en beteckning som också används i en annan betydelse.

[språk] [webben] [xml] [ändrad 22 augusti 2018]

XML

eXtensible markup language – ett språksystem för kodning av innehållet på webbsidor. Mer exakt är XML en standard som gör det möjligt att skapa språk för olika ändamål. – En webbsida som är kodad i XML innehåller maskinläsbara beskrivningar av den information som finns på sidan. Informationen är därför inte bara en textmassa, utan den kan bearbetas på olika sätt av ett program. Samtidigt kan XML‑koden utformas så att den kan läsas som vanlig text av människor. – XML, som kom 1998, är ett nyare alternativ till HTML. HTML, som är det ursprungliga språket för webbsidor, beskriver bara hur sidan ska se ut rent grafiskt, men i XML kan man tala om att ”detta är ett recept”, ”detta är ett tele­fon­nummer”, ”detta är en beskrivning av ett användargränssnitt”. XML skiljer sig från HTML på två sätt:

  • – det är, trots namnet, inget språk, utan en uppsättning regler för hur man utformar språk. Alla som vill kan göra en egen form av XML som fungerar i alla XML‑anpassade webbläsare;
  • – med XML kan man detaljerat beskriva (tagga) webbsidans innehåll, inte bara (som med HTML) hur den ska se ut.

– Man kan alltså med taggar ange att ”detta är ett efternamn”, ”detta är en kemisk formel”, ”detta är ett pris”, förutsatt att man använder en form av XML som passar. Det innebär att ett datorprogram som läser ett XML‑dokument kan söka efter vissa slag av information och spara den i en databas eller bearbeta den. Att möjliggöra automatiskt utbyte av information och tjänster mellan datorer är ett av målen med XML. – Det finns många tillämpningar av XML för olika ändamål, till exempel MathML för matematik, NewsML för nyheter och PPML för beställtryck. XML är en förenklad version av SGML. XML ska inte förväxlas med XHTML. – Läs mer på W3C:s webbsidor. – En knapp med texten XML på en webbsida hänvisar ofta till ett RSS-flöde.

[förkortningar på X] [webbpublicering] [xml] [ändrad 13 maj 2017]