ordstamsigenkänning

(stemming) – automatisk igenkänning av den viktigaste delen av ett ord, stammen, med användning av datorprogram. Till exempel att skatorna kommer av skata. – Syftet är att man ska hitta och vid behov sammanföra böjningsformer av samma ord. – Exempel: om man utgår från ordet katten hittar man med ordstamsigenkänning ordstammen katt, och då kan man också hitta böjningsformer som katter och katterna. Det är (oftast) relativt enkelt på engelska, men krångligare på svenska, där vi har gott om böjningar som cykel—cyklar och fot—fötter. Men även engelska har svårigheter om man breddar betydelsen av ordstamsigenkänning till att också gälla böjningsformer som be, am, are, is, was, were. – Ordstamsigenkänning är en form av språk­teknik och används i datalingvistik. – Ordstamsigenkänning är praktiskt användbar i sökmotorer, för maskinöversättning och i program som söker information i textmassor. – Program för ordstamsigenkänning kallas på engelska för stemmers. Det finns två huvudtyper: lexikala, som bygger på ordlistor med böjningsformer, och algoritmiska, som bygger på regler. Praktiskt användbara program använder båda metoderna.

[språkteknik] [sökningar] [ändrad 15 februari 2018]

command query responsibility separation

(CQRS) – principen att instruktioner till data­baser ska skiljas från frågor till data­baser. – Som in­struktioner (commands) räknas ändringar av databasen, alltså förutom ändringar även tillägg och strykningar. Som frågor (queries) räknas instruktioner som ger ett svar, alltså uppgifter ur databasen, utan att databasens innehåll förändras. – Traditionellt har frågor och instruktioner hanterats av samma mekanismer i databashanteraren. (Ofta kallas både frågor och instruktioner för frågor.) CQRS innebär att man skiljer på frågor och instruktioner. För rena frågor kan man då använda enklare metoder. Det är till exempel inget problem att två användare ställer samma fråga på samma gång, men om två användare försöker ändra samma uppgift samtidigt blir det problem. Det krävs alltså krångligare metoder för att hantera instruktioner än för att hantera rena frågor.

[databaser] [ändrad 2 maj 2018]

databashanterare

program för upp­läggning, under­håll och an­vändning av data­baser. – Företag som Oracle och MySQL kallas ibland för leverantörer av ”databaser”, men det som de levererar är data­bas­hanterare (inte innehållet i databaserna). Det är samma skillnad som mellan en ord­be­handlare och ett dokument. – På engelska heter det database manage­ment system, ofta förkortat till DBMS.

[databaser] [ändrad 9 maj 2018]

datum

  1. – datum skrivs i löpande text så här: den 24 juli 2021. (Ordet den kan utelämnas.) Observera att man just i datum skriver bara 24 för tjugofjärde; motsvarande för andra datum. Men om det gäller ett ordnings­tal skriver man däremot så här: ”24:e”. Man skriver bara ut sista bokstaven i ordningstalet, trots att det kan vara flera bokstäver som skiljer det från räknetalet (”24:e” utläses ju ”tjugofjärde”, inte tjugofyrae). Nummer på kungar och andra potentater skrivs med romerska siffror utan tillägg. Man skriver ”Gustaf III” men säger ”Gustaf den tredje”;
  2. – det heter ett datum, flera datum på modern svenska. Den latinska pluralformen data har blivit ett separat svenskt ord;
  3. – i princip skulle singularformen av ordet data kunna vara datum, men den ordformen används praktiskt taget aldrig i den betydelsen. Om det behövs säger man vanligtvis ”en uppgift”: ”denna uppgift är fel”, inte ”detta datum är fel” (om det inte gäller just ett datum i betydelse 1.)

[data] [språktips] [tid] [ändrad 5 augusti 2021]

datamodell

beskrivning av en data­bas, be­stående av en fysisk och en logisk del. – Den logiska datamodellen beskriver hur databasen ska se ut i allmänna termer – den tar till exempel inte ställning till vilken databashanterare som ska användas. När den logiska datamodellen är realiserad i databasen går den under benämningen fysisk datamodell, och är systemberoende.

[databaser] [ändrad 11 maj 2018]

digital materialförvaltning

(digital asset management, förkortat DAM) – lagring och ordnande av foton, grafik, video, ljud och textdokument i digital form så att de blir sök­bara och lättåtkomliga när de behövs. Pro­gram för digital material­hantering brukar också inne­hålla skydd mot otillåten an­vändning av materialet (till exempel pirat­kopiering) och skydd för upp­hovs­rätten.

[informationshantering] [ändrad 24 november 2014]

innehållshanteringssystem

program för innehålls­hanteringwebb­platser och i andra system. Det är system som håller reda på materialet som publiceras på en webbplats, och som också ser till att det faktiskt publiceras på av­sett sätt. – Kallas på engelska för content management system, CMS. Ett CMS brukar ha två delar: content management application (CMA) och content delivery application (CDA). CMA är verk­tyg som an­vänds för skapande, ändring och bort­tagning av material, ofta hämtat från olika pro­gram och data­baser. CDA formaterar materialet så att det kan publiceras på webben.

[informationshantering] [webbpublicering] [ändrad 19 maj 2018]