”supertuggare” – datorsystem som analyserar mycket stora datamängder. Alltså ett slags datautvinning i terabyte- eller petabyte-skala. Exempel: sökmotorn Google. – Ordet kommer från Ian Ayres (länk) bok Super crunchers från 2007. – Se också big data.
[data] [superdatorer] [ändrad 23 december 2017]
(stemming) – automatisk igenkänning av den viktigaste delen av ett ord, stammen, med användning av datorprogram. Till exempel att skatorna kommer av skata. – Syftet är att man ska hitta och vid behov sammanföra böjningsformer av samma ord. – Exempel: om man utgår från ordet katten hittar man med ordstamsigenkänning ordstammen katt, och då kan man också hitta böjningsformer som katter och katterna. Det är (oftast) relativt enkelt på engelska, men krångligare på svenska, där vi har gott om böjningar som cykel—cyklar och fot—fötter. Men även engelska har svårigheter om man breddar betydelsen av ordstamsigenkänning till att också gälla böjningsformer som be, am, are, is, was, were. – Ordstamsigenkänning är en form av språkteknik och används i datalingvistik. – Ordstamsigenkänning är praktiskt användbar i sökmotorer, för maskinöversättning och i program som söker information i textmassor. – Program för ordstamsigenkänning kallas på engelska för stemmers. Det finns två huvudtyper: lexikala, som bygger på ordlistor med böjningsformer, och algoritmiska, som bygger på regler. Praktiskt användbara program använder båda metoderna.
[språkteknik] [sökningar] [ändrad 15 februari 2018]
(CQRS) – principen att instruktioner till databaser ska skiljas från frågor till databaser. – Som instruktioner (commands) räknas ändringar av databasen, alltså förutom ändringar även tillägg och strykningar. Som frågor (queries) räknas instruktioner som ger ett svar, alltså uppgifter ur databasen, utan att databasens innehåll förändras. – Traditionellt har frågor och instruktioner hanterats av samma mekanismer i databashanteraren. (Ofta kallas både frågor och instruktioner för frågor.) CQRS innebär att man skiljer på frågor och instruktioner. För rena frågor kan man då använda enklare metoder. Det är till exempel inget problem att två användare ställer samma fråga på samma gång, men om två användare försöker ändra samma uppgift samtidigt blir det problem. Det krävs alltså krångligare metoder för att hantera instruktioner än för att hantera rena frågor.
[databaser] [ändrad 2 maj 2018]
program för uppläggning, underhåll och användning av databaser. – Företag som Oracle och MySQL kallas ibland för leverantörer av ”databaser”, men det som de levererar är databashanterare (inte innehållet i databaserna). Det är samma skillnad som mellan en ordbehandlare och ett dokument. – På engelska heter det database management system, ofta förkortat till DBMS.
[databaser] [ändrad 9 maj 2018]
tilläggsenhet till objektrelationsdatabaser, ingående i ett system som har utvecklats av Informix† (numera del av IBM). Det lanserades 1996. Genom att lägga in ett datablade ger man databasen möjlighet att utföra nya arbetsuppgifter, till exempel att visa digital video. – Se IBM:s webbsidor.
[databaser] [ändrad 9 november 2018]
- – datum skrivs i löpande text så här: den 24 juli 2021. (Ordet den kan utelämnas.) Observera att man just i datum skriver bara 24 för tjugofjärde; motsvarande för andra datum. Men om det gäller ett ordningstal skriver man däremot så här: ”24:e”. Man skriver bara ut sista bokstaven i ordningstalet, trots att det kan vara flera bokstäver som skiljer det från räknetalet (”24:e” utläses ju ”tjugofjärde”, inte
tjugofyrae). Nummer på kungar och andra potentater skrivs med romerska siffror utan tillägg. Man skriver ”Gustaf III” men säger ”Gustaf den tredje”;
- – det heter ett datum, flera datum på modern svenska. Den latinska pluralformen data har blivit ett separat svenskt ord;
- – i princip skulle singularformen av ordet data kunna vara datum, men den ordformen används praktiskt taget aldrig i den betydelsen. Om det behövs säger man vanligtvis ”en uppgift”: ”denna uppgift är fel”, inte ”detta
datum är fel” (om det inte gäller just ett datum i betydelse 1.)
[data] [språktips] [tid] [ändrad 5 augusti 2021]
beskrivning av en databas, bestående av en fysisk och en logisk del. – Den logiska datamodellen beskriver hur databasen ska se ut i allmänna termer – den tar till exempel inte ställning till vilken databashanterare som ska användas. När den logiska datamodellen är realiserad i databasen går den under benämningen fysisk datamodell, och är systemberoende.
[databaser] [ändrad 11 maj 2018]
(digital asset management, förkortat DAM) – lagring och ordnande av foton, grafik, video, ljud och textdokument i digital form så att de blir sökbara och lättåtkomliga när de behövs. Program för digital materialhantering brukar också innehålla skydd mot otillåten användning av materialet (till exempel piratkopiering) och skydd för upphovsrätten.
[informationshantering] [ändrad 24 november 2014]
ett söksystem för internt bruk på organisationer. Det har utvecklats i öppen källkod av Apache software foundation, och räknas som det mest spridda söksystemet för företag. – Apache Solr används bland annat i IBM:s Verse. – Solr ska uttalas som engelska solar. – Se lucene.apache.org/solr.
[sökningar] [ändrad 9 november 2018]
program för innehållshantering på webbplatser och i andra system. Det är system som håller reda på materialet som publiceras på en webbplats, och som också ser till att det faktiskt publiceras på avsett sätt. – Kallas på engelska för content management system, CMS. Ett CMS brukar ha två delar: content management application (CMA) och content delivery application (CDA). CMA är verktyg som används för skapande, ändring och borttagning av material, ofta hämtat från olika program och databaser. CDA formaterar materialet så att det kan publiceras på webben.
[informationshantering] [webbpublicering] [ändrad 19 maj 2018]