datapreparering

bearbetning av rådata så att de får en form som är lämplig för analys och annan behandling. – Datapreparering blir ofta nödvändigt när data hämtas från flera källor. Det innebär bland annat normalisering och formatanpassning. Uppgifterna ska skrivas på ett enhetligt sätt och i ett enhetligt format. Nummer som datum och telefonnummer ska bara kunna tolkas på ett sätt, samma för bokstavskoder – står CA för Kanada eller Kalifornien? – På engelska: data preparation, ofta: data prep; även: data wrangling.

[data] [ändrad 10 november 2021]

data void

datatomrum – få eller inga resultat av en sökning i en sökmotor. – Uttrycket data void i denna betydelse myntades 2018 av Michael Golebiewski (Twitter)Microsoft. Han hävdar att datatomrum kan utnyttjas på flera sätt för spridning av desinformation – läs mer i denna artikel. – I juni 2021 började Google varna användare för datatomrum: ”It looks like these results are changing quickly: if this topic is new, it can sometimes take time for results to be added from reliable sources.” Varningen visas när detta skrivs bara för användare i USA.

[desinformation] [sökmotorer] [sökningar] [27 juni 2021]

ambient data

härledda data, omgivande datadata som inte kan hämtas direkt från databaser eller från användares inmatningar av ord och siffror. Det engelska uttrycket ambient data används i flera betydelser:

  • härledda data – data som användare oavsiktligt och indirekt lämnar i från sig. Det kan gälla mönster i vad användaren gör med tangentbord och mus, väntetider, raderingar, tryck på ångerknapp. Sådant kan studeras som led i analys av kundbeteende. Det har blivit en betydelsefull del i hur sociala medier bevakar användarna för att kunna rikta reklam och annan information till dem. – Man kan jämföra med skillnaden mellan de ord som en person yttrar (data) och slutsatser dragna av hennes tonfall och kroppsspråk när hon säger det (härledda data). – Jämför med beteendebaserad uppgift, härledd uppgift och metadata;
  • omgivningsdata, omgivande data, kvarblivna data – bland annat: data som finns kvar på en hårddisk eller SSD, men som inte är åtkomliga med vanliga metoder, till exempel för att en fil har blivit delvis raderad och överskriven. – Se också dataremanens;
  • trådlöst överförda data som finns i omgivningen. Trådlösa sensornätverk är konstruerade för att uppfånga sådana data från sensorer;
  • genomgående data – principen att data finns överallt i en organisation – inte bara i databaser. 

[data] [24 mars 2021]

data laundering

datatvätt, persondatatvätt – bearbetning av olovligt åtkomna data för att de ska kunna säljas till och användas av lagliga verksamheter. – ”Tvätten” går ut på att göra det svårt att spåra källan för de data det gäller. Det gäller oftast, men inte alltid, personuppgifter. – Den engelska termen data laundering anspelar på money laundering – penningtvätt (se cyberlaundering). Beklagligtvis har den närmast till hands liggande översättningen datatvätt redan en annan betydelse.

[data] [it-relaterad brottslighet] [24 februari 2021]

DIKW

Data, information, knowledge, wisdom – data, information, kunskap, vishet – en vanlig hierarkisk uppdelning av vetandet. Det sägs då att vishet bygger på kunskap, kunskap bygger på information och information bygger i sin tur på data. Man talar om DIKW‑pyramiden. Den hierarkiska indelningen, i olika varianter, har diskuterats sedan mitten av 1900‑talet, och har inte nödvändigtvis med it att göra.

[data] [filosofi] [förkortningar på D] [3 februari 2021]

volymtak

(volume cap, data volume cap) – övre gräns för den datamängd som en kund använder under en tidsperiod i molntjänster. Kunden kan på många tjänster själv ställa in ett volymtak på önskad nivå för att förhindra oväntat hög användning av datalagring i molnet. – Ordet volymtak används i andra sammanhang i motsvarande betydelse.

[data] [molnet] [1 februari 2021]

analys

  1. – allmänt: uppdelning av något i dess beståndsdelar;
  2. – allmänt inom it: programbaserat sökande efter mönster och trender i data. Målet är att skilja det som är betydelsefullt i ett givet sammanhang från det som har liten eller ingen betydelse i det sammanhanget. – Syftet är att resultatet av analysen ska kunna användas i beslutsfattande;
  3. – i systemutveckling: fastställande av den logiska struktur som ett it‑system behöver ha för att svara mot kraven i kravspecifikationen. Analysen anger vilka delar som måste ingå i systemet och informationsflödet mellan dem. I vattenfallsmetoden skiljer man mellan analys och design: Design är fastställande av hur systemet faktiskt ska se ut – att med ledning av analysen göra upp ritningarna som kodarna ska följa. I nyare metoder är gränsen mellan analys och design inte skarp.

– På svenska kallas specialiteten, de individuella utförandena och resultaten alla för analys. På engelska skiljer man mellan analysis och analytics (specialiteten). Termen analytik för analytics förekommer ibland på svenska, då mest inom medicin. – Språkligt: Analys kommer av grekiska analysis som kan översättas med uppdelning, upplösning. Det brukar ställas mot syntes – sammansättning. Den språkliga motsatsen är den kemiska termen katalys

[analys] [11 januari 2021]