data-arkiv - IT-ord

information wants to be free

information vill vara fri – ett välkänt talesätt. – Det formulerades 1984 av Stewart Brand på den första hackarkonferensen (hackersconference.org), som anordnades i Marin County i Kalifornien. – Ofta glömmer man att Brand också sa att ”information wants to be expensive”. Brand syftade å ena sidan på att datortekniken gör det allt billigare att sprida information (och allt svårare att begränsa spridningen); å andra sidan på att rätt information vid rätt tid är värdefull (och att man därför kan ta betalt för den). Observera dubbeltydigheten i engelska free: fri / gratis.

[informationshantering] [öppen information] [13 maj 2023]

datakälla

övergripande term för samling av data som kan användas av program i it‑system. – Den mest renodlade datakällan är databasen, men det kan också vara kalkylark, tabeller, digitala mätvärden från mätinstrument eller annat. Det viktiga är att data i datakällan kan avläsas med automatik och användas på önskat sätt utan handpåläggning. – Termen datakälla syftar på data som redan finns i digital form och som används i ett it‑system. Hur dessa data har kommit dit spelar ingen roll – de kan vara hämtade från analoga källor som böcker och tidskrifter, eller komma från andra digitala källor. – Jämför med källdata. – På engelska: data source.

[data] [programmering] [3 april 2023]

data privacy

datasekretess – särskilt skydd av personuppgifter och andra skyddsvärda uppgifter. – Datasekretess gäller:

– dels vid överföring av data, både inom och utom den egna organisationen;
– dels skydd mot olovliga ändringar, manipulation, attacker och skador orsakade av tekniska problem.

– Språkligt: Privacy översätts oftast med [personlig] integritet. Men översättningen dataintegritet skulle kunna leda tanken fel, eftersom integritet har en annan betydelse när det gäller data: motsägelsefrihet och konsekvens. Därför får det bli datasekretess på svenska.

[data] [dataskydd] [30 mars 2023]

data fabric

datastruktur, datanätverk – beteckning på samordnad hantering av en organisations data, oavsett var de finns. – Data kan finnas på organisationens egna servrar, i molnet eller i den så kallade kanten. Data fabric är en term som myntats av Gartner (se länk) för att beskriva metoder för att göra alla data i organisationen tillgängliga och sökbara på samma sätt. – Se också fabric.

[data] [it-system] [30 mars 2023]

event stream ⇢

– se händelseström.

[datakommunikation] [informationshantering]

länkade data

data som länkas till andra data på internet i flera led. – Exempel: Pippi Långstrump skrevs av Astrid Lindgren som bodde vid Tegnérlunden (i Stockholm) där det finns en staty som föreställer August Strindberg… Länkade data är en funktion i den semantiska webben. En förutsättning är att varje uppgift publiceras på internet som en RDF (resource description format). RDF.er är treledade beskrivningar med mönstret subjekt–predikat-objekt: Pippi Långstrump (subjekt) skrevs av (predikat) Astrid Lindgren (objekt). Det omvända kan också publiceras: Astrid Lindgren (subjekt) skrev (predikat) Pippi Långstrump (objekt). Man kan också säga att subjekt är en individ eller ett exemplar, objekt är ofta, men inte alltid, en grupp eller kategori som individen räknas till eller har ett samband med. Det krävs att varje länk i länkade data förses med en webbadress (URL) så att den blir sökbar. – På engelska: linked data.

[informationshantering] [webben] [24 februari 2023]

ERD ⇢

– entity-relationship diagram – se entity-relationship.

[databaser] [förkortningar på E]

data steward

dataansvarig, dataföreståndare – en som ansvarar för de data som en organisation har. – Ansvaret gäller att data är korrekta, aktuella, användbara och fullständiga. En data steward ska också se till att data som av något skäl inte bör finnas i organisationens system raderas. I arbetsuppgifterna ingår också att förbättra kvaliteten på data och att finna nya källor för inhämtning av data. Uppdraget kan gälla alla data i organisationen eller i en del av den. Jobbet sammanfaller delvis med data custodian.

[data] [yrken] [16 juli 2022]

data custodian

dataförvaltare – en som ansvarar för hur en organisation hanterar sina data. – Ansvaret gäller sådant som datalagring, dataöverföring, dataskydd, skydd av personuppgifter, backup och andra tekniska processer för hantering av data. Arbetsuppgiften kan delvis sammanfalla med data steward (dataansvarig). En data custodian ansvarar för hur data hanteras, medan en data steward ansvarar för data som sådana. Det finns vanligtvis bara en data custodian i en organisation, men det kan finnas flera data stewards, som är underordnade.

[data] [yrken] [16 juli 2022]

syntetiska data

datamängd som har tagits fram för att användas i maskininlärning, men som inte är ett underlag som hämtats ur verkliga förhållanden. – Man vill ha ett underlag som är bättre för syftet med maskininlärningen än vad data ur verkligheten skulle vara. Lämpliga data kan vara svåra eller olämpliga att få fram ur verkliga förhållanden. Syntetiska data kan också användas för att undvika algoritmisk snedvridning. – Ett exempel är hur man tränar styrsystem för självkörande bilar att undvika olyckor: det är omöjligt att skaffa ett stort antal videor av verkliga trafikolyckor eller hotande olyckor, tagna ur bilens perspektiv. För att träna systemet framställer man i stället datoranimeringar. När det gäller självkörande bilar är det viktigaste ju inte att man har ett representativt urval av olyckor, utan man vill träna systemet även på mycket sällsynta situationer. – Man kan också utgå från ”verkliga” data från ett mindre antal personer och använda dessa data i olika kombinationer på syntetiska personer som används för träning i maskininlärning. Man kan se detta som en variant av sampling. Det påminner också om vad som i statistik kallas för omvägning eller kalibrering (se scb.se/hitta…). – På engelska: synthetic data, ibland även: fake data.

[data] [maskininlärning] [statistik] [19 juni 2022]