data set

(eller dataset) – datamängd – en samling data som behandlas tillsammans för ett bestämt ändamål av ett datorprogram. I praktiken kan detta vara:

  • – en eller flera tabeller i databaser; data set kan då ses som en synonym till databas;
  • – när det gäller NoSQL‑databaser och ostrukturerade data kan data set / datamängd stå för vilka data som helst, till exempel ett eller flera textdokument: det viktiga är att dessa data behandlas tillsammans för ett bestämt ändamål, till exempel indexering av text för en sökmotor;
  • – i den terminologi som användes av IBMstordatorernas tid var en datamängd en samling data som hade formaterats på ett bestämt sätt för att kunna behandlas;
  • – i statistik: en ordnad samling data om en bestämd företeelse;
  • – i artificiell intelligens: en samling data som används för att träna program för maskininlärning och som har bedömts vara representativ för det som ska läras in;
  • data set är också en ålderdomlig engelsk term för modem.

[ai] [data] [datakommunikation] [statistik] [14 februari 2020]

strukturerade data

data som är ordnade på ett systematiskt sätt. Vanligtvis genom att uppgifterna ingår i en databas och är uppdelade i fält: varje fält är avsett för data av en viss typ, till exempel förnamn, efternamn, adress…  Syftet är att underlätta sökningar. – På engelska: structured data. – Se också strukturerad personuppgift.

[data] [8 januari 2020]

California consumer privacy act

(CCPA) – kalifornisk lag om skydd av medborgares personuppgifter. – CCPA, som röstades igenom i Kaliforniens lagstiftande församling 2018 och som träder i kraft vid årsskiftet 2019–2020, är lik EU:s dataskyddsförordning (GDPR). CCPA ålägger bland annat företag att redovisa vilka slags personuppgifter de samlar in och sparar, att på begäran lämna ut de personuppgifter de har om en medborgare till den medborgaren och att på begäran radera personuppgifter (med vissa undantag). Lagen gäller även för företag utanför Kalifornien, så snart som de hanterar personuppgifter om personer i Kalifornien. Alla amerikanska delstater har lagar till skydd av personuppgifter, men CCPA är den strängaste hittills. Företag som uppfyller kraven i GDPR uppfyller troligen också kraven i CCPA. – Lagtexten till CCPA finns på denna länk.

[lagar] [personlig integritet] [personuppgifter] [16 december 2019]

information foraging

informationsletande – beteckning på hur människor letar efter information på internet. Det gäller i synnerhet hur de bedömer tillgängliga möjliga källor till användbar information: är det värt besväret att klicka på den här länken för att eventuellt få veta mer, eller ska jag försöka någon annan stans? Forskare talar om vinstkvoten (rate of gain). Vinstkvoten är värdet av informationen delat med kostnaden (tid och besvär, eventuellt också pengar) för att anskaffa informationen. – Teorin om informationsletande utvecklades på 1990‑talet av de amerikanska forskarna Peter Pirolli (peterpirolli.com) och Stuart Card (länk), båda då på PARC. – Det engelska ordet foraging står för hur djur bedömer och väljer mellan olika tänkbara källor till föda.

[beteende] [informationsinsamling] [ändrad 13 november 2019]

en enda källa till sanning

principen att information ska hanteras så att varje uppgift finns bara på ett ställe och bara kan ändras på det stället. Alla andra processer och funktioner som har behov av den uppgiften måste hämta den utan ändringar från den enda källan. Det kan göras med pekare. Principen en enda källa till sanning kan tillämpas på databaser, dokumentsamlingar och systemutveckling. – På engelska: single source of truth, SSOT.

[databaser] [systemutveckling] [2 oktober 2019]