dataskingring

(data dispersion) – det att företagsintern information sprids till utomstående, oavsiktligt eller genom tanklöshet. Det är ofta en bieffekt av användning av personlig utrustning (smarta mobiler, bärbara datorer) som kan anslutas till organisationens nätverk utan tillräcklig säkerhet. En annan orsak är att anställda utan att tänka sig för vidarebefordrar intern information till utomstående, till exempel genom att skicka mejl och mejlbilagor vidare till dem.

[data] [it-säkerhet] [6 maj 2020]

källdata

datamängd som är indata i sökningar, analys och maskininlärning. Resultatet kallas för måldata. När man talar om källdata i stället för indata vill man markera att datamängden har valts ut för ett bestämt ändamål eller har hämtats från en bestämd källa.  – På engelska: source data. – Om det gäller maskininlärning talar man också om träningsdata.

[data] [maskininlärning] [ändrad 29 april 2020]

datamaskering

(data masking) – utbyte av data i en databas eller applikation mot andra data i syfte att skydda data mot obehörig åtkomst. Detta görs i en kopia av databasen. Originalet finns kvar oförändrat. – Datamaskering ska göras utan att den maskerade databasen eller applikationen blir oanvändbar. Den ska fortfarande kunna användas för testning, programutveckling och annat som inte kräver tillgång till riktiga data, eventuellt också för statistisk analys. – För att man ska tala om datamaskering i strikt bemärkelse krävs att uppgifterna ändras och kastas om på ett systematiskt sätt, till exempel så att statistiska analyser fortfarande blir riktiga. (Se till exempel perturbation.) Att bara ta bort data eller ersätta dem med nollor eller XXX… är inte datamaskering i denna bemärkelse. – Kommersiella databashanterare har ofta inbyggda funktioner för datamaskering. – Språkligt: Direktöversättningen datamaskning är olämplig, eftersom maskning är något helt annat.

[databaser] [statistik] [31 mars 2020]

master

– inom it: 

  1. – anordning eller funktion som styr något annat (en slav eller sekundär). Kan översättas med styr- eller huvud-;
  2. original, källa – information som ska anses vara korrekt och som tillhandahålls för att andra informationsanvändare ska rätta sig efter den.

[hårdvara] [informationshantering] [30 mars 2020]

bubbelsortering

en enkel men ofta tidskrävande metod för att sortera. Bubbelsortering kan användas för att sortera tal i nummerordning, ord i bokstavsordning eller för annan sortering i en fastställd ordning (linjär ordning). – Bubbelsortering går till så att ett program går igenom talen (eller bokstäverna) i den ordning de är givna, från början till slut, två intilliggande tal i taget. De två första talen jämförs, och om det andra talet är lägre än det första låter programmet dem byta plats. Sedan jämför programmet det andra talet med det tredje talet på samma sätt, och så vidare tills programmet kommer till slutet av talserien. Då börjar proceduren om från början. Detta upprepas till programmet kan gå igenom hela talserien utan att göra en enda omflyttning. Då är talen ordnade i storleksordning (eller orden i bokstavsordning) och programmet avslutas. Exempel:

41352 > 14352 > 13452 > 13425 > (ny genomgång:) 13425 > 13245 > 12345> (slutliga genomgången:) 12345.

– När man ska sortera stora mängder är bubbelsortering tidskrävande jämfört med andra metoder, och det används nästan aldrig i praktiken. En nackdel är att programmet inte vet när mängden är sorterad, utan upptäcker det först när det kan gå igenom hela mängden utan att ändra något. Även om programmet bara behöver göra en enda omflyttning måste det ändå gå igenom hela talserien två gånger. – Vad som ofta gör bubbelsortering ineffektivt är att höga tal snabbt rör sig bakåt (alltså till sin rätta plats) i mängden, medan låga tal rör sig långsamt framåt – ett steg per genomgång. Höga tal tidigt i den ursprungliga talserien kallas därför för kaniner, låga tal långt bak i serien kallas för sköldpaddor. Ett enda lågt tal långt bak i den ursprungliga talserien kan göra att programkörningen tar många gånger längre tid än vad den annars skulle göra. – På engelska: bubble sort. – Benämningen syftar på att låga tal ”bubblar” upp till sin rätta plats. – Läs mer i Wikipedia.

[data] [ändrad 2 april 2020]

crowdmapping

gräsrotskartering – framställning av kartor över förekomster av händelser eller företeelser genom att många personer, var för sig, skickar in uppgifter till en tjänst. Kartorna publiceras på webben och förnyas löpande. Det är alltså en form av crowdsourcing. Kartorna kan gälla allt från skogsbränder och andra naturkatastrofer till upplopp, föroreningar och trafikstockningar; även mer önskvärda företeelser. – En känd plattform för gräsrotskartering är Ushahidi.

[geo] [gräsrotsbaserat] [informationsinsamling] [3 mars 2020]

data set

(eller dataset) – datamängd – en samling data som behandlas tillsammans för ett bestämt ändamål av ett datorprogram. I praktiken kan detta vara:

  • – en eller flera tabeller i databaser; data set kan då ses som en synonym till databas;
  • – när det gäller NoSQL‑databaser och ostrukturerade data kan data set / datamängd stå för vilka data som helst, till exempel ett eller flera textdokument: det viktiga är att dessa data behandlas tillsammans för ett bestämt ändamål, till exempel indexering av text för en sökmotor;
  • – i den terminologi som användes av IBMstordatorernas tid var en datamängd en samling data som hade formaterats på ett bestämt sätt för att kunna behandlas;
  • – i statistik: en ordnad samling data om en bestämd företeelse;
  • – i artificiell intelligens: en samling data som används för att träna program för maskininlärning och som har bedömts vara representativ för det som ska läras in;
  • data set är också en ålderdomlig engelsk term för modem.

[ai] [data] [datakommunikation] [statistik] [14 februari 2020]