– se datamängd.
Kategori: data
datapunkt
data dispersion ⇢
– se dataskingring.
dataskingring
(data dispersion) – det att företagsintern information sprids till utomstående, oavsiktligt eller genom tanklöshet. Det är ofta en bieffekt av användning av personlig utrustning (smarta mobiler, bärbara datorer) som kan anslutas till organisationens nätverk utan tillräcklig säkerhet. En annan orsak är att anställda utan att tänka sig för vidarebefordrar intern information till utomstående, till exempel genom att skicka mejl och mejlbilagor vidare till dem.
[data] [it-säkerhet] [6 maj 2020]
källdata
datamängd som är indata i sökningar, analys och maskininlärning. Resultatet kallas för måldata. När man talar om källdata i stället för indata vill man markera att datamängden har valts ut för ett bestämt ändamål eller har hämtats från en bestämd källa. – På engelska: source data. – Läs också om datakälla.– Om det gäller maskininlärning talar man också om träningsdata.
[data] [maskininlärning] [ändrad 3 april 2023]
datamaskering
(data masking) – utbyte av data i en databas eller applikation mot andra data i syfte att skydda data mot obehörig åtkomst. – Datamaskering görs i en kopia av databasen. Originalet finns kvar oförändrat. – Datamaskering ska göras så att den maskerade databasen eller applikationen fortfarande är användbar. Den ska fortfarande kunna användas för testning, programutveckling och annat som inte kräver tillgång till riktiga data, eventuellt också för statistisk analys. – För att man ska tala om datamaskering i strikt bemärkelse krävs att uppgifterna ändras och kastas om på ett systematiskt sätt, till exempel så att statistiska analyser fortfarande blir riktiga. (Se till exempel perturbation.) Att bara ta bort data eller ersätta dem med nollor eller XXX… är inte datamaskering i denna bemärkelse. – Kommersiella databashanterare har ofta inbyggda funktioner för datamaskering. – Språkligt: Direktöversättningen datamaskning är olämplig, eftersom maskning är något helt annat.
[databaser] [statistik] [31 mars 2020]
columnar ⇢
(kolumnär) – se kolumnorienterad.
master
– inom it:
- – anordning eller funktion som styr något annat (en
slaveller sekundär). Kan översättas med styr- eller huvud-; - – original, källa – information som ska anses vara korrekt och som tillhandahålls för att andra informationsanvändare ska rätta sig efter den. (Se också en enda källa till sanning)
– Termen master har obehagliga associationer, i synnerhet i kombination med slave, och byts därför allt oftare ut mot leader – ledare eller primary – primär, även: main – huvud-. – Slave byts ut mot secondary – sekundär, follower – följare, replica – replik eller standby – reserv.
[hårdvara] [informationshantering] [språktips] [ändrad 2 november 2022]
bubbelsortering
en enkel men ofta tidskrävande metod för att sortera. – Bubbelsortering kan användas för att sortera tal i nummerordning, ord i bokstavsordning eller för annan sortering i en fastställd ordning (linjär ordning). – Bubbelsortering går till så att ett program går igenom talen (eller bokstäverna) i den ordning de är givna, från början till slut, två intilliggande tal i taget. De två första talen jämförs, och om det andra talet är lägre än det första låter programmet dem byta plats. Sedan jämför programmet det andra talet med det tredje talet på samma sätt, och så vidare tills programmet kommer till slutet av talserien. Då börjar proceduren om från början. Detta upprepas till programmet kan gå igenom hela talserien utan att göra en enda omflyttning. Då är talen ordnade i storleksordning (eller orden i bokstavsordning) och programmet avslutas. Exempel:
41352 > 14352 > 13452 > 13425 > (ny genomgång:) 13425 > 13245 > 12345> (slutliga genomgången:) 12345.
– När man ska sortera stora mängder är bubbelsortering tidskrävande jämfört med andra metoder, och det används nästan aldrig i praktiken. En nackdel är att programmet inte vet när mängden är sorterad, utan upptäcker det först när det kan gå igenom hela mängden utan att ändra något. Även om programmet bara behöver göra en enda omflyttning måste det ändå gå igenom hela talserien två gånger. – Vad som ofta gör bubbelsortering ineffektivt är att höga tal snabbt rör sig bakåt (alltså till sin rätta plats) i mängden, medan låga tal rör sig långsamt framåt – ett steg per genomgång. Höga tal tidigt i den ursprungliga talserien kallas därför för kaniner, låga tal långt bak i serien kallas för sköldpaddor. Ett enda lågt tal långt bak i den ursprungliga talserien kan göra att programkörningen tar många gånger längre tid än vad den annars skulle göra. – På engelska: bubble sort. – Benämningen syftar på att låga tal ”bubblar” upp till sin rätta plats. – Läs mer i Wikipedia.
[data] [ändrad 2 april 2020]
crowdmapping
gräsrotskartering – framställning av kartor över förekomster av händelser eller företeelser genom att många personer, var för sig, skickar in uppgifter till en tjänst. Kartorna publiceras på webben och förnyas löpande. Det är alltså en form av crowdsourcing. Kartorna kan gälla allt från skogsbränder och andra naturkatastrofer till upplopp, föroreningar och trafikstockningar; även mer önskvärda företeelser. – En känd plattform för gräsrotskartering är Ushahidi.
[geo] [hop] [informationsinsamling] [3 mars 2020]