information i en sådan form att den kan bearbetas med automatiska eller manuella metoder. – Internationella standardiseringsorganisationen ISO definierar data som ”tolkningsbar representation av information på ett formaliserat sätt som lämpar sig för kommunikation, tolkning eller bearbetning (av människor eller med automatiska metoder)”. – Ett annat sätt att uttrycka skillnaden är att data är betydelsebärande teckenföljder som kan behandlas mekaniskt, alltså utan hänsyn till det sammanhang som tecknen är hämtade från. Data kan vara meningslösa för alla, utom för den som vet vad de står för. En serie tal kan adderas utan att man behöver veta ifall det är posterna på ett köpkvitto eller folkmängden i Norrbottens kommuner. Om man vet vilket är det information. I mer allmän betydelse är data uppgifter som är, eller förväntas vara, förhållandevis exakta och finkorniga. Man kan också säga att data är sådan information som kan passas in i tabeller; information omfattar också textdokument, bilder, filmer, ljudinspelningar och annat. Annorlunda uttryckt: data är råvaran, information är produkten. – Se också DIKW. – På 2010‑talet har data på engelska blivit ett trendigt ord igen: det används om stora datamängder och metoder för att utvinna information ur dem – se till exempel big data;
- – data är plural av det latinska ordet datum – det som är givet. Men i nutida svenska är data och datum (som i almanackan) två olika ord;
- – data som i databehandling är plural. Man skriver alltså ”mina data, nya data”. (Jämför med kläder, som också bara finns i plural.) Behöver man en singularform blir det uppgift. I statistik och analys talar man också om datapunkter. – Se Datatermgruppen (länk);
- – när data- används som förled ska det ofta tolkas som kortform av datateknik, inte som ordet data fristående (i denna ordlista står det som regel datorteknik);
- – heter det dataföretag eller datorföretag? Den vanliga regeln är att man använder förleden dator- när det handlar om hårdvara. Förleden data- använder man naturligtvis om data (uppgifter), men också när det handlar om datorprogram. Den övergripande termen är data-. IBM, som tillverkar både hårdvara och mjukvara, kallas alltså för ett dataföretag, eller kanske hellre för ett it‑företag;
- – på engelska ofta: data i betydelsen stor datamängd som kan analyseras på olika sätt. (Däremot används inte data på engelska i betydelsen datateknik, som på svenska.) Engelska data science handlar om datautvinning och dataanalys. Det som på svenska ibland heter datavetenskap heter computer science på engelska.
- – sådana datum som står i almanackan heter på svenska datum både i ental och i flertal – ett datum, flera datum;
- – rådata är data som inte har granskats, sållats eller analyserats;
- – allmän beteckning på de ettor och nollor som förmedlas i datakommunikation.
– Bakgrund: Det var IBM som införde ordet data i datortekniken. De första datorerna hade använts för matematiska beräkningar inom teknik och vetenskap. På engelska kallades datorer då som nu för computers, och de första svenska datorerna kallades för kalkylatorer. IBM, som redan i decennier hade sålt hålkortsmaskiner till företag, anpassade datorer till hålkortstekniken och ville få företagen att köpa dem för att hantera kundregister, löner och liknande. Men IBM fruktade att företagen skulle tycka att en avancerad räknemaskin, en computer, var en alltför komplicerad maskin för de relativt enkla beräkningar som hanterades med hålkort. IBM började därför tala om data processing – databehandling, i stället för computing. Men på engelska var det computing som vann i det långa loppet. (Se Thomas J Watsons memoarer, IBM & son.) – På svenska kallades de första datorerna för kalkylatorer.
[data] [språktips] [ändrad 20 januari 2023]