Watson

  1. – ett datorsystem från IBM, konstruerat för att sammanställa information från enorma datamängder så att den kan behandlas med naturligt språk. – Watson, som presenterades 2010, ska kunna tolka och besvara frågor som ställs i naturligt språk. Det har blivit kärnan i IBM:s system med webbaserade tjänster för frågor och svar, skriftligen eller muntligen (se talgränssnitt). – Systemets första uppgift var att tävla i frågesporten Jeopardy. Wat­son tävlade i februari 2011 framgångsrikt mot mänsk­liga Jeopardymästare i USA. Då bestod Watson av tio skåp med totalt 90 servrar och sammanlagt 2 880 processorer. Watson fungerade i tävlingen fristående, utan anslutning till inter­­­net: all information som behövdes för att besvara frågorna var lagrad på servrarna. – Systemet är upp­­kallat efter IBM:s grundare, Thomas J Watson (men namnet för givetvis också tankarna till Sherlock Holmes hävdatecknare doktor Watson). – Det djupare syftet med utvecklingen av Watson är att utveckla tekniker för förståelse av naturligt språk, informationsutvinning ur stora textmassor och formuler­ing av korrekt uttryckta svar på frågor. Watson‑tekniken ska kunna användas till exempel som hjälpmedel för läkare. – Under 2013 öppnade IBM Watson för externa kunder som erbjöds att mata Watson med egen information för att sedan kunna använda det för kunskapsutvinning. Leksakstillverkaren Elemental Path ska använda Watson i talande leksaker, se Cognitoys†. – Läs mer på ibm.com/watson. – Läs också om Verse. – Jämför med Wolfram Alpha och med Amazon Echo, Apples Siri, Facebook M†, Microsofts Cortana och Sound­hounds Hound;
  2. – se under sherlock.

[ai] [talgränssnitt] [ändrad 7 juni 2022]

data

information i en sådan form att den kan be­arbetas med automatiska eller manuella metoder. – Internationella standardiseringsorganisationen ISO definierar data som ”tolkningsbar representation av information på ett formali­serat sätt som lämpar sig för kommunikation, tolkning eller bearbetning (av människor eller med automatiska metoder)”. – Ett annat sätt att uttrycka skillnaden är att data är betydelsebärande teckenföljder som kan behandlas mekaniskt, alltså utan hänsyn till det sammanhang som tecknen är hämtade från. Data kan vara meningslösa för alla, utom för den som vet vad de står för. En serie tal kan adderas utan att man behöver veta ifall det är posterna på ett köpkvitto eller folkmängden i Norrbottens kommuner. Om man vet vilket är det information. I mer allmän betydelse är data uppgifter som är, eller förväntas vara, förhållandevis exakta och finkorniga. Man kan också säga att data är sådan information som kan passas in i tabeller; information om­fattar också textdokument, bilder, filmer, ljudinspelningar och annat. Annorlunda uttryckt: data är råvaran, information är produkten. – Se också DIKW. – På 2010‑talet har data på engelska blivit ett trendigt ord igen: det används om stora datamängder och metoder för att ut­vinna information ur dem – se till exempel big data;

  1. – data är plural av det latinska ordet datumdet som är givet. Men i nu­tida svenska är data och datum (som i almanackan) två olika ord;
  2. – data som i databehandling är plural. Man skriver alltså ”mina data, nya data”. (Jämför med kläder, som också bara finns i plural.) Behöver man en singularform blir det uppgift. I statistik och analys talar man också om datapunkter.  – Se Datatermgruppen (länk);
  3. – när data- används som förled ska det ofta tolkas som kortform av datateknik, inte som ordet data fristående (i denna ordlista står det som regel datorteknik);
  4. – heter det dataföretag eller dator­företag? Den vanliga regeln är att man använder för­­leden dator- när det handlar om hårdvara. Förleden data- använder man naturligtvis om data (upp­gifter), men också när det handlar om dator­­program. Den över­gripande termen är data-. IBM, som till­­verkar både hårdvara och mjuk­vara, kallas alltså för ett dataföretag, eller kanske hellre för ett it‑företag;
  5. – på engelska ofta: data i be­ty­delsen stor data­mängd som kan analyseras på olika sätt. (Däremot an­vänds inte data på engelska i betydelsen data­teknik, som på svenska.) Engelska data science handlar om datautvinning och dataanalys. Det som på svenska ibland heter data­­veten­skap heter computer science på engelska.
  6. – sådana datum som står i al­ma­nackan heter på svenska datum både i ental och i fler­tal – ett datum, flera datum;
  7. rådata är data som inte har granskats, sållats eller analyserats;
  8. – allmän beteckning på de ettor och nollor som förmedlas i datakommunikation.

– Bakgrund: Det var IBM som in­förde ordet data i datortekniken. De första datorerna hade använts för matematiska be­räkningar inom teknik och veten­­skap. På engelska kallades datorer då som nu för computers, och de första svenska datorerna kallades för kalkyla­torer. IBM, som redan i decenni­er hade sålt hålkortsmaskiner till företag, anpassade datorer till hålkortstekniken och ville få före­­tagen att köpa dem för att hantera kundregister, löner och liknande. Men IBM fruktade att före­­tagen skulle tycka att en avancerad räkne­maskin, en computer, var en alltför komplicerad maskin för de relativt enkla beräkningar som hanterades med hålkort. IBM började därför tala om data processing – databehandling, i stället för computing. Men på engelska var det computing som vann i det långa loppet. (Se Thomas J Watsons memoarer, IBM & son.) – På svenska kallades de första datorerna för kalkylatorer.

[data] [språktips] [ändrad 20 januari 2023]