- – ett datorsystem från IBM, konstruerat för att sammanställa information från enorma datamängder så att den kan behandlas med naturligt språk. – Watson, som presenterades 2010, ska kunna tolka och besvara frågor som ställs i naturligt språk. Det har blivit kärnan i IBM:s system med webbaserade tjänster för frågor och svar, skriftligen eller muntligen (se talgränssnitt). – Systemets första uppgift var att tävla i frågesporten Jeopardy. Watson tävlade i februari 2011 framgångsrikt mot mänskliga Jeopardymästare i USA. Då bestod Watson av tio skåp med totalt 90 servrar och sammanlagt 2 880 processorer. Watson fungerade i tävlingen fristående, utan anslutning till internet: all information som behövdes för att besvara frågorna var lagrad på servrarna. – Systemet är uppkallat efter IBM:s grundare, Thomas J Watson (men namnet för givetvis också tankarna till Sherlock Holmes hävdatecknare doktor Watson). – Det djupare syftet med utvecklingen av Watson är att utveckla tekniker för förståelse av naturligt språk, informationsutvinning ur stora textmassor och formulering av korrekt uttryckta svar på frågor. Watson‑tekniken ska kunna användas till exempel som hjälpmedel för läkare. – Under 2013 öppnade IBM Watson för externa kunder som erbjöds att mata Watson med egen information för att sedan kunna använda det för kunskapsutvinning. Leksakstillverkaren Elemental Path ska använda Watson i talande leksaker, se Cognitoys†. – Läs mer på ibm.com/watson. – Läs också om Verse. – Jämför med Wolfram Alpha och med Amazon Echo, Apples Siri, Facebook M†, Microsofts Cortana och Soundhounds Hound;
- – se under sherlock.
[ai] [talgränssnitt] [ändrad 7 juni 2022]
information i en sådan form att den kan bearbetas med automatiska eller manuella metoder. – Internationella standardiseringsorganisationen ISO definierar data som ”tolkningsbar representation av information på ett formaliserat sätt som lämpar sig för kommunikation, tolkning eller bearbetning (av människor eller med automatiska metoder)”. – Ett annat sätt att uttrycka skillnaden är att data är betydelsebärande teckenföljder som kan behandlas mekaniskt, alltså utan hänsyn till det sammanhang som tecknen är hämtade från. Data kan vara meningslösa för alla, utom för den som vet vad de står för. En serie tal kan adderas utan att man behöver veta ifall det är posterna på ett köpkvitto eller folkmängden i Norrbottens kommuner. Om man vet vilket är det information. I mer allmän betydelse är data uppgifter som är, eller förväntas vara, förhållandevis exakta och finkorniga. Man kan också säga att data är sådan information som kan passas in i tabeller; information omfattar också textdokument, bilder, filmer, ljudinspelningar och annat. Annorlunda uttryckt: data är råvaran, information är produkten. – Se också DIKW. – På 2010‑talet har data på engelska blivit ett trendigt ord igen: det används om stora datamängder och metoder för att utvinna information ur dem – se till exempel big data;
- – data är plural av det latinska ordet datum – det som är givet. Men i nutida svenska är data och datum (som i almanackan) två olika ord;
- – data som i databehandling är plural. Man skriver alltså ”mina data, nya data”. (Jämför med kläder, som också bara finns i plural.) Behöver man en singularform blir det uppgift. I statistik och analys talar man också om datapunkter. – Se Datatermgruppen (länk);
- – när data- används som förled ska det ofta tolkas som kortform av datateknik, inte som ordet data fristående (i denna ordlista står det som regel datorteknik);
- – heter det dataföretag eller datorföretag? Den vanliga regeln är att man använder förleden dator- när det handlar om hårdvara. Förleden data- använder man naturligtvis om data (uppgifter), men också när det handlar om datorprogram. Den övergripande termen är data-. IBM, som tillverkar både hårdvara och mjukvara, kallas alltså för ett dataföretag, eller kanske hellre för ett it‑företag;
- – på engelska ofta: data i betydelsen stor datamängd som kan analyseras på olika sätt. (Däremot används inte data på engelska i betydelsen datateknik, som på svenska.) Engelska data science handlar om datautvinning och dataanalys. Det som på svenska ibland heter datavetenskap heter computer science på engelska.
- – sådana datum som står i almanackan heter på svenska datum både i ental och i flertal – ett datum, flera datum;
- – rådata är data som inte har granskats, sållats eller analyserats;
- – allmän beteckning på de ettor och nollor som förmedlas i datakommunikation.
– Bakgrund: Det var IBM som införde ordet data i datortekniken. De första datorerna hade använts för matematiska beräkningar inom teknik och vetenskap. På engelska kallades datorer då som nu för computers, och de första svenska datorerna kallades för kalkylatorer. IBM, som redan i decennier hade sålt hålkortsmaskiner till företag, anpassade datorer till hålkortstekniken och ville få företagen att köpa dem för att hantera kundregister, löner och liknande. Men IBM fruktade att företagen skulle tycka att en avancerad räknemaskin, en computer, var en alltför komplicerad maskin för de relativt enkla beräkningar som hanterades med hålkort. IBM började därför tala om data processing – databehandling, i stället för computing. Men på engelska var det computing som vann i det långa loppet. (Se Thomas J Watsons memoarer, IBM & son.) – På svenska kallades de första datorerna för kalkylatorer.
[data] [språktips] [ändrad 20 januari 2023]