human computation

mänskliga beräkningar, människostödda beräkningar – datorprogram som förutsätter medverkan av en människa. Det finns nämligen uppgifter som är enklare för en människa än för ett datorprogram att lösa – förutsatt givetvis att människan har de förkunskaper som behövs. När man utvecklar program för mänskliga beräkningar är utmaningen att veta när den mänskliga insatsen behövs.

[artificiell intelligens] [programmering] [31 augusti 2020]

one-hot

one-hot encoding, på svenska kallat one-hot-kodningbinär kodning där tal får innehålla en och bara en etta, resten nollor. Alltså till exempel 0001, 0010, 0100, 1000. Det omvända, bara en nolla, resten ettor, kallas ibland för one‑cold encoding. One‑hot‑kodning används i maskininlärning, där det används för kodning av egenskaper: man kan till exempel låta 001 stå för rött, 010 stå för grönt och 100 stå för blått. Det är alltså en motsvarighet till att kryssa för en, och bara en, av ett antal kryssrutor i ett frågeformulär. Det används också i elektroniska kretsar. – Läs också om vandrande ettor.

[maskininlärning] [programmering] [11 juni 2020]

Dada Engine

ett program som producerar text som är grammatiskt korrekt men meningslös. Det utvecklades 1996 av Andrew C Bulhak (blogg), då på Monash University (monash.edu) i Melbourne. Användaren kan ge Dada Engine olika språk och olika vokabulärer att arbeta med. En omtalad tillämpning av Dada Engine är The Postmodern Generator (elsewhere.org/pomo) som genererar postmodernistiska artiklar som är praktiskt taget omöjliga att skilja från sådana som är skrivna av människor. – Se dev.null.org/dadaengine. – Läs också om SciGen.

[artificiell skenbar intelligens] [språkteknik] [23 maj 2020]

källdata

datamängd som är indata i sökningar, analys och maskininlärning. Resultatet kallas för måldata. När man talar om källdata i stället för indata vill man markera att datamängden har valts ut för ett bestämt ändamål eller har hämtats från en bestämd källa.  – På engelska: source data. – Om det gäller maskininlärning talar man också om träningsdata.

[data] [maskininlärning] [ändrad 29 april 2020]

övervakad inlärning

(supervised learning) – om maskininlärning: programmet tränas genom att bearbeta en uppsättning med källdata och relaterade måldata. Programmet får så att säga veta facit (antingen i förväg eller under inlärningens gång): dess uppgift är att hitta regler som bestämmer hur man kommer fram till rätt svar (måldata). – Enkelt exempel: Programmet får se bilder på katter och hundar (källdata), och det får också veta vilka bilder som föreställer katter respektive hundar. Uppgiften är att hitta regler för hur man med bildigenkänning skiljer på de två husdjuren. – Jämför med oövervakad inlärning och djupinlärning. (Även: övervakad maskininlärning.)

[maskininlärning] [27 april 2020]

oövervakad inlärning

(unsupervised learning) – om maskininlärning: system där programmets uppgift är att hitta mönster och avvikelser i en datamängd utan att ha fått instruktioner om vad som är rätt eller fel. Programmet ska hitta strukturer i datamängden och dessa ska sedan kunna användas för olika ändamål som analys, kategorisering eller för att upptäcka misstänkta brott. – Se också djup maskininlärning och jämför med övervakad inlärning. (Även: oövervakad maskininlärning, icke övervakad inlärning, icke övervakad maskininlärning.)

[maskininlärning] [ändrad 11 juni 2020]

datamängd

(data set eller dataset) – en samling data som behandlas tillsammans för ett bestämt ändamål av ett datorprogram. I praktiken kan detta vara:

  • – en eller flera tabeller i databaser; datamängd kan då ses som synonym till databas;
  • – när det gäller NoSQL‑databaser och ostrukturerade data kan datamängd stå för vilka data som helst, till exempel ett eller flera textdokument: det viktiga är att dessa data behandlas tillsammans för ett bestämt ändamål, till exempel indexering av text för en sökmotor;
  • – i den terminologi som användes av IBMstordatorernas tid var en datamängd en samling data som hade formaterats på ett bestämt sätt för att kunna behandlas;
  • – i statistik: en ordnad samling data (datapunkter) om en bestämd företeelse;
  • – i artificiell intelligens: en samling data som används för att träna program för maskininlärning och som har bedömts vara representativ för det som ska läras in;
  • data set är också en ålderdomlig engelsk term för modem.

[ai] [data] [datakommunikation] [statistik] [ändrad 11 juni 2020]