dataförgiftning

manipulering av data som används för att träna system för artificiell intelligens och maskininlärning. Angriparen lägger till vilseledande data i en träningsdatamängd vilket leder till att programmet för AI eller maskininlärning får missvisande resultat. Dataförgiftning kan göras som rent sabotage eller i syfte att styra resultaten i en viss riktning. – På engelska: data poisoning.

[ai] [attacker] [2 februari 2021]

igenkänning

om datorprogram: mätning och analys av företeelser i den yttre världen på ett sådant sätt att programmet kan känna igen andra förekomster av samma företeelse och hänföra dem till ett namn eller kategori. Igenkänning kan gälla:

  • – individer. Ansiktsigenkänning och röstigenkänning är identifiering av den person vars ansikte finns på bilden respektive den som talar. Alternativt, om personen inte kan identifieras (namnges), skapande av en profil som kan sparas för att senare jämföras med andra iakttagelser;
  • – typer, arter, sorter. Bildigenkänning (motivigenkänning) är igenkänning av det som visas på en bild, till exempel en bil eller en hund. Det är inte nödvändigt att säga exakt vilken bil eller vilken hund. Teckenigenkänning är identifiering av bokstäver och andra tecken från bilder av text.

– Igenkänning, på engelska recognition, i olika former brukar ses som tillämpning av artificiell intelligens och görs ofta med maskininlärning. – Man behöver ibland skilja mellan igenkänning och upptäckt (detektion). Program för ansiktsupptäckt (ansiktsdetektion) kan hitta ett ansikte i en bild, men behöver inte känna igen personen. Det är användbart för automatisk skärpeinställning på kameror.

[artificiell intelligens] [biometri] [ord på -igenkänning] [14 december 2020]

one-hot

one-hot encoding, på svenska kallat one-hot-kodningbinär kodning där tal får innehålla en och bara en etta, resten nollor. Alltså till exempel 0001, 0010, 0100, 1000. Det omvända, bara en nolla, resten ettor, kallas ibland för one‑cold encoding. One‑hot‑kodning används i maskininlärning, där det används för kodning av egenskaper: man kan till exempel låta 001 stå för rött, 010 stå för grönt och 100 stå för blått. Det är alltså en motsvarighet till att kryssa för en, och bara en, av ett antal kryssrutor i ett frågeformulär. Det används också i elektroniska kretsar. – Läs också om vandrande ettor.

[maskininlärning] [programmering] [11 juni 2020]

övervakad inlärning

(supervised learning) – om maskininlärning: programmet tränas genom att bearbeta en uppsättning med källdata och relaterade måldata. Programmet får så att säga veta facit (antingen i förväg eller under inlärningens gång): dess uppgift är att hitta regler som bestämmer hur man kommer fram till rätt svar (måldata). – Enkelt exempel: Programmet får se bilder på katter och hundar (källdata), och det får också veta vilka bilder som föreställer katter respektive hundar. Uppgiften är att hitta regler för hur man med bildigenkänning skiljer på de två husdjuren. – Jämför med oövervakad inlärning och djupinlärning. (Även: övervakad maskininlärning.)

[maskininlärning] [27 april 2020]

oövervakad inlärning

(unsupervised learning) – om maskininlärning: system där programmets uppgift är att hitta mönster och avvikelser i en datamängd utan att ha fått instruktioner om vad som är rätt eller fel. Programmet ska hitta strukturer i datamängden och dessa ska sedan kunna användas för olika ändamål som analys, kategorisering eller för att upptäcka misstänkta brott. – Se också djup maskininlärning och jämför med övervakad inlärning. (Även: oövervakad maskininlärning, icke övervakad inlärning, icke övervakad maskininlärning.)

[maskininlärning] [ändrad 11 juni 2020]

datamängd

(data set eller dataset) – en samling data som behandlas tillsammans för ett bestämt ändamål av ett datorprogram. I praktiken kan detta vara:

  • – en eller flera tabeller i databaser; datamängd kan då ses som synonym till databas;
  • – när det gäller NoSQL‑databaser och ostrukturerade data kan datamängd stå för vilka data som helst, till exempel ett eller flera textdokument: det viktiga är att dessa data behandlas tillsammans för ett bestämt ändamål, till exempel indexering av text för en sökmotor;
  • – i den terminologi som användes av IBMstordatorernas tid var en datamängd en samling data som hade formaterats på ett bestämt sätt för att kunna behandlas;
  • – i statistik: en ordnad samling data (datapunkter) om en bestämd företeelse;
  • – i artificiell intelligens: en samling data som används för att träna program för maskininlärning och som har bedömts vara representativ för det som ska läras in;
  • data set är också en ålderdomlig engelsk term för modem.

[ai] [data] [datakommunikation] [statistik] [ändrad 11 juni 2020]