maskininlärning-arkiv - Sida 3 av 7

igenkänning

om datorprogram: mätning och analys av företeelser i den yttre världen på ett sådant sätt att programmet kan känna igen andra förekomster av samma företeelse och hänföra dem till ett namn eller kategori. Igenkänning kan gälla:

– individer. Ansiktsigenkänning och röstigenkänning är identifiering av den person vars ansikte finns på bilden respektive den som talar. Alternativt, om personen inte kan identifieras (namnges), skapande av en profil som kan sparas för att senare jämföras med andra iakttagelser;
– typer, arter, sorter. Bildigenkänning (motivigenkänning) är igenkänning av det som visas på en bild, till exempel en bil eller en hund. Det är inte nödvändigt att säga exakt vilken bil eller vilken hund. Teckenigenkänning är identifiering av bokstäver och andra tecken från bilder av text.

– Igenkänning, på engelska recognition, i olika former brukar ses som tillämpning av artificiell intelligens och görs ofta med maskininlärning. – Man behöver ibland skilja mellan igenkänning och upptäckt (detektion). Program för ansiktsupptäckt (ansiktsdetektion) kan hitta ett ansikte i en bild, men behöver inte känna igen personen. Det är användbart för automatisk skärpeinställning på kameror.

[artificiell intelligens] [biometri] [ord på -igenkänning] [14 december 2020]

one-hot

one-hot encoding, på svenska kallat one-hot-kodning – binär kodning där tal får innehålla en och bara en etta, resten nollor. Alltså till exempel 0001, 0010, 0100, 1000. Det omvända, bara en nolla, resten ettor, kallas ibland för one‑cold encoding. One‑hot‑kodning används i maskininlärning, där det används för kodning av egenskaper: man kan till exempel låta 001 stå för rött, 010 stå för grönt och 100 stå för blått. Det är alltså en motsvarighet till att kryssa för en, och bara en, av ett antal kryssrutor i ett frågeformulär. Det används också i elektroniska kretsar. – Läs också om vandrande ettor.

[maskininlärning] [programmering] [11 juni 2020]

källdata

datamängd som är indata i sökningar, analys och maskininlärning. Resultatet kallas för måldata. När man talar om källdata i stället för indata vill man markera att datamängden har valts ut för ett bestämt ändamål eller har hämtats från en bestämd källa. – På engelska: source data. – Läs också om datakälla.– Om det gäller maskininlärning talar man också om träningsdata.

[data] [maskininlärning] [ändrad 3 april 2023]

unsupervised learning ⇢

– se oövervakad inlärning.

[maskininlärning]

supervised learning ⇢

– se övervakad inlärning.

[maskininlärning]

övervakad inlärning

(supervised learning) – om maskininlärning: träning av program genom att det får behandla en uppsättning med källdata och relaterade måldata. – I övervakad inlärning får programmet så att säga veta facit (antingen i förväg eller under inlärningens gång): dess uppgift är att hitta regler som bestämmer hur man kommer fram till rätt svar (måldata). – Enkelt exempel: Programmet får se bilder på katter och hundar (källdata), och det får också veta vilka bilder som föreställer katter respektive hundar. Uppgiften är att hitta regler för hur man med bildigenkänning skiljer på de två husdjuren. – Jämför med oövervakad inlärning och djupinlärning. (Även: övervakad maskininlärning.)

[maskininlärning] [ändrad 28 september 2021]

oövervakad inlärning

(unsupervised learning) – om maskininlärning: system där programmets uppgift är att hitta mönster och avvikelser i en datamängd utan att ha fått instruktioner om vad som är rätt eller fel. Programmet ska hitta strukturer i datamängden och dessa ska sedan kunna användas för olika ändamål som analys, kategorisering eller för att upptäcka misstänkta brott. – Se också djup maskininlärning och jämför med övervakad inlärning. (Även: oövervakad maskininlärning, icke övervakad inlärning, icke övervakad maskininlärning.)

[maskininlärning] [ändrad 11 juni 2020]

datamängd

(data set eller dataset) – en samling data som behandlas tillsammans för ett bestämt ändamål av ett datorprogram. I praktiken kan detta vara:

– en eller flera tabeller i databaser; datamängd kan då ses som synonym till databas;
– när det gäller NoSQL‑databaser och ostrukturerade data kan datamängd stå för vilka data som helst, till exempel ett eller flera textdokument: det viktiga är att dessa data behandlas tillsammans för ett bestämt ändamål, till exempel indexering av text för en sökmotor;
– i den terminologi som användes av IBM på stordatorernas tid var en datamängd en samling data som hade formaterats på ett bestämt sätt för att kunna behandlas;
– i statistik: en ordnad samling data (datapunkter) om en bestämd företeelse;
– i artificiell intelligens: en samling data som används för att träna program för maskininlärning och som har bedömts vara representativ för det som ska läras in;
– data set är också en ålderdomlig engelsk term för modem.

[ai] [data] [datakommunikation] [statistik] [ändrad 11 juni 2020]

MediaPipe

ett ramverk för utveckling av program som analyserar och bearbetar video, ljud och andra strömmar av data med användning av maskininlärning. MediaPipe kan bland annat användas för ansiktsigenkänning, igenkänning av teckenspråk och hårfriläggning. MediaPipe har utvecklats av Google och presenterades 2019. – Se Google Researchs blogg, Google om igenkänning av dövas teckenspråk och GitHub – länk.

[programmering] [maskininlärning] [tillgängligt] [ändrad 17 september 2019]

labeling farm

etiketteringsfarm, etiketteringsfabrik – arbetsplats där människor sätter beskrivande etiketter på sådant som visas på bildskärmar. Det kan till exempel vara för system för självkörande bilar: etiketterna har då text som ”vägmärke”, ”bil”, ”cyklist”… Sådana etiketter och etiketteringsfabrikerna som lägger in dem är viktiga komponenter i vissa system för artificiell intelligens och maskininlärning. Människor är nämligen fortfarande bättre på etikettering än datorprogram (se human intelligence task). Labeling farms bemannas oftast av lågavlönad personal i fattiga länder. – Stavas också labelling farm.

[arbetsliv] [artificiell intelligens] [9 maj 2019]