vision decoding

synavkodning – återskapande av det som en person ser genom avkodning av hjärnans elektriska signaler. – Synavkodning görs med maskininlärning: ett program för maskininlärning avläser impulserna i en försökspersons hjärna (med elektroder utanpå huvudet eller på annat sätt) samtidigt som försökspersonen får se bilder som programmet också ”ser”. Efter ett stort antal visningar lär sig systemet att återskapa bilderna enbart utifrån de elektriska impulserna i försökspersonens hjärna. De återskapade bilderna blir (när detta skrivs) inte perfekta, men rätt lika de bilder som visats för försökspersonen. – Se denna artikel från 2022: arxiv.org/pdf….

[experimentell teknik] [maskininlärning] [medicinsk teknik] [27 mars 2023]

weird hands quirk

flerfingerfelet, konstighandfenomenetbildgeneratorers tendens att rita konstiga händer, ofta med för många fingrar. – Detta anses bero på att underlaget för bildgeneratorer är mängder av bilder – foton och målningar – på människor. Ansikten brukar vara väl synliga på bilder av människor, och blir därför realistiskt ritade av bildgeneratorer, men händer är ofta helt eller delvis skymda. Och en bildgenerator ”vet” inte att människor har fem fingrar. Den kan däremot ha räknat ut att fingrar brukar vara intill varandra, och därför inte se några hinder för att lägga till extra fingrar på bilderna. Även andra delar av händerna kan bli konstiga. – Konstiga händer har blivit ett känt tecken på att en bild är framställd av en bildgenerator. (Quirk = egenhet.)

[fel] [maskininlärning] [24 mars 2023]

prompt engineering

promptkonstruktion – konsten att utforma effektiva promptar till generativa AI‑system. – Med promptar menas här de frågor eller beställningar som användaren ger till en text- eller bildgenerator. Till exempel: ”Skriv 6 000 tecken om pingvinernas fortplantning”,”Rita en bil med sju hjul”, ”Hur beräknar man jordens omkrets?”. Konsten är att utforma promptarna så att man får korrekta och användbara resultat utan brus. (En enklare form av samma konst är tillämpbar på vanliga sökmotorer.) När generativ AI används i skarp drift är promptkonstruktion något som höjer produktiviteten. – Microsoft har arbetat med promptkonstruktion sedan början av 2020‑talet – se microsoft.github.io….

[generativ AI] [24 mars 2023]

Kosmos-1

ett språksystem som kan känna igen, beskriva och bearbeta innehållet i bilder. – Kosmos‑1 kan enligt uppgift ge förklaringar till sådant som visas på bilder (”varför gråter pojken?”), lösa matematiska uppgifter som visas på foton, klara bildbaserade IQ‑test, beskriva frisyrer och läsa av klockor och mätinstrument från bilder. Kosmos‑1 har utvecklats av Microsoft och visades upp i mars 2023. Det är en så kallad stor språkmodell. – Se artikel i Ars Technica och denna vetenskapliga artikel: arxiv.org/abs…. – IDG:s artiklar om Kosmos‑1: länk.

[generativ ai] [generativt språk] [5 mars 2023]

AI-sökning

(AI search) – användning av textgeneratorer som ChatGPT i sökmotorer. – Med AI‑sökning får användaren ett berättande svar på sin sökning, formulerat av textgeneratorn. Detta till skillnad från vanliga sökmotorer, som presenterar en lista med webbsidor som innehåller det ord, eller den fras, som användaren har sökt på. Användaren får sedan själv söka igenom listan efter den information hen söker. AI‑sökning sätter däremot samman svar på sökningen genom att söka igenom enorma textmängder på internet efter passande information. Lämpliga bitar sätts sedan ihop till en ny test. I många fall verkar texten vara skriven av en människa. – När AI‑sökning började användas i början av 2023 blev det uppenbart att tekniken har samma problem som textgeneratorer i allmänhet: det finns ingen kritisk utvärdering av de webbsidor som används som underlag. Direkta sakfel, avsiktlig desinformation, näthat, rasism, kvinnohat och andra fördomar kommer med i sökresultaten. – AI‑sökning används bland annat i Microsofts sökmotor Bing.

[generativ AI] [sökmotorer] [20 februari 2023]

diffusion

i bildbehandling: ett sätt att komprimera bilder så att de kan användas i generativ konst. – De komprimerade bilderna ser ut som punktmoln. Forskare har upptäckt att två eller flera bilder som har komprimerats med diffusion kan slås ihop, så att det vid dekomprimering uppstår en ny bild. Den nya bilden har inslag från de ursprungliga bilderna. (Det blir inte alltid godtagbart.) En ingående beskrivning av diffusion finns på stablediffusionlitigation.com. – Ordet diffusion, som finns på svenska, men som kan översättas med utspridning, är besläktat med diffus.

[bildbehandling] [generativ AI] [ändrad 27 februari 2023]

bildgenerator

program som kan framställa bilder utifrån skrivna instruktioner. – Man kan till exempel få programmet att rita ”en dansande ko med hög hatt”. Bilderna kan se ut som teckningar, målningar eller fotografier. Underlaget brukar vara ett stort antal bilder som samlats in från internet (se skövling) och försetts med beskrivningar. Bildgeneratorer är en tillämpning av artificiell intelligens. Man talar också om generativ konst. Ett känt exempel är DALL‑E. – På engelska: image generator eller image synthesizer.

[generativ AI] [bildbehandling] [ändrad 27 februari 2023]

generativ

om texter och bilder – framställd enbart med användning av artificiell intelligens. – Ett system för maskininlärning tränas först på ett stort antal exempel på text eller bilder, vanligtvis hämtade från internet. Det kan sedan på begäran generera texter om angivna ämnen eller rita bilder som kan verka vara gjorda av människor. Några exempel är DALL‑E och ChatGPT. – På engelska: generative.

[generativ AI] [17 januari 2023]