bayesisk

(Bayesian)bayesisk statistik eller bayesisk in­ferens – en mate­ma­tisk metod för beräkning av sannolikheten för att bedömningar är riktiga, baserat på kunskap om tidigare händelser av samma slag. – Annorlunda ut­tryckt: en metod för att ”vända på” sannolikheter som man redan känner till. Till exempel: det är sannolikt att det snöar i januari – men: om det snöar, hur sannolikt är det då att det är januari? Konstruerat exempel: du vet redan att 50 procent av all spam innehåller ordet V––gra (hädanefter i denna text utbytt mot ”margarin”). Men om du får ett mejl som innehåller ordet margarin, hur sannolikt är det då att det mejlet är spam? Ordet margarin står ju inte bara i spam. Det är sådana pro­blem man kan angripa med bayesisk inferens. Metoden ger använd­­bara, om än grova, resultat även när underlaget är litet.

– Den mate­ma­tiska formeln för Bayes sats ser ut så här:

P (A|B) = P (B|A) × P (A) / P (B)

vilket kan ut­läsas:

sannolikheten för A, givet B, är lika med sannolikheten för B, givet A, multiplicerad med sannolikheten för A, divi­de­rad med sannolikheten för B.

  • – P står för ”sannolikheten för” och lodstrecket | kan utläsas ”givet att”;
  • – A står för en bedömning som man vill ha prövad, till exempel ”jag tror att detta mejl är spam”, medan:
  • – B står för ett känt faktum som man baserar bedöm­ningen på, till exempel ”detta mejl innehåller ordet margarin”.

– Bayesisk analys förutsätter att man har ett sta­tis­tiskt underlag. I det här exemplet krävs det att man redan tidigare har klassat mejl i spam och icke‑spam. Man förut­sätter att tidigare ob­serva­tioner gäller även nu. Man har då siffror på:

  • – sannolikheten för att ett slump­­mässigt valt mejl är spam, P (A), och:
  • – sannolikheten för att ett slumpmässigt valt mejl innehåller ordet margarin, alltså P (B).

– Man måste också ha räknat ut sannolikheten för att ett slumpmässigt valt mejl som har klassats som spam inne­­håller ordet margarin, alltså P (B|A). Sannolikhetsbedöm­ningen som du vill ha – hur sannolikt (P) är det att detta mejl är spam (A) med tanke på att det innehåller ordet margarin (B) – uttrycks alltså P (A|B).
– Exempel med godtyck­liga siffror: 40 procent av all e‑post du får är spam, 60 procent är icke‑spam. 50 procent av all spam inne­håller ordet margarin, men bara två pro­cent av icke-spam­met. Då blir det så här:

  … innehåller ordet margarin inte innehåller ordet margarin Sammanlagt (av alla mejl)
Andel av all icke-spam som… 2% 98% 60% (är icke-spam)
Andel av all spam som… 50% P(B|A) 50% 40% (är spam)
Andel av alla mejl som… 21,2% P(B) 78,8% 100% (icke-spam plus spam)
Sannolikhet för att ett mejl…      
är spam om det… … innehåller ordet margarin inte innehåller ordet margarin  
  94,3% P(A|B) 25,4% (40%)
inte är spam om det… 5,7% 74,6% (60%
Summa (av de två ovanstående sannolikheterna) 100 100 100

– Sammanlagt innehåller alltså 21,2 procent av all mejl ordet margarin. Men det svarar inte på frågan hur sannolikt det är att ett mejl är spam om det inne­­håller ordet margarin. Vad du kan se är att av 21,2 procent som innehåller det ordet är 20 procent­enheter spam, 1,2 procentenheter är icke‑spam. Oddset för att ett mejl som inne­­håller ordet margarin är spam är alltså 21,2:1,2, vilket motsvarar en sannolikhet på unge­fär 94,3 procent. Om­vänt: om ett mejl inte innehåller ordet margarin är det 74,6 procents sannolik­­het för att det inte är spam. – Den bayesiska bedömningen är en statistisk bedömning baserad på tidigare resultat. Det fungerar bara om en mänsklig bedömare med gott om­döme redan har delat upp tidigare mejl i spam och icke‑spam, så att det finns ett under­­lag för bayesisk analys av tillkommande mejl. Ett riktigt spamfilter utgår dess­­utom inte från ett enstaka ord, utan sammanväger många ord. – Bayes metod ger grovt användbara resultat även med ett be­­gränsat underlag, och för­­bätt­ras när man an­vänder den upprepade gånger med växande under­­lag. Metoden används i spamfilter, i taligenkänning och i datoriserad översättning. – Bayesisk logik är uppkallad efter den engelske prästen Thomas Bayes (1702—1761), som beskrev den i sin postumt publicerade artikel Essay towards solving a problem in the doctrine of chances från 1763 (länk) (arkiverad).  Observera att det heter bayesisk, inte bayesiansk – det finns inget som heter bayesianism. – Se också Wikipedia (länk). – Läs också om evidens­­teori.

[sannolikhet] [ändrad 5 augusti 2021]

finita elementmetoden

(finite element method, förkortat FEM) – metod att lösa beräkningsproblem genom att dela upp dem i småbitar som löses var för sig. När delresultaten sammanställs får man en lösning som vanligtvis ligger mycket nära det exakta svaret. Metoden används mycket i konstruktionsarbete. – Ett välkänt exempel på finita elementmetoden är när man beräknar värdet på pi genom att rita om cirkeln som en månghörning bestående av ett stort antal trianglar (som tårtbitar) och beräkna omkretsen, som sedan divideras med diametern. Ju fler trianglar man delar upp cirkeln i, desto närmare kommer man det exakta värdet på pi.

[matematik] [ändrad 5 augusti 2018]

Gauss

  1. – en trojansk häst som upp­snappar lösen­ord och informa­tion om bankkonton. Upp­täcktes i augusti 2012. Den anses vara utvecklad för cyberkrigföring, liksom Duqu, Flame och Stuxnet. – Läs mer här;
  2. – ett programspråk för matematik och statistik – se aptech.com;
  3. – Gaussian curve, se normalfördelningskurva;
  4. – se gaussiskt filter;
  5. – se gaussisk oskärpa.

– Ordet: Efter Carl Friedrich Gauss (1777—1855, se Wikipedia), av många ansedd som historiens främsta mate­­ma­­tiker.

[bildbehandling] [programspråk] [skadeprogram] [statistik] [ändrad 1 juni 2019]

svart svan

  1. – (black swan) – osannolik händelse som, om den inträffar, får omfattande konse­kvenser. En ”svart svan” är extremt osannolik enligt en potenslag. Men den kan inträffa och kan då få katastrofala följder – eller lyckosamma följder. – Benämningen svart svan i denna betydelse kommer från boken The black swan från 2007 av Nassim Nicholas Taleb. – Se också grå svan, drakkung, grå noshörning, independently and identically distributed, den långa svansen,  Paretoprincipen­, svart elefant och Zipfs lag;
  2. – benämning på ett logiskt felslut: eftersom man bara har sett vita svanar drar man slut­satsen att svarta svanar inte finns. (De finns, men är säll­synta – se denna länk.)

[riskbedömning] [sannolikhet] [ändrad 4 september 2022]

normalfördelningskurva

en kurva som beskriver den fördelning av värden som i statistisk teori anses mest sannolik. – Kurvan har formen av en kulle eller en kyrk­klocka och kallas därför på engelska för bell curve. De värden som ligger runt medelvärdet är vanligast, och antalet större och mindre värden är ungefär samma på båda sidor om mitten – kurvan är symmetrisk. – Exempel: De flesta vuxna personer är runt medellängd, medan det finns få som är ovanligt långa eller ovanligt korta. En kurva över den vuxna befolkningens kropps­längd med kroppslängd på den liggande axeln och antal personer på den stående axeln skulle likna en normalfördelnings­kurva. Kullen eller bulan i mitten representerar de medel­långa. ”Svansarna” längst till vänster och höger representerar antalet mycket korta respektive mycket långa. Det finns inga vuxna som är tre meter, så om man lägger till slumpmässigt utvalda personer till underlaget för kurvan förändras den inte mycket. – Från början var kurvan en rent matema­tisk konstruktion, uttänkt av matematikern Carl Friedrich Gauss. Den visar sannolikheten för olika utfall i teoretiska experiment, som när man till exempel singlar slant många gånger. (Ju fler gånger man gör det, desto mer sannolikt att det blir ≈50 procent krona och ≈50 procent klave.) Det var först senare som normalfördelningskurvan fick användning i tillämpad statistik. – I boken Den svarta svanen (2012, The black swan, 2007) kritiserade Nassim Nicholas Taleb användningen av normalfördelningskurvan i analys och prognoser. Han påpekar att den inte speglar sådant som fördelningen av pengar. – Se också independently and identically distributed och ludiskt felslut. – På engelska: normal distri­bution curve, bell curve eller gaussian curve; ofta bara Gaussian.

[statistik] [ändrad 12 april 2020]

implikation

logiskt villkor som brukar utläsas ”om–så”: om påståendet A är sant så måste påståendet B också vara sant. – Men om påståendet A är falskt kan påståendet B vara antingen sant eller falskt – det spelar ingen roll i formell logik. – Implikation skrivs i formell logik med en pil: A→B, vilket utläses ”om A så B”. Tecknen ⇒ och ⊃ förekommer också. Kallas i programme­ring också för IF THEN, och kallas mer precist för materiell implikation (se här nedanför). 

  • – Ob­servera att implika­tioner inte används likadant som vardags­språkets om—så. Om jag säger om det regnar tar jag med mig paraply” kan man anta att om det inte regnar så tar jag inte med paraplyet. (Om jag tar med mig paraply vare sig det regnar eller inte finns det ingen anledning att säga något om saken.) Men i formell logik och i programmering säger satsen inget om vad som är fallet ifall det inte regnar. Om det inte regnar så tar jag kanske med mig paraplyet ändå – eller kanske inte. Eller: ”om du kommer så bjuder jag dig på kaffe” – om du inte kommer så kan jag ju inte bjuda dig på kaffe, men den insikten går utanför den formella logiken. Allt som kan sägas är att om jag inte bjuder dig på kaffe när du kommer är påståendet falskt;
  • – En annan skillnad är att vi i vanligt språk förväntar ett orsakssamband mellan de två påståendena, eller en avsikt. ”Om månen är gjord av ost så ligger Borås i Finland” är faktiskt sant om man ser det som en logisk implikation, men det är naturligtvis nonsens, och i varje fall ingen giltig slutsats i den verkliga världen: Borås plats i geografin har inget att göra med ifall månen är gjord av ost. – Se formell implikation här nedanför;
  • – Man kan invända att ifall påståendet A är falskt så säger uttrycket A→B inget om ifall B är sant eller falskt. Men i formell logik är ett påstående sant eller falskt, utan mellanlägen eller okänt sanningsvärde. I sanningsvärdestabellen här nedanför skulle det kanske därför vara rimligt att skriva ”okänt” i de två nedersta rutorna i kolumnen A→B.

– En materiell implikation är vad som beskrivs här ovanför. En materiell implikation handlar om två påståenden som det inte behöver finnas något logiskt eller annat samband mellan. Man vet bara att om det första påståendet är sant så är det andra påståendet också sant, oavsett vad detta beror på. Och om det första påståendet är falskt kan det andra påståendet vara sant eller falskt. Som Borås och månen av ost i exemplet här ovanför.

– I en formell implikation finns det ett logiskt eller kausalt samband mellan de två påståendena. Om det snöar så är det vinter.

– En sannings­värde­tabell för implika­tion ser ut så här:

  • – Om påståendet A är sant så är också påståendet B sant (A→B) :

A B A→B
sant sant sant  
sant falskt falskt
falskt sant sant (okänt?)
falskt falskt sant (okänt?)

[logik] [ändrad 2 maj 2022]

hexadecimal

sätt att skriva tal med 16 olika tecken i stället för 10. Talen 10—15 anges med bok­stäverna A—F, siffrorna 0—9 har sina vanliga värden. – Hexa­decimala tal används vid programmering i stället för binära tal för att spara plats, eftersom det är lätt att räkna om från binär till hexa­decimal och omvänt. En grupp på upp till fyra binära siffror (ettor och nollor) kan nämligen ersättas med ett enda hexadecimalt tecken. Tio, som binärt blir ”1010”, blir ”A” i hexa­decimal notation. Sexton, som binärt blir ”10000”, blir ”10”. Trettioett blir ”11111” med binär notation och ”1F” i hexadecimal notation. Kod skriven med hexa­decimal notation kallas för hexkod. Notationen kallas också för Base 16, Base-16 eller base16, se RFC nummer 4648 (länk). – Ordet: Samman­satt av grekiska hex för sex och decimal, av latinska deci för tio. – Jäm­för med oktal, Base 32 och Base 64.

[matematik] [programmering] [rfc] [ändrad 25 februari 2018]

Nashjämvikt

John Nash.

(Nash equilibrium) – i spelteori: en kombination av konkurrerande parters strategier (i affärer, spel, krig, kärlek eller annat) där ingen av de konkurrerande vinner på att ensam byta strategi. (Två eller flera deltagare kan däremot i vissa fall vinna på att samtidigt byta strategi, men det förutsätter att de samarbetar.) – Ett enkelt exempel på Nashjämvikt är höger- och vänstertrafik: alla vinner på att alla kör på samma sida, men det spelar ingen roll vilken sida det är. Ingen vinner på att köra på fel sida. – En Nashjäm­vikt ger oftast inte det bästa tänkbara utfallet för varje enskild inblandad, men det blir det bästa med tanke på vad de andra kan ta sig till. Enligt teorin finns det alltid en Nashjämvikt i varje scenario av konkurrentstrategier. – Uppkal­lat efter matematikern John Nash (19282015), mottagare av Sveriges riksbanks pris i ekonomisk vetenskap till Alfred Nobels minne 1994 (länk), huvudperson i filmen A Beautiful Mind från 2001 (se IMDb, länk). – Läs också om Schellingpunkter.

[matematik och logik] [personer] [spelfilmer] [spelteori] [ändrad 2 februari 2023]

allmänningens tragedi

(tragedy of the commons) – antagandet att gemensamma resurser som är gratis kommer att utarmas. – Ingen enskild använd­are tjänar nämligen på att hålla igen på sin egen användning. Kallas också för det fria tillträdets tragedi. Det är ett scenario som används i ekonomisk teori för att belysa riskerna med avgiftsfria gemensamma resurser, inklu­sive använd­ning av internet. – Allmänningen, the commons, var i England byns betes­mark som alla bybor ägde gemen­samt. Alla fick släppa sina får på allmänningen. Det fanns alltid plats för ett får till, men till sist blev det för många får, så allmänningen blev avbetad och värdelös. Även om några bybor insåg riskerna så vann de inget på att hålla sina egna får borta från allmänningen för att minska avbetningen. Då skulle de avstå bete åt någon annan utan att få något i gengäld. Det krävs alltså att alla bybor kommer överens om att hushålla med betet på allmänningen. – Den amerikanska forskaren Elinor Ostrom (19332012, se Wikipedia) visade i sin bok Governing the commons (1990; Allmänningen som samhällsinstitution, 2009) att det finns sätt att lösa problemet. Elinor Ostrom belönades 2009 med Sveriges Riksbanks pris i ekonomisk vetenskap till Alfred Nobels minne (länk). – Resonemanget om allmänning­ens tragedi används ibland för att motivera porto på e‑post och som argu­ment mot nätneutralitet. Det påminner om middagsätarens dilemma i spelteorin. – Motteorier är bland annat comedy of the commons, Met­calfes lag och tragedy of the anticommons.

[ekonomi] [gratis] [spelteori] [ändrad 20 augusti 2018]

Ernie

  1. – en dialogrobot från kinesiska Baidu. – Ernie, eller ERNIEbot (på kinesiska Wenxin Yiyan), presenterades i mars 2023. Ernie bygger på en stor språkmodell och kan ”samtala” på engelska och kinesiska. – Denna Ernie är i själva verket den fjärde versionen av Ernie: den första kom 2019. – Se research.baidu.com…;
  2. – Electronic random number indicating equipment – en slumptalsgenerator som genererar vinnande nummer för brittiska premieobliga­tioner. (Se slumptal.) – Ernie har använts sedan 1957, och är nu inne på femte generationen. Ernie tar fram slumptal genom att mäta variationerna i fysiska processer (alltså inte med enbart matematiska beräkningar, se pseudoslumptal). Den första Ernie konstruerades av bland andra Tom Flowers†. – Läs mer på National Savings & Investments webbsidor.

[elektronik] [generativ AI] [generativt språk] [sannolikhet] [ändrad 27 mars 2023]