matematik och logik-arkiv - Sida 47 av 49

bayesisk

(Bayesian) – bayesisk statistik eller bayesisk inferens – en matematisk metod för beräkning av sannolikheten för att bedömningar är riktiga, baserat på kunskap om tidigare händelser av samma slag. – Annorlunda uttryckt: en metod för att ”vända på” sannolikheter som man redan känner till. Till exempel: det är sannolikt att det snöar i januari – men: om det snöar, hur sannolikt är det då att det är januari? Konstruerat exempel: du vet redan att 50 procent av all spam innehåller ordet V––gra (hädanefter i denna text utbytt mot ”margarin”). Men om du får ett mejl som innehåller ordet margarin, hur sannolikt är det då att det mejlet är spam? Ordet margarin står ju inte bara i spam. Det är sådana problem man kan angripa med bayesisk inferens. Metoden ger användbara, om än grova, resultat även när underlaget är litet.

– Den matematiska formeln för Bayes sats ser ut så här:

P (A|B) = P (B|A) × P (A) / P (B)

vilket kan utläsas:

sannolikheten för A, givet B, är lika med sannolikheten för B, givet A, multiplicerad med sannolikheten för A, dividerad med sannolikheten för B.

– P står för ”sannolikheten för” och lodstrecket | kan utläsas ”givet att”;
– A står för en bedömning som man vill ha prövad, till exempel ”jag tror att detta mejl är spam”, medan:
– B står för ett känt faktum som man baserar bedömningen på, till exempel ”detta mejl innehåller ordet margarin”.

– Bayesisk analys förutsätter att man har ett statistiskt underlag. I det här exemplet krävs det att man redan tidigare har klassat mejl i spam och icke‑spam. Man förutsätter att tidigare observationer gäller även nu. Man har då siffror på:

– sannolikheten för att ett slumpmässigt valt mejl är spam, P (A), och:
– sannolikheten för att ett slumpmässigt valt mejl innehåller ordet margarin, alltså P (B).

– Man måste också ha räknat ut sannolikheten för att ett slumpmässigt valt mejl som har klassats som spam innehåller ordet margarin, alltså P (B|A). Sannolikhetsbedömningen som du vill ha – hur sannolikt (P) är det att detta mejl är spam (A) med tanke på att det innehåller ordet margarin (B) – uttrycks alltså P (A|B).
– Exempel med godtyckliga siffror: 40 procent av all e‑post du får är spam, 60 procent är icke‑spam. 50 procent av all spam innehåller ordet margarin, men bara två procent av icke-spammet. Då blir det så här:

	… innehåller ordet margarin	… inte innehåller ordet margarin	Sammanlagt (av alla mejl)
*Andel av all icke-spam som…*	2%	98%	60% (är icke-spam)
*Andel av all spam* som…**	50% P(B\|A)	50%	40% (är spam)
*Andel av alla* mejl som…**	21,2% P(B)	78,8%	100% (icke-spam plus spam)
Sannolikhet för att ett mejl…
… är spam om det…	… innehåller ordet margarin	… inte innehåller ordet margarin
	94,3% P(A\|B)	25,4%	(40%)
… inte är spam om det…	5,7%	74,6%	(60%
Summa (av de två ovanstående sannolikheterna)	100	100	100

– Sammanlagt innehåller alltså 21,2 procent av all mejl ordet margarin. Men det svarar inte på frågan hur sannolikt det är att ett mejl är spam om det innehåller ordet margarin. Vad du kan se är att av 21,2 procent som innehåller det ordet är 20 procentenheter spam, 1,2 procentenheter är icke‑spam. Oddset för att ett mejl som innehåller ordet margarin är spam är alltså 21,2:1,2, vilket motsvarar en sannolikhet på ungefär 94,3 procent. Omvänt: om ett mejl inte innehåller ordet margarin är det 74,6 procents sannolikhet för att det inte är spam. – Den bayesiska bedömningen är en statistisk bedömning baserad på tidigare resultat. Det fungerar bara om en mänsklig bedömare med gott omdöme redan har delat upp tidigare mejl i spam och icke‑spam, så att det finns ett underlag för bayesisk analys av tillkommande mejl. Ett riktigt spamfilter utgår dessutom inte från ett enstaka ord, utan sammanväger många ord. – Bayes metod ger grovt användbara resultat även med ett begränsat underlag, och förbättras när man använder den upprepade gånger med växande underlag. Metoden används i spamfilter, i taligenkänning och i datoriserad översättning. – Bayesisk logik är uppkallad efter den engelske prästen Thomas Bayes (1702—1761), som beskrev den i sin postumt publicerade artikel Essay towards solving a problem in the doctrine of chances från 1763 ~~(länk)~~ (arkiverad). Observera att det heter bayesisk, inte ~~bayesiansk~~ – det finns inget som heter ~~bayesianism~~. – Se också Wikipedia (länk). – Läs också om evidensteori.

[sannolikhet] [ändrad 5 augusti 2021]

finita elementmetoden

(finite element method, förkortat FEM) – metod att lösa beräkningsproblem genom att dela upp dem i småbitar som löses var för sig. När delresultaten sammanställs får man en lösning som vanligtvis ligger mycket nära det exakta svaret. Metoden används mycket i konstruktionsarbete. – Ett välkänt exempel på finita elementmetoden är när man beräknar värdet på pi genom att rita om cirkeln som en månghörning bestående av ett stort antal trianglar (som tårtbitar) och beräkna omkretsen, som sedan divideras med diametern. Ju fler trianglar man delar upp cirkeln i, desto närmare kommer man det exakta värdet på pi.

[matematik] [ändrad 5 augusti 2018]

svart svan

– (black swan) – osannolik händelse som, om den inträffar, får omfattande konsekvenser. En ”svart svan” är extremt osannolik enligt en potenslag. Men den kan inträffa och kan då få katastrofala följder – eller lyckosamma följder. – Benämningen svart svan i denna betydelse kommer från boken The black swan från 2007 av Nassim Nicholas Taleb. – Se också grå svan, drakkung, grå noshörning, independently and identically distributed, den långa svansen, Paretoprincipen, svart elefant och Zipfs lag;
– benämning på ett logiskt felslut: eftersom man bara har sett vita svanar drar man slutsatsen att svarta svanar inte finns. (De finns, men är sällsynta – se denna länk.)

[riskbedömning] [sannolikhet] [ändrad 4 september 2022]

Gauss

– en trojansk häst som uppsnappar lösenord och information om bankkonton. Upptäcktes i augusti 2012. Den anses vara utvecklad för cyberkrigföring, liksom Duqu, Flame och Stuxnet. – Läs mer här;
– ett programspråk för matematik och statistik – se aptech.com;
– Gaussian curve, se normalfördelningskurva;
– se gaussiskt filter;
– se gaussisk oskärpa.

– Ordet: Efter Carl Friedrich Gauss (1777—1855, se Wikipedia), av många ansedd som historiens främsta matematiker.

[bildbehandling] [programspråk] [skadeprogram] [statistik] [ändrad 1 juni 2019]

normalfördelningskurva

en kurva som beskriver den fördelning av värden som i statistisk teori anses mest sannolik. – Kurvan har formen av en kulle eller en kyrkklocka och kallas därför på engelska för bell curve. De värden som ligger runt medelvärdet är vanligast, och antalet större och mindre värden är ungefär samma på båda sidor om mitten – kurvan är symmetrisk. – Exempel: De flesta vuxna personer är runt medellängd, medan det finns få som är ovanligt långa eller ovanligt korta. En kurva över den vuxna befolkningens kroppslängd med kroppslängd på den liggande axeln och antal personer på den stående axeln skulle likna en normalfördelningskurva. Kullen eller bulan i mitten representerar de medellånga. ”Svansarna” längst till vänster och höger representerar antalet mycket korta respektive mycket långa. Det finns inga vuxna som är tre meter, så om man lägger till slumpmässigt utvalda personer till underlaget för kurvan förändras den inte mycket. – Från början var kurvan en rent matematisk konstruktion, uttänkt av matematikern Carl Friedrich Gauss. Den visar sannolikheten för olika utfall i teoretiska experiment, som när man till exempel singlar slant många gånger. (Ju fler gånger man gör det, desto mer sannolikt att det blir ≈50 procent krona och ≈50 procent klave.) Det var först senare som normalfördelningskurvan fick användning i tillämpad statistik. – I boken Den svarta svanen (2012, The black swan, 2007) kritiserade Nassim Nicholas Taleb användningen av normalfördelningskurvan i analys och prognoser. Han påpekar att den inte speglar sådant som fördelningen av pengar. – Se också independently and identically distributed och ludiskt felslut. – På engelska: normal distribution curve, bell curve eller gaussian curve; ofta bara Gaussian.

[statistik] [ändrad 12 april 2020]

implikation

logiskt villkor som brukar utläsas ”om–så”: om påståendet A är sant så måste påståendet B också vara sant. – Men om påståendet A är falskt kan påståendet B vara antingen sant eller falskt – det spelar ingen roll i formell logik. – Implikation skrivs i formell logik med en pil: A→B, vilket utläses ”om A så B”. Tecknen ⇒ och ⊃ förekommer också. Kallas i programmering också för IF THEN, och kallas mer precist för materiell implikation (se här nedanför).

– Observera att implikationer inte används likadant som vardagsspråkets om—så. Om jag säger ”om det regnar så tar jag med mig paraply” kan man anta att om det inte regnar så tar jag inte med paraplyet. (Om jag tar med mig paraply vare sig det regnar eller inte finns det ingen anledning att säga något om saken.) Men i formell logik och i programmering säger satsen inget om vad som är fallet ifall det inte regnar. Om det inte regnar så tar jag kanske med mig paraplyet ändå – eller kanske inte. Eller: ”om du kommer så bjuder jag dig på kaffe” – om du inte kommer så kan jag ju inte bjuda dig på kaffe, men den insikten går utanför den formella logiken. Allt som kan sägas är att om jag inte bjuder dig på kaffe när du kommer är påståendet falskt;
– En annan skillnad är att vi i vanligt språk förväntar ett orsakssamband mellan de två påståendena, eller en avsikt. ”Om månen är gjord av ost så ligger Borås i Finland” är faktiskt sant om man ser det som en logisk implikation, men det är naturligtvis nonsens, och i varje fall ingen giltig slutsats i den verkliga världen: Borås plats i geografin har inget att göra med ifall månen är gjord av ost. – Se formell implikation här nedanför;
– Man kan invända att ifall påståendet A är falskt så säger uttrycket A→B inget om ifall B är sant eller falskt. Men i formell logik är ett påstående sant eller falskt, utan mellanlägen eller okänt sanningsvärde. I sanningsvärdestabellen här nedanför skulle det kanske därför vara rimligt att skriva ”okänt” i de två nedersta rutorna i kolumnen A→B.

– En materiell implikation är vad som beskrivs här ovanför. En materiell implikation handlar om två påståenden som det inte behöver finnas något logiskt eller annat samband mellan. Man vet bara att om det första påståendet är sant så är det andra påståendet också sant, oavsett vad detta beror på. Och om det första påståendet är falskt kan det andra påståendet vara sant eller falskt. Som Borås och månen av ost i exemplet här ovanför.

– I en formell implikation finns det ett logiskt eller kausalt samband mellan de två påståendena. Om det snöar så är det vinter.

– En sanningsvärdetabell för implikation ser ut så här:

– Om påståendet A är sant så är också påståendet B sant (A→B) :

A	B	A→B
sant	sant	sant
sant	falskt	falskt
falskt	sant	sant (okänt?)
falskt	falskt	sant (okänt?)

[logik] [ändrad 2 maj 2022]

hexadecimal

sätt att skriva tal med 16 olika tecken i stället för 10. Talen 10—15 anges med bokstäverna A—F, siffrorna 0—9 har sina vanliga värden. – Hexadecimala tal används vid programmering i stället för binära tal för att spara plats, eftersom det är lätt att räkna om från binär till hexadecimal och omvänt. En grupp på upp till fyra binära siffror (ettor och nollor) kan nämligen ersättas med ett enda hexadecimalt tecken. Tio, som binärt blir ”1010”, blir ”A” i hexadecimal notation. Sexton, som binärt blir ”10000”, blir ”10”. Trettioett blir ”11111” med binär notation och ”1F” i hexadecimal notation. Kod skriven med hexadecimal notation kallas för hexkod. Notationen kallas också för Base 16, Base-16 eller base16, se RFC nummer 4648 (länk). – Ordet: Sammansatt av grekiska hex för sex och decimal, av latinska deci för tio. – Jämför med oktal, Base 32 och Base 64.

[matematik] [programmering] [rfc] [ändrad 25 februari 2018]

Nashjämvikt

(Nash equilibrium) – i spelteori: en kombination av konkurrerande parters strategier (i affärer, spel, krig, kärlek eller annat) där ingen av de konkurrerande vinner på att ensam byta strategi. (Två eller flera deltagare kan däremot i vissa fall vinna på att samtidigt byta strategi, men det förutsätter att de samarbetar.) – Ett enkelt exempel på Nashjämvikt är höger- och vänstertrafik: alla vinner på att alla kör på samma sida, men det spelar ingen roll vilken sida det är. Ingen vinner på att köra på fel sida. – En Nashjämvikt ger oftast inte det bästa tänkbara utfallet för varje enskild inblandad, men det blir det bästa med tanke på vad de andra kan ta sig till. Enligt teorin finns det alltid en Nashjämvikt i varje scenario av konkurrentstrategier. – Uppkallat efter matematikern John Nash (1928–2015), mottagare av Sveriges riksbanks pris i ekonomisk vetenskap till Alfred Nobels minne 1994 (länk), huvudperson i filmen A Beautiful Mind från 2001 (se IMDb, länk). – Läs också om Schellingpunkter.

[matematik och logik] [personer] [spelfilmer] [spelteori] [ändrad 2 februari 2023]

allmänningens tragedi

(tragedy of the commons) – antagandet att gemensamma resurser som är gratis kommer att utarmas. – Ingen enskild användare tjänar nämligen på att hålla igen på sin egen användning. Kallas också för det fria tillträdets tragedi. Det är ett scenario som används i ekonomisk teori för att belysa riskerna med avgiftsfria gemensamma resurser, inklusive användning av internet. – Allmänningen, the commons, var i England byns betesmark som alla bybor ägde gemensamt. Alla fick släppa sina får på allmänningen. Det fanns alltid plats för ett får till, men till sist blev det för många får, så allmänningen blev avbetad och värdelös. Även om några bybor insåg riskerna så vann de inget på att hålla sina egna får borta från allmänningen för att minska avbetningen. Då skulle de avstå bete åt någon annan utan att få något i gengäld. Det krävs alltså att alla bybor kommer överens om att hushålla med betet på allmänningen. – Den amerikanska forskaren Elinor Ostrom (1933—2012, se Wikipedia) visade i sin bok Governing the commons (1990; Allmänningen som samhällsinstitution, 2009) att det finns sätt att lösa problemet. Elinor Ostrom belönades 2009 med Sveriges Riksbanks pris i ekonomisk vetenskap till Alfred Nobels minne (länk). – Resonemanget om allmänningens tragedi används ibland för att motivera porto på e‑post och som argument mot nätneutralitet. Det påminner om middagsätarens dilemma i spelteorin. – Motteorier är bland annat comedy of the commons, Metcalfes lag och tragedy of the anticommons.

[ekonomi] [gratis] [spelteori] [ändrad 20 augusti 2018]

Ernie

– en dialogrobot från kinesiska Baidu. – Ernie, eller ERNIEbot (på kinesiska Wenxin Yiyan), presenterades i mars 2023. Ernie bygger på en stor språkmodell och kan ”samtala” på engelska och kinesiska. – Denna Ernie är i själva verket den fjärde versionen av Ernie: den första kom 2019. – Se research.baidu.com…;
– Electronic random number indicating equipment – en slumptalsgenerator som genererar vinnande nummer för brittiska premieobligationer. (Se slumptal.) – Ernie har använts sedan 1957, och är nu inne på femte generationen. Ernie tar fram slumptal genom att mäta variationerna i fysiska processer (alltså inte med enbart matematiska beräkningar, se pseudoslumptal). Den första Ernie konstruerades av bland andra Tom Flowers†. – Läs mer på National Savings & Investments webbsidor.

[elektronik] [generativ AI] [generativt språk] [sannolikhet] [ändrad 27 mars 2023]