logistisk regression

en typ av sannolikhetsberäkning som ger svar på ifall det finns ett statistiskt samband mellan en variabel och en eller flera andra variabler. Den ena är responsvariabeln, som alltid är ja eller nej – det finns ett statistiskt samband eller det finns inget statistiskt samband. (På engelska: indicator variable.) De andra är förklarande variabler, som kan ha vilka positiva värden som helst. (På engelska: independent variables eller predictors.) – Exempel: finns det ett statistiskt samband mellan lungcancer och rökning? Responsvariabeln är, som alltid, ja eller nej. Förklarande variabler kan vara data om rökare och icke-rökare: till exempel ålder, kön, hur länge har personen rökt, hur mycket har personen rökt; har personen diagnosticerats med lungcancer. – På engelska: logistic regression. – Språkligt: Logistisk regression har inget att göra med logistik i betydelsen transporter och lagring: logistik är här ett ålderdomligt ord för matematiska beräkningar. – Mer i Wikipedia.

[sannolikhet] [statistik] [17 juni 2019]

spelarens felslut

missbedömningen att en slumpmässig händelse som har hänt ovanligt sällan senaste tiden därför kommer att hända desto oftare i framtiden. Eller omvänt: att en slumpmässig händelse som har hänt ovanligt ofta senaste tiden kommer att inträffa mer sällan. Exempel: ”Nu har det inte blivit en sexa på tio tärningskast, så nu måste det bli en sexa snart.” I verkligheten är det ju så att sannolikheten för att ett tärningskast ger en sexa är en på sex vid varje kast. Det spelar ingen roll hur många, eller få, sexor det har slagits tidigare. (Sannolikheten för att få minst en sexa på tio tärningskast är ≈0,84.) – På engelska: the gambler’s fallacy.

[fel] [sannolikhet] [19 april 2018]

berusade sjömannen

den berusade sjömannens slumpvandring – the drunken sailor’s random walk – ett matematiskt problem som gäller slumpvandring. Den berusade sjömannen kommer ut från en krog i en stad där gatorna utgör ett rätvinkligt rutnät med begränsad och känd utsträckning. Sjömannen vill komma ut ur staden, men han är så full att han bara irrar omkring. I varje gatukorsning kan han gå rakt fram, till höger, till vänster eller tillbaka med samma sannolikhet. Utgångspunktens (krogens) position är känd. Hur hög är då sannolikheten för att sjömannen till sist hittar ut ur staden?

[sannolikhet] [ändrad 1 maj 2018]

Monte Carlo-metoden

(Monte Carlo method) – metod för att möjliggöra matematiska beräkningar baserade på stora datamängder genom att utgå från ett slumpmässigt urval ur datamängderna. Det är alltså en stokastisk metod för sampling. – Monte Carlo-metoden utvecklades på 1940‑talet för att ge användbara lösningar på matematiska problem som är för omfattande för att lösas med vanliga matematiska beräkningar. Den är uppkallad efter kasinot i Monte Carlo. I själva verket finns det flera Monte Carlo-metoder, men grundtanken är samma. – Skillnaden mellan Monte Carlo-metoden och slumpvandring är att slumpvandring genererar värden slumpmässigt; kör man metoden tillräckligt länge får värdena en statistiskt förutsägbar fördelning. Monte Carlo-metoden använder slumpmässiga metoder för att välja värden ur en stor datamängd. Om värdena i den stora datamängden är ojämnt fördelade kommer Monte Carlo-metoden, rätt tillämpad, att välja ut en delmängd med data som är ojämnt fördelade på samma sätt.

[sannolikhet] [21 februari 2018]

slumpvandring

(random walk) – en matematisk process där något rör sig slumpmässigt i en eller flera dimensioner. Rörelsen kan vara ett eller flera steg. – Slumpvandring används för att simulera eller beskriva många slags processer som ter sig slumpmässiga, från aktiekurser till molekylers rörelse. Det används också i datorvetenskap. – Den enklaste slumpvandringen är en vandring längs en rät linje: varje steg kan vara framåt (+1) eller bakåt (–1), och vilket det blir avgörs varje gång genom slantsingling. På lång sikt bör medelvärdet av positionerna bli noll. I två dimensioner kan man tänka sig en vandring i ett rätvinkligt gatunät som det på Manhattan: i varje gatukorsning väljer man höger, vänster, rakt fram eller tillbaka. För att man ska kunna tala om slumpvandring ska alla alternativen vara lika sannolika. Principen kan utvidgas till flera dimensioner, och man kan också ha ett slumpmässigt val mellan olika antal steg. Slumpvandring kallas ibland på engelska för drunken walk efter det matematiska problemet den berusade sjömannen. – Slumpvandring är en stokastisk process. – Läs också om Monte Carlo-metoden.

[sannolikhet] [21 februari 2018]

p-hacking

ett slags fusk med statistik. När man ska redovisa en undersökning sorterar man bort tillräckligt många oönskade resultat för att utfallet ska bli det man önskar. p står för probability, sannolikhet; se också hack.

[sannolikhet] [20 december 2017]