typvärde

det vanligaste värdet i ett statistiskt material. Skiljer sig ofta både från medelvärdet och medianen. – Påhittat exempel: Svenska kvinnor föder i genomsnitt 1,3 barn, medianen är ett barn, men typvärdet är två barn. Typvärdet är särskilt användbart när man analyserar sådant som inte kan anges i siffror, som könstillhörighet eller djurarter. – På engelska: mode.

[statistik] [ändrad 11 september 2019]

Zipfs lag

Diagram över antal förekomster av de vanligaste orden i engelska. Den snabbt fallande kurvan som senare planar ut illustrerar Zipfs lag.

säger att frekvensen av ett värde i en stor mängd data ofta står i proportion till värdets plats i rang­ordningen. – Det vanligaste värdet brukar vara ungefär dubbelt så vanligt som det näst vanligaste, ungefär tre gånger så vanligt som det värde som är nummer tre på listan, och så vidare. – Lagen är uppkallad efter språkvetaren George Kingsley Zipf (1902—1950, se Wikipedia), som upptäckte att den gäller för ordfrekvenser i stora textmassor. – Exempel: i modern engelska är the det vanligaste ordet, 6,9 procent av alla ord. Näst vanligast är of med 3,6 procent och tredje vanligast är and med 2,8 procent. Som synes följer för­del­ningen inte Zipfs lag exakt, men det påstod Zipf inte heller att den skulle göra. Hans lag beskriver en tendens. – Lagen kallas också för Zipf‑Mandel­brots lag efter Benoit Mandelbrot, som utvidgade prin­cipens tillämpning. Samma för­hål­lande mellan plats i rankinglistan och frekvens av före­komster har nämligen iakt­tagits för andra före­te­elser. Man har också upptäckt att förhållandet inte alltid är rakt (alltså inte följer mönstret 1/1, 1/2, 1/3…), utan att nämnaren ofta måste multi­pli­ce­ras med en konstant för att lagen ska gälla. Alltså till exempel 1/4, 1/8, 1/12… – Zipfs lag är en potenslag (power law). – Lagen har också tillämpats på analys av sociala nätverk. Enkelt uttryckt: de kontakter som vi har minst kontakt med är praktiskt taget värde­lösa. – Se också drakkung, långa svansen, svart svan och Pareto­prin­cipen.

[lagar] [statistik] [ändrad 25 februari 2018]

diskret

(discrete) – i teknik: med urskiljbara delar; inte kon­ti­nu­er­lig eller integrerad; dis­kreta kom­po­nent­er – kom­po­nent­er som kan sär­skiljas, alltså som inte är samman­häng­ande eller inte­gre­ra­de; diskreta värden – tydligt åt­skilda värden utan mellan­värden, till exempel av/på, ett/noll – se också digital. – Svenska diskret i betydelsen för­tegen, lågmäld mot­svaras av discreet på engelska. – Se också dis­cretion­ary och unobtrusive scripting. – Kommer av latinska dis­cernere som betyder ur­skilja, att visa ur­skill­ning eller gott omdöme

[elektronik] [matematik och logik] [språktips] [ändrad 29 november 2018]

MD5

Message digest algorithm, version 5 – en vanlig algoritm för beräkning av kondensat (hash) av meddelanden. – Kon­den­sat används för att mottagaren av ett meddel­ande ska kunna kontroll­era att meddelan­det inte har ändrats på vägen (meddelandeautentisering). MD5 används alltså i elek­tron­iska signa­turer. MD5 behandlar texten i meddel­andet som siffror, och utför en matema­tisk beräk­ning som alltid produce­rar ett tal på 128 bit (ettor och nollor). Detta tal bifogas meddelan­det. Mottag­aren kan göra om beräkningen med MD5 och jämföra resul­tatet med det bifog­ade konden­satet (de 128 bitarna). Om resultatet är exakt samma har meddel­andet inte ändrats (men se kollision). – MD5 är en offici­ell standard på internet, se RFC 1321 (länk). – Sedan MD5 utvecklades 1991 av Ronald Rivest har brister i algoritmen upptäckts – se artikel i Wikipedia. MD5 används dock fortfarande (2019). MD5 anses säkert för upptäckt av ändringar som beror på tekniska fel, men det anses inte längre säkert mot avsiktlig manipulation.

[förkortningar på M] [kryptering] [matematik] [ändrad 30 oktober 2019]

Littlewoods lag

”I genomsnitt ungefär en gång i månaden råkar varje människa ut för en händelse som är så osanno­lik att den fram­står som ett mirakel.” – Matematikern John Little­wood (1885—1977, se Wikipedia) vid Cambridge‑universitetet räknade ut detta med statistiska metoder. Han defi­ni­e­rade ett mirakel som något som in­träffar med en sanno­lik­het av en på miljonen eller mindre. – Mer i Wikipedia.

[lagar] [sannolikhet] [ändrad 13 november 2017]