normalisering

  1. – normalization – om relationsdatabaser – att se till att en relationsdatabas är väl utformad. Den ska undvika dubblering av information, vara lätt att göra ändringar i (man ska bara behöva ändra på ett ställe) och lätt att göra sökningar i (man ska kunna förutse var information finns). – Ett krav är att varje tabell ska innehålla minst en nyckel, det vill säga ett värde som entydigt identifierar varje rad (till exempel personnummer i ett personregister): i varje tabell ska det alltså finnas minst en kolumn där samma värde inte får förekomma två gånger
  2. – när det gäller statistik är normalisering att göra värden jämförbara, till exempel att se till att allt material räknas om till samma måttenheter och att tidsperioder (till exempel räkenskapsår) sammanfaller. – En form av normalisering är formatanpassning (canonicalization).

[databaser] [statistik] [ändrad 4 september 2018]

baslinje

(baseline) – allmänt: en tänkt nivå som man utgår från när man mäter eller förändrar något. Vanligtvis utgår man, när man talar om baslinje, inte från värdet noll utan från värden som motsvarar ut­gångs­läget. Syftet är att kunna mäta förändringar:

  1. ursprunglig nivå, basnivå – utgångsvärden för en förändringsprocess: kvantitativ beskrivning av det som ska förändras sådant det är innan för­änd­ringen påbörjas;
  2. – motsvarande för olika slags försöksverksamhet, till exempel testning av läkemedel;
  3. – i systemutveckling även: etappmål – en på förhand definierad nivå i utvecklingsarbetet då man anses ha klarat av en del och kan gå vidare till nästa. Man har alltså nått baslinjen för nästa nivå;
  4. basår, basperiod – tidpunkt som man utgår från vid jämförelser;
  5. – i typografi: den tänkta linjen längs neder­kanten på bok­stäver som a, b, c, d. – Några bok­stäver som g och j har en del som hänger nedanför bas­linjen, ett under­häng;
  6. baseline budgetingbasbudgetering – budgetering som utgår från före­gående års budget med justering för inflationen (och eventuellt andra kända faktorer);
  7. grundprinciper (för engelska baseline) – ståndpunkter som man inte kan ge efter från;
  8. baseline document – utkast, underlag, avsett för förhandlingar;
  9. – se också triangulering;
  10. – i baseball: tänkt linje mellan två intilliggande baser; i tennis: den målade linje som är längst bort från nätet på vardera planhalvan.

[ekonomi] [språktips] [statistik] [testning] [typografi] [ändrad 10 augusti 2017]

sampling

tagning av stickprov (engelska samples):

  • – i it: mätning av en kon­ti­nu­er­lig signal (som musik) med jämna mellanrum; när det gäller in­spel­ning av musik tiotusentals gånger i sekunden. (Man digiti­serar ljudet.) Antalet mätningar per sekund kallas för samplingsfrekvens. Man utgår från att ingen betydelsefull informa­tion går för­lorad mellan mät­ningarna, förutsatt att de sker tillräckligt tätt. (Se Nyquists lag.) Sampling är en förutsättning för att analoga signaler ska kunna behandlas med digital teknik;
  •  – i statistik innebär sampling att man tar stickprov ur en större grupp och sedan utgår från att slut­satser om den undersökta gruppen också gäller för den större gruppen.

[informationsinsamling] [musik] [statistik] [ändrad 31 januari 2019]

Paretoprincipen

Paretodiagram som åskådliggör Pareto-principen. Den svarta linjen visar ackumulerat värde.
Paretodiagram som åskådliggör Pareto-principen. Den svarta linjen, som planar ut, visar ackumulerat värde.

(the Pareto principle) – ”20 procent av orsakerna står för 80 procent av effekt­erna.” – 20 procent av kunderna står för 80 procent av för­sälj­ningen, de rikaste 20 procenten av befolk­ningen äger 80 procent av alla pengar, 20 procent av problemen tar 80 procent av tiden att lösa. – Pareto­prin­cipen är därför också känd som 80‑20‑regeln. Det är en iakt­ta­gelse som stämmer ungefär i många fall, inte en exakt lag. – Ett diagram som visar för­del­ningen med orsakerna (i bred bemärkelse) på längd­axeln och effekterna på höjd­axeln kallas för Pareto­diagram. Ett Pareto­diagram som åskådliggör Paretoprincipen har en stor kropp i ena änden (80 procent av effekterna på höjdaxeln) medan större delen av diagram­met är en lång smal svans (20 procent av effekterna på höjd­axeln, men 80 procent av orsakerna på längdaxeln). – I företagsekonomi har principen använts som moti­ve­ring för att satsa på de 20 pro­centen och strunta i resten. Detta har ifrågasatts – se den långa svansen. – Se också drak­kung, potenslag, svart svan och Zipfs lag. – Läs också om DSDM. – Prin­cipen är upp­kallad efter den itali­enska ekonomen och indus­tria­listen Vilfredo Pareto (1848—1923, se Wikipedia).

[lagar] [statistik] [ändrad 23 december 2017]

Trendalyzer

ett program för grafisk representation av data. Det utvecklades av Ola Rosling för stiftelsen Gapminder, som 2007 sålde Trendalyzer till Google. Google tillhandahåller det under namnet Data explorer (länk). Programmet är förinställt för att hantera fem variabler: x‑axel, y‑axel, bubblor i olika storlekar och färger samt en glidande tidsaxel. Programmet levereras med en uppsättning data om global utveckling, men användaren kan mata in egna data.

[data] [grafiskt användargränssnitt] [statistik] [ändrad 10 november 2018]

perturbation

metod att göra det svårt att knyta personuppgifter i en förteckning till bestämda personer genom att man kastar om uppgifterna på ett systematiskt sätt. Används vid statistisk analys av integritetskänsliga data. – Vanlig pseudonymisering, det vill säga att man tar bort namn och andra uppgifter som direkt kan knytas till en bestämd person, anses osäker. Det är nämligen enkelt att koppla anonymiserade data om en viss person till den personen om man har tillgång till det ursprungliga registret eller annan lämplig information. Perturbation innebär att man låter vissa uppgifter byta plats mellan personer på ett sätt som gör att den statistiska analysen ändå blir giltig. Man kan också ändra vissa mätvärden på ett systematiskt sätt som inte påverkar slutresultatet. Liknande metoder används också för att hemlighålla information i datakommunikation. – En mer allmän betydelse av engelska perturbation är störning, avvikelse från förväntat värde. – Läs också om k-anonymitet och kvasiidentifierare.

[personlig integritet] [personuppgifter] [statistik] [ändrad 15 februari 2018]

affinitetsanalys

(affinity analysis) – sökning efter statistiska sam­band i stora data­mäng­der. Alltså en typ av datautvinning. – Affi­­ni­tet är i mark­­nads­föring ett mått på hur mycket en mål­grupp är in­tres­se­rad av en pro­dukt eller tjänst. Om målgrup­pen är mer in­tres­se­rad av pro­dukten än genom­snittet av befolkningen är affiniteten hög. Hög affi­ni­tet kan alltså antas ge gott gensvar på reklamen. – Ordet affinitet an­vänds också i andra sam­man­hang med besläktade betydelser.

[analys] [marknadsföring] [statistik] [ändrad 29 januari 2018]

Gauss

  1. – en trojansk häst som upp­snappar lösen­ord och informa­tion om bankkonton. Upp­täcktes i augusti 2012. Den anses vara utvecklad för cyberkrigföring, liksom Duqu, Flame och Stuxnet. – Läs mer här;
  2. – ett programspråk för matematik och statistik – se aptech.com;
  3. – Gaussian curve, se normalfördelningskurva;
  4. – se gaussiskt filter;
  5. – se gaussisk oskärpa.

– Ordet: Efter Carl Friedrich Gauss (1777—1855, se Wikipedia), av många ansedd som historiens främsta mate­­ma­­tiker.

[bildbehandling] [programspråk] [skadeprogram] [statistik] [ändrad 1 juni 2019]