om test: sannolikheten för att ett positivt testresultat är korrekt. – Med positivt testresultat menas att testet hittar fel, sjukdomar eller annat som testet söker efter. (Positiv betyder alltså inte att något är bra, utan att det hittas.) Så om ett test med hög sensitivitet säger att en dator är infekterad med skadeprogram så är det mycket sannolikt att datorn faktiskt är infekterad med skadeprogram. – Jämför med specificitet.
[sannolikhet] [ändrad 12 mars 2023]
om test: sannolikheten för att ett negativt testresultat är korrekt. – Med negativt testresultat menas att testet inte hittar något fel, någon sjukdom eller något annat som testet söker efter. (Negativ betyder alltså inte dålig, utan att något inte påträffas.) Om ett test med hög specificitet säger att datorn inte har några skadeprogram så är det högst sannolikt att det faktiskt inte finns några skadeprogram. – Jämför med sensitivitet.
[sannolikhet] [ändrad 12 mars 2023]
datamängd som har tagits fram för att användas i maskininlärning, men som inte är ett underlag som hämtats ur verkliga förhållanden. – Man vill ha ett underlag som är bättre för syftet med maskininlärningen än vad data ur verkligheten skulle vara. Lämpliga data kan vara svåra eller olämpliga att få fram ur verkliga förhållanden. Syntetiska data kan också användas för att undvika algoritmisk snedvridning. – Ett exempel är hur man tränar styrsystem för självkörande bilar att undvika olyckor: det är omöjligt att skaffa ett stort antal videor av verkliga trafikolyckor eller hotande olyckor, tagna ur bilens perspektiv. För att träna systemet framställer man i stället datoranimeringar. När det gäller självkörande bilar är det viktigaste ju inte att man har ett representativt urval av olyckor, utan man vill träna systemet även på mycket sällsynta situationer. – Man kan också utgå från ”verkliga” data från ett mindre antal personer och använda dessa data i olika kombinationer på syntetiska personer som används för träning i maskininlärning. Man kan se detta som en variant av sampling. Det påminner också om vad som i statistik kallas för omvägning eller kalibrering (se scb.se/hitta…). – På engelska: synthetic data, ibland även: fake data.
[data] [maskininlärning] [statistik] [19 juni 2022]
ett rörelsemönster med många korta, slumpmässiga rörelser och enstaka längre förflyttningar. – Det har visats att många varelser, inklusive människor, rör sig i Lévyvandringar när de söker efter föda. De söker alltså igenom ett mindre område noggrant, men inte efter något tydligt mönster, och flyttar sedan (om de inte hittar något) till ett annat område en bit bort och börjar söka där. – På engelska: Lévy walk. – Statistiskt talar man också om Lévydistribution, alltså ett stort antal små värden och ett fåtal stora värden. – Uppkallat efter den franska matematikern Paul Lévy (1886–1971).
[statistik] [2 februari 2022]
serie av händelser där sannolikheten för varje ny händelse bestäms enbart av den närmast föregående. – Vad som hände före den föregående händelsen spelar ingen roll. Markovkedjor är stokastiska, men inte i betydelsen att sannolikheten för varje möjligt utfall är samma: sannolikheten kan till exempel vara 1:3 för två möjliga utfall, men vilket av dem som det blir avgörs av slumpen. En serie tärningskast är alltså ingen Markovkedja, men att spela Monopol kan beskrivas som en Markovkedja: sannolikheten för att hamna på rutan Norrmalmstorg (Umeå i nya Monopol) beror på vilken ruta du står på när du kastar tärningen. Men det spelar ingen roll hur du hamnade på den den rutan: en Markovkedja har inget minne. – Markovkedjor används på många områden för att göra simuleringar och förutsägelser. – Jämför med Monte Carlo‑metoden och slumpvandring. – Markovkedjan, på engelska Markov chain, är uppkallad efter den ryska matematikern Andrej Markov (1856–1922, se Wikipedia).
[sannolikhet] [13 juni 2021]
– tre av något:
- – i den semantiska webben: en beskrivning av något enligt mönstret ”X är Y i förhållande till Z”, till exempel: ”Köpenhamn är huvudstad i Danmark”. Köpenhamn är subjekt, är huvudstad är predikat, Danmark är objekt. Detta ska kodas på ett sätt som gör att ett program kan bearbeta informationen. Se också RDF;
- – i grafer: tre noder som binds samman av två eller tre kanter. En öppen triplett binds samman av två kanter och kan alltså avbildas som ett V; en sluten triplett binds samman av tre kanter och kan avbildas som en triangel;
- – tre par av hexadecimala tal. Sådana tripletter används för kodning av färger med additiv färgblandning, alltså genom blandning av rött, grönt och blått ljus (RGB). Tripletten 0000FF står till exempel för rent blått: noll rött (00), noll grönt (00), maximalt blått (FF=255).
– På engelska: triple eller triplet. Triplet kan också betyda triol (musik) och trilling.
[färg] [matematik] [nätverk] [semantiska webben] [5 juni 2021]
tävling mot botten, kapplöpning mot botten, underbudspolitik – konkurrens i form av sänkta priser, skatter och avgifter när två eller flera aktörer försöker bjuda under varandra. Det är ofta underförstått att sådan konkurrens inte kan fortsätta hur länge som helst utan skadliga konsekvenser: man får helt enkelt inte in nog med pengar. – Uttrycket race to the bottom användes från början om hur amerikanska delstater försöker locka till sig företag genom att ha lägre företagsskatter och andra avgifter än andra delstater. Det förekommer också att man avskaffar eller släpper på lagar och bestämmelser om arbetarskydd och miljöskydd. – Race to the bottom kan ses som ett scenario i spelteori.
[företag och ekonomi] [spelteori] [8 april 2021]
beteckning på ett sätt att uppskatta komplexiteten i typer av beräkningar. Noteras med bokstaven O och används för jämförelser av algoritmers effektivitet. – Antalet element i beräkningen, till exempel antalet ord som ska sorteras i bokstavsordning, ställs mot antalet steg i beräkningen. Då menar man inte antalet steg i ett specifikt fall, utan generellt för en typ av beräkning. Om det till exempel gäller att hitta ett ord i en lista som innehåller n ord är ordo O(n). Det vill säga att antalet steg i sökningen är proportionellt mot antalet ord i listan (n). Sedan kan det ju vara så att ordet man söker efter står först i listan, och då går sökningen fort, eller att ordet står sist i listan, och då tar sökningen lång tid. Det påverkar inte värdet på ordo. Det viktiga är att man aldrig behöver gå igenom listan mer än en gång för att hitta det sökta ordet. Ordo anger det största möjliga antalet steg i beräkningen (värsta fallet). – Andra beräkningar, till exempel att sortera tal i storleksordning eller ord i bokstavsordning, kräver att mängden tal respektive ord gås igenom flera gånger (om mängden inte redan står i rätt ordning). Då får man värden på ordo som O(n2), O(n3) eller O(2n). – När man beräknar ordo brukar man bortse från konstanter, och om beräkningen innehåller höga potenser kan man också bortse från lägre potenser. Att beräkna ordo är en överslagsberäkning, inte en exakt beräkning. – Man skiljer mellan stora O och lilla o: stora O anger det högsta möjliga värdet för antalet moment i en beräkning av viss typ, medan lilla o anger ett övre värde som inte kan uppnås, men nästan (ett asymptotiskt värde). – Det finns också omega (Ω), som anger det lägsta möjliga värdet, samt theta (θ) som säger att antalet moment i beräkningen är exakt proportionellt med funktionen av n.
[matematik] [programmering] [22 december 2020]
en samling program för statistisk analys. Det kan bland annat användas för statistik, datautvinning och textanalys. – SPSS utvecklades 1968. Förkortningen stod då för Statistical package for the social sciences, men är nu en pseudoförkortning. Från 1975 marknadsfördes SPSS av ett företag med samma namn, men företaget köptes 2009 av IBM. Det marknadsförs nu som IBM SPSS Statistics – se IBM:s webbsidor.
[pseudoförkortningar] [statistik] [16 oktober 2020]
exakt används i två betydelser:
- – i beräkningar: exakt 1 betyder 1,00… – inte 0,99 eller 1,01;
- – i logik och definitioner: exakt 1 betyder 1 och bara 1 – det får bara vara ett värde, inte två eller flera – inte heller noll. (Se också en‑entydig.)
[matematik och logik] [14 september 2020]