Elasticsearch

en databashanterare avsedd för att möjliggöra snabba sökningar i stora datamängder. Det är en databashanterare av typen NoSQL, det vill säga att den inte är använder relationsdatabasmodellen. Den är inriktad på information i dokument, inte tabeller. – Elasticsearch utvecklades av Shay Banon (länk), först 2004 under namnet Compass. Ett grundligt omarbetat utförande kom 2010 med namnet Elasticsearch.– Elasticsearch kallas ibland för sökmotor, men det är alltså snarare en databashanterare avsedd för sökningar i stora datamängder, och informationen är bara tillgänglig för databasens ägare. Det kallas ibland för enterprise search engine – företagssökmotor. Det är inte meningen att vem som helst ska kunna söka i Elasticsearch-databaser. Elasticsearch är delvis skrivet i öppen källkod. – Se elastic.co.

[databaser] [sökningar] [16 augusti 2019]

funktionellt beroende

om databaser: det att värdet i ett fält med säkerhet kan förutsägas utifrån värdet i ett annat fält, eller utifrån en kombination av två eller flera fält. – Exempel: om databasen har ett fält för personnummer bestämmer det värdet i fältet namn. (Med reservation för komplikationer som kan uppstå vid namnbyte.) Fältet personnummer, i detta exempel, kallas för determinant, fältet namn kallas för dependent. Värdet i fältet namn kan inte med säkerhet användas för att hitta rätt personnummer. (Determinanter bestående av två eller flera fält kan behövas när man, till exempel, behöver skilja mellan Newark–New Jersey–folkmängd och Newark–Delaware–folkmängd. Både ortnamn och delstat ingår i determinanten.) – Funktionellt beroende är något som man inte kan konstatera med formella metoder, utan det kräver insikt i de faktiska förhållanden som avspeglas i databasen. (Det kan ju till exempel hända att inget namn förekommer mer än en gång i en given databas, och då skulle man kunna dra den felaktiga slutsatsen att personnummer är funktionellt beroende av namn. Men som bekant kan flera personer ha samma namn, men inte samma personnummer.) – Om funktionellt beroende leder till upprepning av samma par av uppgifter, rad efter rad, i en databas, tyder det på att databasen är upplagd på ett ogenomtänkt sätt. Det gäller i synnerhet för relationsdatabaser. I stället för att upprepa samma personnummer följt av samma namn på rad efter rad bör man i en relationsdatabas bryta ut tabellen personnummer–namn (med personnummer som primärnyckel) och vid behov hämta namnet från den utbrutna tabellen. – På engelska: functional dependency. – Förkortas ibland till fb eller fd.

[databaser] [4 augusti 2019]

härledd relation

i relationsdatabaser: en relation som är framtagen genom en samkörning (join). Det är alltså en tillfällig sammanställning av uppgifter som gäller samma person eller objekt, men som har hämtats från två eller flera tabeller i samma databas. Härledda relationer visas i temporära filer, till skillnad från basrelationer, som är permanent lagrade i en tabell. – På engelska: derived relation.

[databaser] [1 juni 2019]

sharding

uppdelning av en databas i flera delar som kallas för shards (skärvor). Det görs för att korta söktiderna i databasen: en tumregel är nämligen att söktiden i en databas ökar med kvadraten på antalet poster. – Uppdelningen görs horisontellt, det vill säga att varje shard består av ett antal hela rader i databasen. Varje shard fungerar självständigt som källa till data. Shards kan köras på olika servrar och på olika platser. – Skillnaden mellan sharding och det som kallas för horisontell partitionering kan sägas vara att horisontell partitionering är att dela upp innehållet i databasen inom ramen för samma instans av databasens definierade struktur (schema). Sharding innebär däremot att man skapar en databas (en instans av schemat) för varje shard: det är då möjligt att köra sharderna på olika servrar. Det finns både för- och nackdelar med sharding jämfört med horisontell partitionering, men i riktigt stora system ger sharding bättre prestanda. – Någon svensk term tycks inte finnas, men skärvning skulle kunna användas – ordet finns redan i en betydelse som anknyter till skärva.

[databaser] [22 januari 2019]

SARC

en databas för forskning om hur system för artificiell intelligens ska kunna känna igen sarkasm i yttranden. Databasen, som presenterades 2017, innehåller 1,4 miljoner sarkastiska yttranden från det sociala forumet Reddit. – Med sarkasm menas yttranden som i hånfullt eller nedsättande syfte säger motsatsen till vad upphovspersonen faktiskt menar. ”Vilken smart idé!” betyder, om det sägs sarkastiskt: ”Vilken dum idé!”. Sarkasm har beskrivits som ”ironi utan humor”. Program som analyserar eller översätter yttranden i naturligt språk har uppenbara svårigheter med att känna igen sarkasm. För människor är sarkasm oftast uppenbar, eftersom den framgår av det som står före eller efter, eller båda. I tal framgår det dessutom ofta av tonfall och ansiktsuttryck. Men korta sarkastiska yttranden i sociala medier blir inte alltid rätt förstådda. – Vissa ord används nästan aldrig annat än sarkastiskt, som ”ljushuvud”. – Namnet SARC uppges vara kort för Self-annotated Reddit corpus, uppenbarligen en så kallad apronym. – Se denna länk.

[ai] [databaser] [förkortningar på S] [språkteknik] [ändrad 17 september 2018]

latch

hake, lås, spärr, vippa; latched – låst, spärrad;

  1. vippa – en elektronisk komponent som kan växla mellan två stabila lägen.   Det ena läget kan till exempel stå för 1, det andra för 0. Vippan behåller sitt läge tills det ändras, vilket innebär att den kan användas som ett slags minne. Det finns dock astabila vippor som växlar läge med bestämda intervaller, och monostabila vippor som förlorar sitt läge efter en tid. På engelska skiljer man ibland mellan latch för enkla vippor och flip-flop för astabila vippor;
  2. – annat ord för index lock, indexlås – spärr mot ändringar i en databas eller del av databas. Används när man gör underhåll och andra åtgärder för att förhindra att någon annan samtidigt försöker ändra i databasen, vilket skulle kunna leda till problem med konsistensen;
  3. – om internet: metod för att upprätta en förbindelse mellan en av flera användare i ett nätverk och en server på internet, särskilt när det gäller tjänster som strömmande ljud och video. Det gäller användare i nätverk som använder network address translation (NAT) för att ge användarna tillgång till internet. Det innebär att de enskilda användarna (eller resurser i nätverket) inte har egna IP-adresser. Det finns därför inte något självklart sätt för motparten att adressera dataflödet till den specifika mottagaren. Latching betecknar låsning av dataflödet så att det når rätt mottagare. Det är en del av vad som kallas för NAT Traversal. – Läs mer i RFC 7362 (länk);
  4. – engelsk slang: påhäng – någon som man helst vill slippa, fast man inte vill säga det. – På svenska kan latch stå för något som är lätt att klara av eller roligt (lattjo).

[databaser] [elektronik] [internet] [19 juni 2018]