flex-height
text-black
Datastyringsordliste
Udforsk en række datarelaterede begreber og definitioner i vores datastyringsordliste.
Hvad er en database?
En database er en facilitet til at organisere, lagre, administrere, beskytte og kontrollere adgangen til data. Databaser er designet efter en række forskellige skemaer (skema), hvoraf mange overholder den relationelle model for nem adgang for programmer og dataforespørgsler. Almindelige typer databaser omfatter relationelle databasestyringssystemer (RDBMS), in-memory databaser, objektorienterede databaser (OODBMS), NoSQL-databaser og NewSQL-databaser – med hver deres fordele.
Hvad er datastyring?
Datastyring henviser til alle de funktioner, der er nødvendige for at indsamle, kontrollere, beskytte, manipulere og levere data. Data management systemer omfatter databaser, datalagre og data marts; værktøjer til dataindsamling, lagring og hentning; og hjælpeprogrammer til at hjælpe med validering, kvalitet og integration med applikationer og analytiske værktøjer. Virksomhederne har brug for en datastrategi for at etablere ansvarlighed for data, der stammer fra eller er endemisk for bestemte ansvarsområder.
Hvad er databasestyring?
Databasestyring henviser til de processer og procedurer, der er nødvendige for at lagre, håndtere, manipulere og beskytte data. I mange organisationer er ansvaret for at etablere og føre tilsyn med sådanne procedurer det primære ansvar for en databaseadministrator (DBA) eller lignende stilling. De fleste organisationer er afhængige af et kommercielt databasestyringssystem (DBMS) som det primære værktøj til administration af deres database.
Hvad er et databaseforvaltningssystem (DBMS)?
Et databasestyringssystem (DBMS) er det softwareværktøjssæt, der giver en lagringsstruktur og datastyringsfacilitet til databasestyring. DBMS kan være en integreret del af et licenseret ERP-system (Enterprise Resource Planning), et påkrævet separat køb, en del af systemsoftwaren (operativsystemet) eller et softwareprodukt med separat licens. Uanset kilden er det afgørende, at applikationer er bygget op omkring og/eller helt integreret med DBMS, da de er gensidigt afhaengige for effektiv funktionalitet af både applikationer og DBMS. DBMS er i bund og grund et værktøjssæt til databasehåndtering.
Hvad er en SQL-database?
En SQL-database er en relationsdatabase, der gemmer data i tabeller og rækker. Dataelementer (rækker) sammenkædes baseret på fælles dataelementer for at muliggøre effektivitet, undgå redundans og lette og fleksibel hentning. Navnet SQL stammer fra Struktureret forespørgselssprog, værktøjssættet og forespørgselsprotokollen for naturligt sprog, som brugerne kan lære og anvende på enhver kompatibel database til datalagring, -manipulation og -hentning.
Hvad er en NoSQL-database?
NoSQL-databaser blev udviklet til håndtering af ustrukturerede data, som SQL ikke kan understøtte på grund af manglende struktur. NoSQL bruger kreative teknikker til at overvinde denne begrænsning, herunder dynamiske skemaer og forskellige forbehandlingsteknikker. De mest almindelige typer databaser til ustrukturerede data er nøgle-, dokument-, kolonne- og grafdatabaser og omfatter ofte ting som video, grafik, fritekst og rå sensoroutput.
Hvad er et relationsdatabasestyringssystem (RDBMS)?
Et relationelt databasestyringssystem er et databasestyringssystem (DBMS), der er baseret på den relationelle datamodel. Indholdet af RDBMS gemmes i tabeller, der består af rækker og kolonner, hvor hver tabel repræsenterer et bestemt objekt eller en bestemt entitet i databasen, der kan relateres til en anden. Et RDBMS indeholder typisk flere tabeller og indeholder yderligere funktioner, der opretholder nøjagtigheden, konsistensen, integriteten og sikkerheden af dataene, samt en SQL-grænseflade til at få adgang til dataene i forhold til hinanden gennem komplekse forespørgsler.
Hvad er et CDBMS?
CDBMS er et begreb opfundet af Gartner, der hovedsageligt beskriver en cloud-implementeringsmodel for RDBMS ovenfor.
Hvad er strukturerede data?
Strukturerede data formateres pænt i rækker og kolonner og tilknyttes foruddefinerede felter. Typisk gemt i Excel-regneark eller relationsdatabaser omfatter eksempler finansielle transaktioner, demografiske oplysninger og maskinlogfiler. Indtil for nylig var strukturerede data den eneste brugbare datatype for virksomheder.
Hvad er ustrukturerede data?
Ustrukturerede data er ikke organiseret i rækker og kolonner – hvilket gør det vanskeligere at gemme, analysere og søge. Eksempler omfatter rå Internet of Things-data (IoT), video- og lydfiler, kommentarer til sociale medier og callcenter-udskrifter. Ustrukturerede data gemmes normalt i datasøer, NoSQL-databaser eller moderne datalagre.
Hvad er semistrukturerede data?
Semistrukturerede data har nogle organisatoriske egenskaber, fx semantiske tags eller metadata, men overholder ikke rækkerne og kolonnerne i et regneark eller en relationsdatabase. Et godt eksempel på semi-strukturerede data er e-mail – som omfatter nogle strukturerede data, som afsender- og modtageradresser, men også ustrukturerede data, som selve beskeden.
Hvad er datatilknytning?
Datatildeling er processen med at afstemme felter mellem forskellige datastrukturer eller databaser. Dette er et nødvendigt trin, hvis databaser skal kombineres, hvis data migreres fra et system eller en database til en anden, eller hvis forskellige datakilder skal bruges i en enkelt applikation eller et analytisk værktøj – som det ofte sker i datalagring. Datatildeling vil identificere entydige, modstridende og duplikerede oplysninger, så der kan udvikles et sæt regler for at bringe alle data ind i et koordineret skema eller format.
Hvad er datamodellering?
Når der oprettes en ny eller alternativ databasestruktur, starter designeren med et diagram over, hvordan data vil flyde ind i og ud af databasen. Diagramming af dataflows kaldes datamodellering. Fra dette flowdiagram kan softwareingeniører definere egenskaberne for dataformater, strukturer og databasehåndteringsfunktioner for effektivt at understøtte kravene til dataflow.
Hvad er datalagring?
Et datawarehouse giver en enkelt, omfattende lagerfacilitet til data fra mange forskellige kilder – både interne og eksterne. Hovedformålet er at levere data til Business Intelligence (BI), rapportering og analyse. Moderne datalagre kan gemme og administrere alle datatyper, strukturerede og ustrukturerede, og er typisk implementeret i skyen for større skalerbarhed og brugervenlighed.
Hvad er en datasø?
En datasø er en stor pulje af data lagret i dets rå eller naturlige format. Data søer bruges typisk til at gemme Big Data, herunder strukturerede, ustrukturerede og semi-strukturerede data.
Hvad er Big Data?
Big Data er et begreb, der beskriver ekstremt store datasæt af strukturerede, ustrukturerede og semi-strukturerede data. Big Data er ofte karakteriseret ved de fem Vs: den rene mængde af indsamlede data, de forskellige datatyper, den hastighed, hvormed dataene genereres, dataenes rigtighed og værdien af dem. Med Big Data management systemer og analyser, kan virksomheder mine Big Data for dyb indsigt, der guider beslutningstagning og handlinger.
Hvad er små data?
I modsætning til Big Data, som er enormt voluminøs og kompleks, er små data let for mennesker at forstå. Små datasæt kan omfatte alt fra marketingundersøgelser til daglige regneark – og kan endda være så "små" som et enkelt opslag på sociale medier eller e-mail. Virksomheder bruger i stigende grad små data ud over Big Data til at træne deres AI og maskinindlæringsalgoritmer for endnu dybere indsigt.
Hvad er tykke data?
Tykke data er kvalitativ information, der giver indsigt i forbrugernes daglige følelsesliv. Det omfatter observationer, følelser og reaktioner – ting, der typisk er vanskelige at kvantificere. Kombineret med Big Data tegner der sig et meget omfattende billede af en forbrugers præferencer og krav.
Hvad er dataintegration?
Dataintegration er praksis med at indtage, transformere, kombinere og provisionere data, hvor og hvornår det er nødvendigt. Denne integration finder sted i virksomheden og videre – på tværs af partnere samt tredjeparts-datakilder og anvendelseseksempler – for at opfylde dataforbrugskravene for alle applikationer og forretningsprocesser. Teknikker omfatter masse-/batchdatabevægelse, udtræk, transformation, indlæsning (ETL), registrering af ændringsdata, datareplikering, datadynamisering, streaming af dataintegration, dataorkestrering og meget mere.
Hvad er data virtualisering?
Data virtualisering giver virksomheder et samlet overblik over alle virksomhedsdata – på tværs af forskellige systemer og formater – i et virtuelt datalag. I stedet for at duplikere data efterlader datadualiseringen dataene i sine kildesystemer og eksponerer blot en virtuel repræsentation af dem til brugere og applikationer i realtid. Data virtualisering er en moderne tilgang til dataintegration, der lader brugerne opdage og manipulere data uanset dens fysiske placering, format eller protokol.
Hvad er datastof?
Et datastof er en tilpasset kombination af arkitektur og teknologi. Den bruger dynamisk dataintegration og orkestrering til at forbinde forskellige placeringer, kilder og datatyper. Med de rette strukturer og flows som defineret på datastofplatformen kan virksomheder hurtigt få adgang til og dele data, uanset hvor de er, eller hvordan de blev genereret.
Hvad er data mesh?
Data mesh er en tilgang til data management, der bruger en distribueret arkitektonisk ramme. Med andre ord: Det spreder ejerskab og ansvar for specifikke datasæt på tværs af virksomheden til de brugere, der har specialistekspertisen til at forstå, hvad disse data betyder, og hvordan man bedst udnytter dem.
Hvad er data pipeline?
En datarørledning beskriver et sæt automatiserede og repeterbare processer til at finde, rense, transformere og analysere enhver type data ved kilden. Da data analyseres tæt på, hvor de genereres, kan forretningsbrugere hurtigt analysere og dele de oplysninger, de har brug for, til en lavere pris for organisationen. Datarørledninger kan også forbedres ved hjælp af teknologier som maskinindlæring for at gøre dem hurtigere og mere effektive.
Hvad er datasiloer?
En datasilo er en slangbetegnelse for en situation, hvor enkelte afdelinger eller funktionsområder inden for en virksomhed ikke deler data og information med andre afdelinger. Denne isolation forhindrer en koordineret indsats for at nå virksomhedens mål og resulterer i dårlige resultater (og dårlig kundeservice), høje omkostninger og en generel manglende evne til at reagere på markedets behov og ændringer. Det er vanskeligt at afstemme dobbelte og overflødige data, hvilket yderligere forhindrer ethvert forsøg på at koordinere aktiviteter og forvalte virksomheden effektivt.
Hvad er data tovtrækning?
Datafangling er processen med at tage rådata og omdanne dem til et format, der er kompatibelt med etablerede databaser og applikationer. Processen kan omfatte strukturering, rensning, berigelse og validering af data efter behov for at gøre rådata nyttige.
Hvad er datasikkerhed?
Datasikkerhed er en handling, der gør data sikre og sikre – beskyttet mod uautoriseret adgang eller eksponering, katastrofe eller systemfejl og samtidig let tilgængelige for legitime brugere og applikationer. Metoder og værktøjer omfatter datakryptering, nøglehåndtering, redundans og sikkerhedskopiering og adgangskontroller. Datasikkerhed er et krav til organisationer af alle størrelser og typer for at beskytte kunde- og organisationsdata mod den stadigt stigende trussel om brud på datasikkerheden og risikoen for privatlivets fred. Redundans og sikkerhedskopier er vigtige for forretningskontinuitet og katastrofeberedskab.
Hvad er databeskyttelse?
Databeskyttelse henviser til politikker og praksis for håndtering af data på måder, der beskytter dem mod uautoriseret adgang eller videregivelse. Databeskyttelsespolitikker og -praksis dækker, hvordan oplysninger indsamles og gemmes i henhold til organisationens datastrategi, hvordan de muligvis eller måske ikke deles med tredjeparter, og hvordan man overholder lovmæssige begrænsninger. Databeskyttelse er en forretningsnødvendighed, der opfylder kundernes forventninger, samtidig med at integriteten og sikkerheden af lagrede oplysninger beskyttes.
Hvad er datakvalitet?
Datakvalitet er et tåget begreb, der beskriver dataenes egnethed og pålidelighed. Data af god kvalitet betyder blot, at dataene er nøjagtige (virkelig repræsentative for det, de beskriver), pålidelige (konsistente, auditerbare, korrekt administrerede og beskyttede) og fuldstændige i det omfang, brugere og applikationer kræver det. Datakvaliteten kan kun sikres ved hjælp af en korrekt udformet og gennemført datastrategi, der gennemføres med værktøjer og systemer til industriel styrke samt nøje fulgte datastyringspolitikker og -procedurer.
Hvad er datavalidering?
Datavalidering er processen med at bestemme kvaliteten, nøjagtigheden og gyldigheden af data, før de importeres eller bruges. Validering kan bestå af en række aktiviteter og processer til godkendelse af dataene og generelt "oprydning" af dataelementer, herunder fjernelse af dubletter, korrektion af åbenlyse fejl eller manglende elementer og mulige formateringsændringer (dataoprydning). Datavalidering sikrer, at de oplysninger, du har brug for til at træffe vigtige beslutninger, er nøjagtige og pålidelige.
Hvad er dataoprydning?
Dataoprydning er processen med at fjerne eller rette fejl fra et datasæt, en tabel eller en database. Disse fejl kan omfatte korrupte, unøjagtige, irrelevante eller ufuldstændige oplysninger. Denne proces, også kaldet data scrubbing, finder duplikerede data og andre uoverensstemmelser, som f.eks. stavefejl og numeriske sæt, der ikke lægges sammen. Dataoprydning kan fjerne forkerte oplysninger eller rette åbenlyse fejl, såsom tomme felter eller manglende koder.
Hvad er dataintegritet?
Dataintegritet henviser til dataenes rigtighed på lang sigt. Når data er indtastet eller importeret, behandlet, valideret, renset og gemt, er dataintegritet en erklæring om, at datakvaliteten vedligeholdes, og brugerne kan være sikre på, at de data, der er gået ind, ikke har ændret sig og ikke vil ændre sig. De data, der hentes, er de samme som det, der oprindeligt blev gemt. Nogle gange bruges som synonym for datakvalitet, dataintegritet handler mere om pålidelighed og pålidelighed.
Hvad er datastyring?
Data governance er en række politikker og praksisser for at sikre korrekt datastyring på tværs af en organisation. Det fastlægger IT-infrastrukturen og navngiver de personer (eller stillinger), der har myndighed og ansvar for håndtering og beskyttelse af specifikke typer af data. Effektiv datastyring sikrer, at data er tilgængelige, pålidelige, sikre og kompatible – og at de ikke misbruges.
Hvad er dataforvaltning?
Dataforvaltning er implementeringen af datastyringspolitikker og -procedurer for at fastslå datanøjagtighed, -pålidelighed, -integritet og -sikkerhed. Personer, der er tildelt dataansvarsområder, administrerer og fører tilsyn med de procedurer og værktøjer, der bruges til at håndtere, gemme og beskytte data.
Hvad er dataarkitektur?
Dataarkitektur er det overordnede design for strukturen, politikker og regler, der definerer en organisations data, og hvordan den vil blive brugt og administreret. Dataarkitektur indeholder detaljer om, hvordan datastrategien implementeres til støtte for virksomhedens behov og mål – og fungerer som grundlag for udvikling af databaser, procedurer, sikkerhedsforanstaltninger, sikkerhed og datastyring.
Hvad er stamdatastyring?
Master Data Management (MDM) er praksis med at oprette en enkelt, "master" referencekilde for alle vigtige forretningsdata. Den omfatter politikker og procedurer for definition, administration og styring (eller styring) af håndteringen af stamdata. Centraliseret masterdatastyring eliminerer konflikter og forvirring, der stammer fra spredte databaser med duplikerede oplysninger og ukoordinerede data, der kan være forældede, beskadigede eller forskudt i tide – opdateret ét sted, men ikke på et andet. At have en version til at betjene hele virksomheden betyder, at alle dele af organisationen arbejder med de samme definitioner, standarder og antagelser.
Hvad er analyser?
Begrebet analyse refererer til den systematiske analyse af data. Analyseprogrammer og værktøjssæt indeholder matematiske algoritmer og beregningsmotorer, der kan manipulere store datasæt for at afdække mønstre, tendenser, relationer og anden intelligens, der giver brugerne mulighed for at stille spørgsmål og få nyttig indsigt i deres forretning, drift og markeder. Mange moderne analyseværktøjer er designet til brug for ikke-tekniske forretningsfolk, så de kan udføre disse analyser med minimal hjælp fra dataforskere eller IT-specialister.
Hvad er augmented analytics?
Augmented Analytics er analyser, der er "udvidet" med kunstig intelligensteknologi, herunder maskinindlæring og behandling af naturligt sprog (NLP). Ikke alene kan augmented analytics hjælpe brugere med at afdække dybere indsigt, hurtigere – de kan automatisere mange komplicerede trin i processen og give selv ikke-tekniske brugere mulighed for at forespørge på data på en naturlig, samtalebaseret måde.
Hvad er data mining?
Data mining er den handling at udtrække nyttige oplysninger fra store datasæt. Data mining udføres ofte af forretningsbrugere, der anvender analyseværktøjer til at afdække mønstre, tendenser, uregelmæssigheder, relationer, afhængigheder og anden nyttig intelligens. Data mining har en bred vifte af applikationer, fra afsløring af svindel og cybersikkerhed bekymringer til at forbedre prognoser og finde muligheder for forbedring af ydeevnen.
Hvad er dataprofilering?
Dataprofilering er praksis med at indsamle statistikker og træk om et datasæt, såsom dets nøjagtighed, fuldstændighed og gyldighed. Dataprofilering er en af de teknikker, der anvendes til datavalidering og dataoprensning, da det kan hjælpe med at opdage datakvalitetsproblemer som redundanser, manglende værdier og uoverensstemmelser.
SAP-produkt
Hvad er datastyring?
Få mere at vide om, hvordan din organisation kan omdanne sine data til et værdifuldt aktiv.