flex-height
text-black
Glossar for dataadministrasjon
Utforsk en rekke datarelaterte termer og definisjoner i vår ordliste over datahåndtering.
Hva er en database?
En database er en fasilitet for å organisere, lagre, administrere, sikre og kontrollere tilgang til data. Databaser er designet i henhold til en rekke forskjellige ordninger (skjema), hvorav mange følger relasjonsmodellen for enkel tilgang av programmer og data spørringer. Vanlige typer databaser inkluderer relasjonsdatabasestyringssystemer (RDBMS), in-memory-databaser, objektorienterte databaser (OODBMS), NoSQL-databaser og NewSQL-databaser – hver med sine egne fordeler.
Hva er databehandling?
Datahåndtering refererer til alle funksjonene som er nødvendige for å samle inn, kontrollere, beskytte, manipulere og levere data. Datastyringssystemer omfatter databaser, datalagre og datamarker; verktøy for datainnsamling, lagring og henting; og verktøy for å bistå med validering, kvalitet og integrasjon med applikasjoner og analytiske verktøy. Bedrifter trenger en datastrategi for å etablere ansvarlighet for data som stammer fra eller er endemiske for bestemte ansvarsområder.
Hva er databaseadministrasjon?
Databaseadministrasjon refererer til prosesser og prosedyrer som kreves for å lagre, håndtere, manipulere og beskytte data. I mange organisasjoner er ansvaret for å etablere og overvåke slike prosedyrer hovedansvaret for en databaseadministrator (DBA) eller lignende stilling. De fleste organisasjoner er avhengige av et kommersielt databasestyringssystem (DBMS) som det primære verktøyet for å administrere databasen.
Hva er et databasestyringssystem (DBMS)?
Et databasestyringssystem (DBMS) er programvareverktøysettet som gir en lagringsstruktur og databehandlingsanlegg for databaseadministrasjon. DBMS kan være en integrert del av et lisensiert ERP-system (Enterprise Resource Planning), et nødvendig separat kjøp, en del av systemprogramvaren (operativsystemet) eller et separat lisensiert programvareprodukt. Uansett kilde, er det viktig at applikasjoner er bygget rundt og / eller fullstendig integrert med DBMS, som de er gjensidig avhengige for effektiv funksjonalitet av både applikasjoner og DBMS. DBMS er i hovedsak en verktøykasse for databaseadministrasjon.
Hva er en SQL-database?
En SQL-database er en relasjonsdatabase som lagrer data i tabeller og rader. Dataelementer (rader) er koblet basert på felles dataelementer for å muliggjøre effektivitet, unngå redundans, og tilrettelegge for enkel, fleksibel henting. Navnet SQL stammer fra strukturert spørringsspråk, verktøysettet og spørringsprotokollen for naturlig språk som brukerne kan lære og bruke i en hvilken som helst kompatibel database for datalagring, manipulering og henting.
Hva er en NoSQL-database?
NoSQL-databaser ble utviklet for å håndtere ustrukturerte data som SQL ikke kan støtte på grunn av mangelen på struktur. NoSQL bruker kreative teknikker for å overvinne denne begrensningen, inkludert dynamiske skjemaer og forskjellige forbehandlingsteknikker. De vanligste typene databaser for ustrukturerte data er nøkkelverdi, dokument, kolonne og graf databaser og inkluderer ofte ting som video, grafikk, fritekst og rå sensorutgang.
Hva er et relasjonsdatabasestyringssystem (RDBMS)?
Et relasjonsdatabasestyringssystem er et databasestyringssystem (DBMS) som er basert på relasjonsdatamodellen. Innholdet i RDBMS lagres i tabeller, bestående av rader og kolonner, der hver tabell representerer et bestemt objekt, eller entitet, i databasen som kan være relatert til et annet. Et RDBMS inneholder vanligvis flere tabeller og inkluderer tilleggsfunksjoner som opprettholder nøyaktigheten, konsistensen, integriteten og sikkerheten til dataene, samt et SQL-grensesnitt for å få tilgang til dataene i forhold til hverandre gjennom komplekse spørringer.
Hva er en CDBMS?
CDBMS er et begrep skapt av Gartner som hovedsakelig beskriver en skyimplementeringsmodell for RDBMS ovenfor.
Hva er strukturerte data?
Strukturerte data er pent formatert til rader og kolonner og koblet til forhåndsdefinerte felt. Typisk lagret i Excel-regneark eller relasjonsdatabaser, eksempler inkluderer finanstransaksjoner, demografisk informasjon og maskinlogger. Inntil nylig var strukturerte data den eneste brukbare typen data for bedrifter.
Hva er ustrukturerte data?
Ustrukturerte data er ikke organisert i rader og kolonner – noe som gjør det vanskeligere å lagre, analysere og søke. Eksempler er rå Internett of Things-data (IoT), video- og lydfiler, kommentarer fra sosiale medier og samtalesentertranskripsjoner. Ustrukturerte data lagres vanligvis i datasjøer, NoSQL-databaser eller moderne datalagre.
Hva er semi-strukturerte data?
Semistrukturerte data har noen organisasjonsegenskaper, for eksempel semantiske tagger eller metadata, men samsvarer ikke med radene og kolonnene i et regneark eller en relasjonsdatabase. Et godt eksempel på semistrukturerte data er e-post – som inkluderer noen strukturerte data, som avsender- og mottakeradressene, men også ustrukturerte data, som selve meldingen.
Hva er datakobling?
Datakobling er prosessen med å sammenligne felt mellom ulike datastrukturer eller databaser. Dette er et nødvendig trinn hvis databaser skal kombineres, hvis data migreres fra ett system eller en database til en annen, eller hvis forskjellige datakilder skal brukes i en enkelt applikasjon eller et analyseverktøy – som skjer ofte i datalagring. Datakartlegging vil identifisere unik, motstridende og duplisert informasjon, slik at et sett med regler kan utvikles for å bringe alle dataene inn i et koordinert skjema eller format.
Hva er datamodellering?
Når du oppretter en ny eller alternativ databasestruktur, starter designeren med et diagram over hvordan data vil flyte inn i og ut av databasen. Diagramering av dataflytene kalles datamodellering. Fra dette flytdiagrammet kan programvareingeniører definere egenskapene til dataformater, strukturer og databasehåndteringsfunksjoner for effektivt å støtte dataflytkravene.
Hva er datalagring?
Et datavarehus gir et enkelt, omfattende lagringssted for data fra mange forskjellige kilder – både interne og eksterne. Hovedformålet er å levere data for Business Intelligence (BI), rapportering og analyser. Moderne datalagre kan lagre og administrere alle datatyper, strukturert og ustrukturert, og er vanligvis distribuert i skyen for større skalerbarhet og brukervennlighet.
Hva er en datasjø?
En datasjø er et stort utvalg av data som er lagret i råformat eller naturlig format. Datasjøer brukes vanligvis til å lagre store datamengder, inkludert strukturerte, ustrukturerte og semistrukturerte data.
Hva er Big Data?
Big Data er et begrep som beskriver ekstremt store datasett av strukturerte, ustrukturerte og semi-strukturerte data. Big Data kjennetegnes ofte av de fem Vs: det rene datavolumet som samles inn, mangfoldet av datatyper, hastigheten som dataene genereres med, dataenes sannhet og verdien av den. Med Big Data Management systemer og analyser, kan bedrifter gruve Big Data for dyp innsikt som veileder beslutningstaking og handlinger.
Hva er små data?
I motsetning til Big Data, som er enormt voluminøs og kompleks, er små data lett for mennesker å forstå. Små datasett kan inkludere alt fra markedsføringsundersøkelser til daglige regneark – og kan til og med være så "små" som ett enkelt innlegg eller e-post på sosiale medier. Stadig oftere bruker bedrifter små data, i tillegg til Big Data, til å trene sine KI- og maskinlæringsalgoritmer, for enda dypere innsikt.
Hva er tykke data?
Tykke data er kvalitativ informasjon som gir innsikt i forbrukernes hverdagsliv. Det inkluderer observasjoner, følelser og reaksjoner – ting som vanligvis er vanskelige å kvantifisere. Når det kombineres med Big Data, dukker det opp et svært omfattende bilde om en forbrukers preferanser og krav.
Hva er dataintegrasjon?
Dataintegrasjon er praksisen med å innta, transformere, kombinere og levere data, hvor og når det trengs. Denne integrasjonen skjer i og utenfor bedriften – både på tvers av partnere og tredjeparts datakilder og brukstilfeller – for å oppfylle kravene til dataforbruk for alle applikasjoner og forretningsprosesser. Teknikker inkluderer bulk / batch data bevegelse, ekstrakt, transformasjon, last (ETL), endring data fangst, datareplikering, data virtualisering, streaming data integrasjon, dataorkestrering, og mer.
Hva er virtualisering av data?
Datasitualisering gir bedrifter en enhetlig oversikt over alle foretaksdata – på tvers av ulike systemer og formater – i et virtuelt datalag. I stedet for å duplisere data, forlater datagudalisering dataene i sine kildesystemer og eksponerer ganske enkelt en virtuell representasjon av den for brukere og applikasjoner i sanntid. Datasitualisering er en moderne tilnærming til dataintegrasjon som lar brukerne oppdage og manipulere data uavhengig av fysisk plassering, format eller protokoll.
Hva er datastoff?
Et datastoff er en tilpasset kombinasjon av arkitektur og teknologi. Den bruker dynamisk dataintegrasjon og orkestrering for å koble sammen ulike steder, kilder og typer data. Med de riktige strukturene og flytene som er definert i datastoffplattformen, kan bedrifter raskt få tilgang til og dele data uansett hvor den er eller hvordan den ble generert.
Hva er datanett?
Datanett er en tilnærming til dataadministrasjon som bruker et distribuert arkitektonisk rammeverk. Med andre ord: Det sprer eierskap og ansvar for spesifikke datasett på tvers av virksomheten, til de brukerne som har spesialistekspertisen for å forstå hva disse dataene betyr og hvordan de skal gjøre best mulig bruk av dem.
Hva er datapipeline?
En datapipeline beskriver et sett med automatiserte og repeterbare prosesser for å finne, rense, transformere og analysere enhver type data ved kilden. Fordi data analyseres nær der de genereres, kan forretningsbrukere raskt analysere og dele informasjonen de trenger, til en lavere kostnad for organisasjonen. Datarørledninger kan også forbedres av teknologier som maskinlæring for å gjøre dem raskere og mer effektive.
Hva er data siloer?
En data silo er en slang term for en situasjon der enkelte avdelinger eller funksjonsområder i et foretak ikke deler data og informasjon med andre avdelinger. Denne isolasjonen forhindrer koordinert innsats for selskapets mål og resulterer i dårlig ytelse (og dårlig kundeservice), høye kostnader og en generell manglende evne til å reagere på markedskrav og endringer. Dupliserte og overflødige data er vanskelige å avstemme, noe som ytterligere forhindrer ethvert forsøk på å koordinere aktiviteter og effektivt administrere virksomheten.
Hva er dataavstemming?
Dataavstemming er prosessen med å ta rådata og transformere dem til et format som er kompatibelt med etablerte databaser og applikasjoner. Prosessen kan omfatte strukturering, rengjøring, anriking og validering av data etter behov for å gjøre rådata nyttige.
Hva er datasikkerhet?
Datasikkerhet er å gjøre data trygge og sikre – trygg mot uautorisert tilgang eller eksponering, katastrofe eller systemfeil, og samtidig lett tilgjengelig for legitime brukere og applikasjoner. Metoder og verktøy inkluderer datakryptering, nøkkeladministrasjon, redundans og backup-praksis, og tilgangskontroller. Datasikkerhet er et krav for organisasjoner av alle størrelser og typer for å beskytte kunde- og organisasjonsdata mot den stadig økende trusselen om datainnbrudd og personvernrisiko. Redundans og sikkerhetskopiering er viktig for forretningskontinuitet og katastrofegjenoppretting.
Hva er personvern?
Databeskyttelse refererer til retningslinjene og praksisen for håndtering av data på måter som beskytter dem mot uautorisert tilgang eller avsløring. Retningslinjer og praksis for personvern dekker hvordan informasjon samles inn og lagres i henhold til organisasjonens datastrategi, hvordan den kan eller ikke kan deles med tredjeparter, og hvordan de skal overholde lovbestemte begrensninger. Databeskyttelse er en virksomhet som tilfredsstiller kundens forventninger og samtidig beskytter integriteten og sikkerheten til lagret informasjon.
Hva er datakvalitet?
Datakvalitet er et tåkebegrep som beskriver dataenes egnethet og pålitelighet. Gode kvalitetsdata betyr ganske enkelt at dataene er nøyaktige (virkelig representative for det de beskriver), pålitelige (konsekvente, reviderbare, riktig administrert og beskyttet), og fullstendige i den grad brukere og applikasjoner krever det. Datakvalitet kan bare sikres ved en korrekt utformet og utført datastrategi utført med industrielle styrkeverktøy og systemer sammen med nøye fulgte retningslinjer og prosedyrer for datahåndtering.
Hva er datavalidering?
Datavalidering er prosessen med å fastsette kvaliteten, nøyaktigheten og gyldigheten av data før de importeres eller brukes. Validering kan bestå av en rekke aktiviteter og prosesser for å autentisere dataene og generelt "rydde opp" dataelementer, inkludert fjerning av duplikater, korrigering av åpenbare feil eller manglende elementer og mulige formateringsendringer (dataopprydding). Datavalidering sikrer at informasjonen du trenger for å ta viktige beslutninger er nøyaktig og pålitelig.
Hva er dataopprydding?
Dataopprydding er prosessen med å fjerne eller korrigere feil fra et datasett, en tabell eller en database. Disse feilene kan omfatte korrupt, unøyaktig, irrelevant eller ufullstendig informasjon. Denne prosessen, også kalt datautskrubbing, finner dupliserte data og andre inkonsistenser, som skrivefeil og numeriske sett som ikke legges sammen. Dataopprydding kan fjerne feil informasjon eller rette åpenbare feil, for eksempel tomme felt eller manglende koder.
Hva er dataintegritet?
Dataintegritet refererer til dataenes sannhet på lang sikt. Når data er oppgitt eller importert, avstemt, validert, renset og lagret, er dataintegritet en erklæring om at datakvalitet er vedlikeholdt, og brukerne kan være sikre på at dataene som gikk inn, ikke er og ikke vil bli endret. Dataene som hentes, er de samme som de som opprinnelig ble lagret. Noen ganger brukes som et synonym for datakvalitet, er dataintegritet mer om pålitelighet og pålitelighet.
Hva er datagovernance?
Datastyring er et sett med retningslinjer og praksis for å sikre riktig databehandling på tvers av en organisasjon. Det etablerer IT-infrastrukturen og navngir enkeltpersoner (eller posisjoner) som har myndighet og ansvar for håndtering og sikring av bestemte typer data. Effektiv datastyring sikrer at data er tilgjengelige, pålitelige, sikre og kompatible – og at de ikke misbrukes.
Hva er dataforvaltning?
Datastyring er implementeringen av retningslinjer og prosedyrer for datastyring for å etablere datanøyaktighet, pålitelighet, integritet og sikkerhet. Enkeltpersoner som er tilordnet ansvarsområder for datastyring, administrerer og overvåker prosedyrene og verktøyene som brukes til å håndtere, lagre og beskytte data.
Hva er datastruktur?
Datastruktur er den generelle utformingen av strukturen, policyer og regler som definerer en organisasjons data og hvordan de skal brukes og administreres. Datarekitektur omfatter detaljer om hvordan datastrategien implementeres til støtte for forretningsbehov og -mål – og fungerer som grunnlag for utvikling av databaser, prosedyrer, sikkerhetsforanstaltninger, sikkerhet og datastyring.
Hva er stamdataadministrasjon?
Master Data Management (MDM) er praksisen med å opprette én enkelt referansekilde for stamdata for alle viktige forretningsdata. Det omfatter retningslinjer og prosedyrer for å definere, administrere og kontrollere (eller styre) håndteringen av stamdata. Sentralisert stamdataadministrasjon eliminerer konflikt og forvirring som stammer fra spredte databaser med duplisert informasjon og ukoordinerte data som kan være utdatert, ødelagt eller fortrengt i tide – oppdatert på ett sted, men ikke i et annet. Å ha en versjon for å betjene hele bedriften betyr at alle deler av organisasjonen arbeider med de samme definisjonene, standardene og forutsetningene.
Hva er analyser?
Begrepet analyse refererer til systematisk analyse av data. Analyseapplikasjoner og verktøysett inneholder matematiske algoritmer og beregningsmotorer som kan manipulere store datasett for å avdekke mønstre, trender, relasjoner og annen intelligens som gjør at brukerne kan stille spørsmål og få nyttig innsikt om sin virksomhet, drift og markeder. Mange moderne analyseverktøy er designet for bruk av ikke-tekniske forretningsfolk, slik at de kan utføre disse analysene med minimal hjelp fra dataforskere eller IT-spesialister.
Hva er utvidet analyse?
Utvidet analyse er analyser som er "utvidet" med teknologier for kunstig intelligens, inkludert maskinlæring og behandling av naturlig språk (NLP). Ikke bare kan utvidet analyse hjelpe brukere med å avdekke dypere innsikt raskere – de kan automatisere mange kompliserte trinn i prosessen og la selv ikke-tekniske brukere spørre om data på en naturlig, samtalebasert måte.
Hva er datautvinning?
Datautvinning er å trekke ut nyttig informasjon fra store datasett. Datautvinning gjøres ofte av forretningsbrukere som bruker analyseverktøy for å avdekke mønstre, trender, uregelmessigheter, relasjoner, avhengigheter og annen nyttig intelligens. Datautvinning har et bredt spekter av applikasjoner, fra å oppdage svindel og cybersikkerhetsproblemer til å forbedre prognoser og finne muligheter for ytelsesforbedring.
Hva er dataprofilering?
Dataprofilering er praksisen med å samle inn statistikk og egenskaper om et datasett, for eksempel nøyaktighet, fullstendighet og gyldighet. Dataprofilering er en av teknikkene som brukes i datavalidering og dataopprydding, da det kan bidra til å oppdage datakvalitetsproblemer som redundans, manglende verdier og inkonsistenser.
SAP-produkt
Hva er databehandling?
Lær hvordan organisasjonen din kan transformere dataene til en verdifull ressurs.