flex-height
text-black

Serverzone

Woordenlijst voor gegevensbeheer

Verken een reeks gegevensgerelateerde termen en definities in onze glossary voor datamanagement.

Wat is een database?
Een database is een faciliteit voor het organiseren, opslaan, beheren, beveiligen en controleren van de toegang tot data. Databases zijn ontworpen volgens een aantal verschillende schema's (schema's), waarvan veel voldoen aan het relationele model voor eenvoudige toegang door programma's en gegevensquery's. Veelvoorkomende soorten databases zijn relationele databasebeheersystemen (RDBMS), in-memory databases, objectgeoriënteerde databases (OODBMS), NoSQL-databases en NewSQL-databases, elk met hun eigen voordelen.
Wat is datamanagement?
Datamanagement verwijst naar alle functies die nodig zijn om gegevens te verzamelen, controleren, beveiligen, manipuleren en leveren. Datamanagementsystemen omvatten databases, datawarehouses en datamarts; tools voor het verzamelen, opslaan en ophalen van gegevens; en hulpprogramma's om te helpen bij validatie, kwaliteit en integratie met applicaties en analysetools. Bedrijven hebben een datastrategie nodig om verantwoording af te leggen voor gegevens die afkomstig zijn van of endemisch zijn voor bepaalde verantwoordelijkheidsgebieden.
Wat is databasebeheer?
Databasebeheer verwijst naar de processen en procedures die nodig zijn om gegevens op te slaan, te verwerken, te manipuleren en te beveiligen. In veel organisaties is de verantwoordelijkheid voor het instellen en controleren van dergelijke procedures de primaire verantwoordelijkheid van een Databasebeheerder (DBA) of een soortgelijke functie. De meeste organisaties vertrouwen op een commercieel databasemanagementsysteem (DBMS) als primaire tool voor het beheer van hun database.
Wat is een databasemanagementsysteem (DBMS)?
Een databasemanagementsysteem (DBMS) is de softwaretoolkit die een opslagstructuur en gegevensbeheerfaciliteit biedt voor databasebeheer. Het DBMS kan een integraal onderdeel zijn van een gelicentieerd ERP-systeem (Enterprise Resource Planning), een vereiste separate aankoop, een deel van de systeemsoftware (besturingssysteem) of een separaat gelicentieerd softwareproduct. Ongeacht de bron is het essentieel dat applicaties zijn gebouwd rond en/of volledig geïntegreerd met het DBMS, omdat ze wederzijds afhankelijk zijn voor effectieve functionaliteit van zowel applicaties als het DBMS. Het DBMS is in wezen een toolkit voor databasebeheer.
Wat is een SQL-database?
Een SQL-database is een relationele database die gegevens opslaat in tabellen en rijen. Gegevensitems (rijen) zijn gekoppeld op basis van algemene gegevensitems om efficiëntie mogelijk te maken, redundantie te voorkomen en eenvoudige, flexibele opvraging mogelijk te maken. De naam SQL is afgeleid van Structured Query Language, de toolkit en het natuurlijke-taalqueryprotocol dat gebruikers kunnen leren en toepassen op elke compatibele database voor gegevensopslag, manipulatie en ophalen.
Wat is een NoSQL-database?
NoSQL-databases zijn ontwikkeld voor de verwerking van ongestructureerde gegevens die SQL niet kan ondersteunen vanwege het ontbreken van structuur. NoSQL maakt gebruik van creatieve technieken om deze beperking te overwinnen, waaronder dynamische schema's en verschillende voorverwerkingstechnieken. De meest voorkomende soorten databases voor ongestructureerde gegevens zijn codewaarde, document-, kolom- en grafiekdatabases en bevatten vaak zaken als video, afbeeldingen, vrije tekst en ruwe sensoruitvoer.
Wat is een relationeel databasemanagementsysteem (RDBMS)?
Een relationeel databasemanagementsysteem is een databasemanagementsysteem (DBMS) dat is gebaseerd op het relationele gegevensmodel. De inhoud van het databasesysteem wordt opgeslagen in tabellen, bestaande uit rijen en kolommen, waarbij elke tabel een specifiek object of een specifieke entiteit vertegenwoordigt in de database die aan een ander object of een specifieke entiteit kan worden gerelateerd. Een RDBMS bevat meestal meerdere tabellen en bevat aanvullende functies die de nauwkeurigheid, consistentie, integriteit en beveiliging van de gegevens behouden, evenals een SQL-interface voor toegang tot de gegevens in relatie tot elkaar via complexe query's.
Wat is een CDBMS?
CDBMS is een term bedacht door Gartner die voornamelijk een cloudimplementatiemodel voor RDBMS hierboven beschrijft.
Wat zijn gestructureerde gegevens?
Gestructureerde gegevens worden netjes opgemaakt in rijen en kolommen en toegewezen aan vooraf gedefinieerde velden. Meestal opgeslagen in Excel-spreadsheets of relationele databases, bijvoorbeeld financiële transacties, demografische informatie en machinelogs. Tot voor kort waren gestructureerde gegevens het enige bruikbare type data voor bedrijven.
Wat zijn ongestructureerde data?
Ongestructureerde data zijn niet georganiseerd in rijen en kolommen, waardoor het moeilijker is om gegevens op te slaan, te analyseren en te zoeken. Voorbeelden zijn ruwe IoT-data (Internet of Things), video- en audiobestanden, reacties op sociale media en transcripties van callcenters. Ongestructureerde data worden meestal opgeslagen in datalakes, NoSQL-databases of moderne datawarehouses.
Wat zijn semigestructureerde gegevens?
Semi-gestructureerde gegevens hebben enkele organisatorische eigenschappen, zoals semantische tags of metagegevens, maar voldoen niet aan de rijen en kolommen van een spreadsheet of relationele database. Een goed voorbeeld van semigestructureerde gegevens is e-mail, dat enkele gestructureerde gegevens bevat, zoals de afzender- en ontvangeradressen, maar ook ongestructureerde gegevens, zoals het bericht zelf.
Wat is data mapping?
Data mapping is het proces van het afstemmen van velden tussen verschillende gegevensstructuren of databases. Dit is een noodzakelijke stap als databases moeten worden gecombineerd, als gegevens van het ene systeem of de database naar het andere worden gemigreerd, of als verschillende gegevensbronnen moeten worden gebruikt in één toepassing of analysetool, zoals vaak gebeurt in datawarehousing. Data mapping identificeert unieke, conflicterende en dubbele informatie, zodat een set regels kan worden ontwikkeld om alle gegevens in een gecoördineerd schema of formaat te brengen.
Wat is datamodellering?
Bij het maken van een nieuwe of alternatieve databasestructuur begint de ontwerper met een diagram van hoe gegevens in en uit de database zullen stromen. Diagrammen van de gegevensstromen wordt datamodellering genoemd. Vanuit dit stroomdiagram kunnen softwaretechnici de kenmerken van de gegevensformaten, structuren en databaseverwerkingsfuncties definiëren om de gegevensstroomvereisten efficiënt te ondersteunen.
Wat is datawarehousing?
Een datawarehouse biedt één enkele, uitgebreide opslagfaciliteit voor gegevens uit vele verschillende bronnen, zowel intern als extern. Het belangrijkste doel is om de gegevens te leveren voor business intelligence (BI), rapportage en analyses. Moderne datawarehouses kunnen alle gegevenstypen opslaan en beheren, gestructureerd en ongestructureerd, en worden meestal in de cloud geïmplementeerd voor een grotere schaalbaarheid en gebruiksgemak.
Wat is een datalake?
Een datalake is een enorme verzameling gegevens die is opgeslagen in het ruwe of natuurlijke formaat. Datalakes worden meestal gebruikt om big data op te slaan, waaronder gestructureerde, ongestructureerde en semigestructureerde data.
Wat is big data?
Big data is een term die extreem grote datasets van gestructureerde, ongestructureerde en semi-gestructureerde gegevens beschrijft. Big data wordt vaak gekenmerkt door de vijf V's: het volume van de verzamelde gegevens, de verscheidenheid aan datatypen, de snelheid waarmee de gegevens worden gegenereerd, de waarheidsgetrouwheid van de gegevens en de waarde ervan. Met beheersystemen en analyses voor big data kunnen bedrijven big data opsporen voor diepgaande inzichten die de besluitvorming en acties sturen.
Wat is small data?
In tegenstelling tot big data, die enorm omvangrijk en complex is, zijn small data gemakkelijk te begrijpen voor mensen. Small datasets kunnen alles omvatten, van marketingenquêtes tot alledaagse spreadsheets, en kunnen zelfs zo klein zijn als een enkele social media post of e-mail. Bedrijven gebruiken steeds meer small data, naast big data, om hun algoritmen voor AI en machine learning te trainen, voor nog diepere inzichten.
Wat is thick data?
Thick data is kwalitatieve informatie die inzicht geeft in het dagelijkse emotionele leven van consumenten. Het omvat observaties, gevoelens en reacties - dingen die meestal moeilijk te kwantificeren zijn. In combinatie met big data ontstaat een zeer uitgebreid beeld van de voorkeuren en eisen van een consument.
Wat is data-integratie?
Data-integratie is de praktijk van het opnemen, transformeren, combineren en leveren van data, waar en wanneer dat nodig is. Deze integratie vindt plaats in de onderneming en daarbuiten, zowel voor partners als voor gegevensbronnen en use cases van derden, om te voldoen aan de vereisten voor dataverbruik van alle applicaties en bedrijfsprocessen. Technieken omvatten het verplaatsen van bulk-/batchdata, extraheren, transformeren, laden (ETL), het vastleggen van wijzigingsgegevens, gegevensreplicatie, datavirtualisatie, integratie van streamingdata, dataorkestratie en meer.
Wat is datavirtualisatie?
Datavirtualisatie biedt bedrijven een uniform overzicht van alle bedrijfsgegevens, in verschillende systemen en indelingen, in een virtuele gegevenslaag. In plaats van data te dupliceren, laat datavirtualisatie de data over in de bronsystemen en geeft het simpelweg een virtuele weergave ervan aan gebruikers en applicaties in realtime. Datavirtualisatie is een moderne benadering van data-integratie waarmee gebruikers data kunnen ontdekken en manipuleren, ongeacht hun fysieke locatie, formaat of protocol.
Wat is data fabric?
Een data fabric is een op maat gemaakte combinatie van architectuur en technologie. Het maakt gebruik van dynamische gegevensintegratie en orkestratie om verschillende locaties, bronnen en typen gegevens met elkaar te verbinden. Met de juiste structuren en stromen zoals gedefinieerd binnen het platform voor data fabric, kunnen bedrijven snel toegang krijgen tot en gegevens delen, ongeacht waar ze zijn of hoe ze zijn gegenereerd.
Wat is data mesh?
Data mesh is een benadering van datamanagement waarbij gebruik wordt gemaakt van een gedistribueerd architectonisch framework. Met andere woorden: het verspreidt eigendom en verantwoordelijkheid voor specifieke datasets over het hele bedrijf, naar die gebruikers die over de specialistische expertise beschikken om te begrijpen wat die data betekent en hoe ze er optimaal gebruik van kunnen maken.
Wat is datapijplijn?
Een datapijplijn beschrijft een set geautomatiseerde en herhaalbare processen voor het zoeken, opschonen, transformeren en analyseren van elk type data bij de bron. Omdat data worden geanalyseerd in de buurt van waar ze worden gegenereerd, kunnen zakelijke gebruikers de informatie die ze nodig hebben snel analyseren en delen tegen lagere kosten voor de organisatie. Datapijplijnen kunnen ook worden verbeterd door technologieën zoals machine learning om ze sneller en effectiever te maken.
Wat zijn datasilo's?
Een datasilo is een straatterm voor een situatie waarin afzonderlijke afdelingen of functiegebieden binnen een onderneming geen gegevens en informatie delen met andere afdelingen. Dit isolement voorkomt gecoördineerde inspanningen om bedrijfsdoelen te bereiken en resulteert in slechte prestaties (en slechte klantenservice), hoge kosten en een algemeen onvermogen om in te spelen op marktbehoeften en -veranderingen. Het is moeilijk om dubbele en redundante gegevens met elkaar te verenigen, waardoor pogingen om activiteiten te coördineren en het bedrijf effectief te beheren, verder worden voorkomen.
Wat is datamanipulatie?
Datamanipulatie is het proces van het nemen van ruwe data en het transformeren ervan in een formaat dat compatibel is met gevestigde databases en applicaties. Het proces kan het structureren, opschonen, verrijken en valideren van gegevens omvatten, indien nodig om ruwe gegevens nuttig te maken.
Wat is databeveiliging?
Databeveiliging is het veilig maken en beschermen van gegevens tegen ongeautoriseerde toegang of blootstelling, calamiteiten of systeemstoringen, en tegelijkertijd gemakkelijk toegankelijk voor legitieme gebruikers en applicaties. Methoden en tools omvatten gegevenscodering, sleutelbeheer, redundantie en back-upprocedures en toegangscontroles. Databeveiliging is een vereiste voor organisaties van elke omvang en soort om klant- en organisatiegegevens te beschermen tegen de steeds toenemende bedreiging van datalekken en privacyrisico's. Redundantie en back-ups zijn belangrijk voor bedrijfscontinuïteit en noodherstel.
Wat is dataprivacy?
Dataprivacy verwijst naar het beleid en de praktijken voor het omgaan met gegevens op manieren die de gegevens beschermen tegen onbevoegde toegang of openbaarmaking. Beleid en praktijken op het gebied van dataprivacy beschrijven hoe informatie wordt verzameld en opgeslagen volgens de gegevensstrategie van de organisatie, hoe deze al dan niet met derden kan worden gedeeld en hoe te voldoen aan wettelijke beperkingen. Dataprivacy is een zakelijke noodzaak die voldoet aan de verwachtingen van klanten en tegelijkertijd de integriteit en veiligheid van opgeslagen informatie beschermt.
Wat is datakwaliteit?
Datakwaliteit is een vage term die de geschiktheid en betrouwbaarheid van gegevens beschrijft. Goede, hoogwaardige data betekent gewoon dat de gegevens nauwkeurig zijn (echt representatief voor wat ze beschrijven), betrouwbaar (consistent, controleerbaar, goed beheerd en beschermd) en compleet zijn voor zover gebruikers en applicaties dat nodig hebben. De datakwaliteit kan alleen worden gewaarborgd door een goed ontworpen en uitgevoerde datastrategie die wordt uitgevoerd met industriële sterktetools en -systemen, samen met nauwgezet gevolgd beleid en procedures voor gegevensbeheer.
Wat is gegevensvalidatie?
Gegevensvalidatie is het proces van het bepalen van de kwaliteit, nauwkeurigheid en geldigheid van gegevens voordat gegevens worden geïmporteerd of gebruikt. Validatie kan bestaan uit een reeks activiteiten en processen voor het verifiëren van de gegevens en over het algemeen het "opschonen" van gegevensitems, waaronder het verwijderen van duplicaten, het corrigeren van duidelijke fouten of ontbrekende items en mogelijke wijzigingen in de opmaak (gegevensopschoning). Gegevensvalidatie zorgt ervoor dat de informatie die je nodig hebt om belangrijke beslissingen te nemen accuraat en betrouwbaar is.
Wat is gegevensopschoning?
Gegevensopschoning is het proces van het verwijderen of corrigeren van fouten uit een gegevensset, tabel of database. Deze fouten kunnen corrupte, onjuiste, irrelevante of onvolledige informatie omvatten. Dit proces, ook wel data scrubbing genoemd, vindt dubbele gegevens en andere inconsistenties, zoals typefouten en numerieke sets die niet optellen. Gegevensopschoning kan onjuiste informatie verwijderen of duidelijke fouten herstellen, zoals lege velden of ontbrekende codes.
Wat is gegevensintegriteit?
Gegevensintegriteit verwijst naar de waarheidsgetrouwheid van gegevens op de lange termijn. Zodra gegevens zijn ingevoerd of geïmporteerd, bewerkt, gevalideerd, opgeschoond en opgeslagen, is gegevensintegriteit een verklaring dat de gegevenskwaliteit wordt onderhouden en gebruikers er zeker van kunnen zijn dat de ingevoerde gegevens niet zijn gewijzigd en niet zullen worden gewijzigd. De gegevens die worden opgehaald, zijn dezelfde als de gegevens die oorspronkelijk zijn opgeslagen. Soms gebruikt als synoniem voor datakwaliteit, gaat gegevensintegriteit meer over betrouwbaarheid.
Wat is datagovernance?
Datagovernance is een set beleidsregels en werkwijzen voor het waarborgen van correct datamanagement in de hele organisatie. Het stelt de IT-infrastructuur vast en benoemt de personen (of posities) die bevoegd en verantwoordelijk zijn voor de verwerking en beveiliging van specifieke soorten gegevens. Effectieve datagovernance zorgt ervoor dat gegevens beschikbaar, betrouwbaar, veilig en conform zijn, en dat ze niet worden misbruikt.
Wat is data stewardship?
Data stewardship is de implementatie van beleid en procedures voor datagovernance voor het vaststellen van de nauwkeurigheid, betrouwbaarheid, integriteit en beveiliging van gegevens. Personen aan wie verantwoordelijkheden voor data stewardship zijn toegewezen, beheren en controleren de procedures en tools die worden gebruikt om gegevens te verwerken, op te slaan en te beschermen.
Wat is gegevensarchitectuur?
Gegevensarchitectuur is het algehele ontwerp voor de structuur, het beleid en de regels die de gegevens van een organisatie definiëren en hoe deze worden gebruikt en beheerd. Gegevensarchitectuur bevat details over hoe de datastrategie wordt geïmplementeerd ter ondersteuning van bedrijfsbehoeften en -doelen en dient als basis voor de ontwikkeling van databases, procedures, waarborgen, beveiliging en datagovernance.
Wat is master data management?
Master data management (MDM) is het creëren van één enkele, "master" referentiebron voor alle belangrijke bedrijfsgegevens. Het omvat beleidsregels en procedures voor het definiëren, beheren en controleren (of besturen) van de verwerking van stamgegevens. Gecentraliseerd stamgegevensbeheer elimineert conflicten en verwarring die het gevolg zijn van verspreide databases met dubbele informatie en ongecoördineerde gegevens die verouderd, beschadigd of verplaatst kunnen zijn op de ene plaats, maar niet op de andere plaats. Als je één versie hebt om de hele onderneming te bedienen, werken alle onderdelen van de organisatie met dezelfde definities, standaarden en aannamen.
Wat zijn analytics?
De term analytics verwijst naar de systematische analyse van gegevens. Analyseapplicaties en toolkits bevatten wiskundige algoritmen en computationele engines die grote datasets kunnen manipuleren om patronen, trends, relaties en andere intelligentie te ontdekken waarmee gebruikers vragen kunnen stellen en nuttige inzichten kunnen verkrijgen over hun bedrijf, activiteiten en markten. Veel moderne analysetoolkits zijn ontworpen voor gebruik door niet-technische zakenmensen, waardoor ze deze analyses met minimale assistentie van datawetenschappers of IT-specialisten kunnen uitvoeren.
Wat zijn augmented analytics?
Augmented analytics zijn analytics die “augmented” zijn met technologieën voor kunstmatige intelligentie, waaronder machine learning en Natural Language Processing (NLP). Augmented analytics kan gebruikers niet alleen helpen diepere inzichten te ontdekken, maar ook sneller: ze kunnen veel gecompliceerde stappen in het proces automatiseren en zelfs niet-technische gebruikers in staat stellen op een natuurlijke, conversationele manier query's uit te voeren op data.
Wat is datamining?
Datamining is het extraheren van nuttige informatie uit grote datasets. Datamining wordt vaak gedaan door zakelijke gebruikers die analysetools gebruiken om patronen, trends, afwijkingen, relaties, afhankelijkheden en andere nuttige intelligentie te ontdekken. Datamining heeft een breed scala aan toepassingen, van het opsporen van fraude en cybersecurityzorgen tot het verbeteren van prognoses en het vinden van mogelijkheden voor prestatieverbetering.
Wat is dataprofilering?
Dataprofilering is het verzamelen van statistieken en eigenschappen over een dataset, zoals de nauwkeurigheid, volledigheid en geldigheid ervan. Dataprofilering is een van de technieken die worden gebruikt bij het valideren en opschonen van gegevens, omdat het kan helpen gegevenskwaliteitsproblemen zoals redundanties, ontbrekende waarden en inconsistenties op te sporen.
SAP logo

SAP product

Wat is datamanagement?

Ontdek hoe je organisatie haar data kan transformeren in een waardevol asset.

Meer informatie