Wat is datamanagement?
Datamanagement is de praktijk van het verzamelen, organiseren, beheren en openen van data om productiviteit, efficiëntie en besluitvorming te ondersteunen.
Overzicht gegevensbeheer
Data zijn essentieel voor de werking en werking van een bedrijf. Bedrijven moeten inzicht hebben in data en relevant zijn in het lawaai dat wordt gecreëerd door diverse systemen en technologieën die de sterk verbonden wereldwijde digitale economieën ondersteunen. In dit opzicht staat data centraal. Op zichzelf zijn data nutteloos: bedrijven hebben een effectief strategie-, governance- en datamanagementmodel nodig om alle vormen van data te gebruiken voor praktisch en efficiënt gebruik in supply chains, werknemersnetwerken, klant- en partnerecosystemen … en nog veel meer.
Definitie en proces van datamanagement
Datamanagement is de praktijk van het verzamelen, organiseren, beheren en openen van data om productiviteit, efficiëntie en besluitvorming te ondersteunen. Gezien de cruciale rol die data spelen in het bedrijf van nu, zijn een effectieve bedrijfsstrategie en een modern platform voor datamanagement essentieel voor elk bedrijf, ongeacht omvang of branche. Datamanagement is belangrijk voor verschillende datagedreven use cases, waaronder end-to-end bedrijfsprocesuitvoering, compliance met betrekking tot regelgeving, accurate analytics en AI, datamigratie en digitale transformatie.
Het datamanagementproces omvat een breed scala aan taken en procedures, zoals:
Verzamelen, verwerken en valideren van gegevens
Integreren van verschillende soorten data uit verschillende bronnen, waaronder gestructureerde en ongestructureerde data
De kwaliteit van de gegevens beheren om aan de bedrijfsnormen te voldoen
Self-service, samenwerking en toegang tot gegevens bieden
Beschermen en beveiligen van data en waarborgen van dataprivacy
De levenscyclus van gegevens beheren, van aanmaak tot verwijdering
Zorgen voor hoge beschikbaarheid van data en herstel bij calamiteiten
De belangrijkste elementen van datamanagement
Waarom is datamanagement belangrijk?
Elke applicatie, analyseoplossing en algoritme die in een bedrijf wordt gebruikt (de regels en bijbehorende processen die technologie in staat stellen om problemen op te lossen en taken uit te voeren) is afhankelijk van naadloze toegang tot hoogwaardige data. Een datamanagementsysteem zorgt ervoor dat gegevens veilig, beschikbaar en nauwkeurig zijn. Maar de voordelen van datamanagement eindigen daar niet op.
Data omzetten in waardevolle bedrijfsmiddelen
Te veel gegevens kunnen overweldigend – en nutteloos – zijn als ze niet goed worden beheerd. Voeg toe aan dit steeds groter wordende niveau van diversiteit, distributie en eisen van data, en het is eenvoudig om te zien hoe organisaties moeite hebben om data als asset te gebruiken om aan hun digitale bedrijfsbehoeften te voldoen. Maar met de juiste tools kunnen data worden ingezet om bedrijven te voorzien van diepgaande inzichten, nauwkeurigere voorspellingen en innovatieve bedrijfsprocessen. Het kan bedrijven een beter inzicht geven in wat klanten willen en bedrijven helpen om uitzonderlijke klantervaringen te leveren op basis van de leergegevens die ze bieden. Het kan ook helpen bij het stimuleren van nieuwe datagedreven bedrijfsmodellen, zoals serviceaanbiedingen op basis van generatieve AI, die niet accuraat zouden zijn zonder een basis van hoogwaardige data waarop trainingsmodellen kunnen worden gebaseerd.
"Datagedreven zijn betekent data gebruiken, wat ook de complexiteit van staat, opslag, toegang, kwaliteit en context moet aankunnen om organisaties in staat te stellen hun datagedreven aspiraties te realiseren, centraal in digitaal zakelijk succes."
Gartner "Data Management Solutions Primer for 2023." Adam Ronthal, Ehtisham Zaidi, 14 februari 2023
Het is geen geheim dat datagedreven organisaties een groot concurrentievoordeel hebben. Met geavanceerde tools kunnen bedrijven meer data beheren en openen vanuit meer bronnen dan ooit tevoren. Ze kunnen ook veel verschillende soorten data, gestructureerd en ongestructureerd, in realtime gebruiken, waaronder Internet of Things (IoT) apparaatgegevens, video- en audiobestanden, klikstreamgegevens en reacties op sociale media, waardoor er meer mogelijkheden ontstaan om data te monetariseren en als asset te gebruiken.
Het datafundament leggen voor digitale transformatie
Er wordt vaak gezegd dat data de levenslijn is van digitale transformatie – en het is waar. Leiders op het gebied van data en analytics (D&A) moeten kunnen voldoen aan de eisen van het digitale bedrijf en de toenemende complexiteit van het datalandschap (inclusief de impact van de cloud). AI, machine learning, Industry 4.0, geavanceerde analytics, IoT en intelligente automatisering vereisen grote hoeveelheden tijdige, accurate en veilige data om te kunnen doen wat ze doen.
Machine learning en generatieve AI hebben bijvoorbeeld zeer grote en diverse datasets nodig om te "leren", complexe patronen te identificeren, problemen op te lossen en modellen en algoritmen up-to-date te houden en effectief te laten werken. Geavanceerde analytics (waarbij vaak gebruik wordt gemaakt van machine learning en AI) is ook afhankelijk van grote hoeveelheden hoogwaardige data om relevante en bruikbare inzichten te genereren waarop met vertrouwen kan worden gehandeld. En IoT- en Industrial IoT-scenario's zijn afhankelijk van een constante stroom machine- en sensorgegevens die met extreem hoge snelheden worden geleverd.
De gemeenschappelijke noemer in elk project voor digitale transformatie is data. Voordat bedrijven processen kunnen transformeren, kunnen profiteren van nieuwe technologieën en intelligente ondernemingen kunnen worden, hebben ze een solide gegevensbasis nodig. Kortom, ze hebben een modern datamanagementsysteem nodig.
"Het voortbestaan van elk bedrijf zal afhangen van een flexibele, data-centrische architectuur die reageert op de constante snelheid van verandering."
Donald Feinberg, vicepresident bij Gartner
Naleving van de dataprivacywetgeving
Goed gegevensbeheer is ook essentieel om te zorgen voor naleving van nationale en internationale privacywetten, zoals de General Data Protection Regulation (GDPR) en de California Consumer Privacy Act in de Verenigde Staten, evenals branchespecifieke privacy- en beveiligingsvereisten. En als die bescherming moet worden bewezen of gecontroleerd, is het van essentieel belang dat er een solide beleid en procedures voor datamanagement zijn.
Datamanagementbenaderingen
Data fabric en data mesh zijn de afgelopen jaren allebei populaire stukjes terminologie voor datamanagement geworden, waarbij veel organisaties ze hebben overgenomen voor hun datamanagementarchitectuur. De architectuur van het data fabric is bedoeld om een verbindingslaag te creëren voor verschillende gegevensbronnen, waardoor selfservice, gegevenstoegang en gegevenslevering in de hele onderneming worden vergemakkelijkt. De architectuur van een data fabric is bedoeld om de verschillende locaties waar je jouw gegevens opslaat vanuit een eindgebruikersperspectief te abstracteren en een enkele, uniforme weergave te presenteren die als zodanig kan worden gebruikt, zelfs wanneer de onderliggende architectuur sterk gedistribueerd is.
Data mesh
Data mesh is een benadering van datamanagement waarbij gebruik wordt gemaakt van een gedistribueerd architectonisch framework. Met andere woorden, het verspreidt het eigendom en de verantwoordelijkheid voor specifieke datasets in het hele bedrijf, naar de gebruikers die de gespecialiseerde expertise hebben om te begrijpen wat die data betekent en hoe ze het beste kunnen gebruiken. Data mesh-architectuur verbindt en haalt data uit verschillende bronnen, zoals datalakes en -warehouses, en distribueert de relevante datasets naar de juiste menselijke experts en domeinteams binnen het bedrijf. In wezen wordt een grote hoeveelheid data in een centraal datalake gesorteerd en verdeeld in beheersbare stukken naar degenen die het meest geschikt zijn om het te begrijpen en te gebruiken.
Datafabric
Een data fabric is een combinatie van gegevensarchitectuur en specifieke softwareoplossingen die data centraliseren, verbinden, beheren en beheren in verschillende systemen en applicaties. Met data fabric-oplossingen kun je gegevens in realtime verbinden en beheren, in verschillende systemen en applicaties. Dit maakt het mogelijk om één bron van waarheid te creëren, en om die data te gebruiken en te openen waar en wanneer je die nodig hebt – het democratiseren en automatiseren van datamanagementprocessen. Een data fabric stroomlijnt ook data, vooral in complexe gedistribueerde architecturen, waardoor het klaar is voor gebruik in analytics-, AA- en machine learning-applicaties door deze te verenigen, op te schonen, te verrijken en te beveiligen. De architectuur en oplossingen van data fabrics stellen bedrijven in staat om hun data te benutten en hun systemen te schalen en zich aan te passen aan snel veranderende markten.
Masterdatamanagement (MDM)
Master data management is de discipline van het creëren van één vertrouwde stamreferentie (één versie van de waarheid) voor alle belangrijke bedrijfsgegevens, zoals productgegevens, klantgegevens, activagegevens, financiële gegevens en meer. MDM helpt ervoor te zorgen dat bedrijven niet meerdere, mogelijk inconsistente versies van gegevens gebruiken in verschillende delen van het bedrijf, waaronder processen, processen, analyses, AI en rapportage. De drie belangrijkste pijlers voor effectief MDM zijn: dataconsolidatie, datagovernance en datakwaliteitsbeheer.
"Een op technologie gebaseerde discipline waarin het bedrijf en de IT-organisatie samenwerken om de uniformiteit, nauwkeurigheid, stewardship, semantische consistentie en verantwoordingsplicht van de officiële, gedeelde stamgegevensactiva van de onderneming te waarborgen."
Gartner-definitie van MDM
Data-integratie
Data-integratie is de praktijk van het verzamelen, transformeren, combineren en beschikbaar stellen van data, waar en wanneer dat nodig is. Deze integratie vindt plaats in de onderneming en daarbuiten – tussen partners, gegevensbronnen van derden en use cases – om te voldoen aan de vereisten voor gegevensverbruik van alle applicaties en bedrijfsprocessen. Technieken omvatten bulk-/batchdataverplaatsing, extraheren, transformeren, laden (ETL), vastleggen van wijzigingsgegevens, datareplicatie, gegevensvirtualisatie, integratie van streamingdata, dataorkestratie en meer.
Gegevensverkenning en -catalogisering
Met gegevensverkenning en -catalogisering kun je vinden welke gegevens je hebt en bepalen hoe deze zijn gerelateerd. Discovery wordt vaak geleverd als onderdeel van gegevensprofilering (die zelf bestaat om een helikopterview van je gegevens te genereren in termen van structuur, inhoud enzovoort), en geeft de verblijfplaats en de relaties aan die bestaan tussen verschillende datasets binnen en over meerdere (heterogene) gegevensbronnen. Meer in het algemeen is het een fundamentele tool om je datalandschap te begrijpen. Verkenning van gevoelige gegevens is een opmerkelijke subcategorie die zich met name bezighoudt met het lokaliseren en classificeren van persoonlijke of anderszins gevoelige gegevens binnen je organisatie, zodat deze adequaat kunnen worden beschermd met het oog op dataprivacy, beveiliging en naleving van regelgeving.
Data Discovery wordt ook gebruikt om datacatalogi te bouwen, samen met andere meer geavanceerde automatiseringstechnieken zoals AI en machine learning. Datacatalogi bieden een repository met informatie (bekend als metadata) over je data-assets: welke gegevens worden bewaard, waar ze zich bevinden, in welke indeling ze zich bevinden en binnen welke domeinen ze relevant zijn. Zoveel mogelijk van deze informatie moet automatisch worden verzameld en kan verder worden geclassificeerd op basis van geografie, tijd, toegangscontrole, enzovoort. Catalogussen zijn geïndexeerd en doorzoekbaar en ondersteunen selfservice en samenwerking. Uitgebreidere catalogi nemen metagegevens op uit verschillende afgeleide bronnen, zoals analytische rapporten en dashboards, naast de fysieke bronnen van je gegevens. Catalogi worden vaak gebruikt in combinatie met gegevensvoorbereidingstools en zijn belangrijk voor de ondersteuning van datagovernance en selfservicetoegang op basis van samenwerking.
Governance, beveiliging en compliance van data
Data governance is een verzameling regels en verantwoordelijkheden voor het waarborgen van de beschikbaarheid, kwaliteit, naleving en beveiliging van data in de hele organisatie. Data governance stelt de infrastructuur vast en benoemt de personen (of functies) binnen een organisatie die zowel de autoriteit als de verantwoordelijkheid hebben voor het omgaan met en beschermen van specifieke soorten en soorten data. Data governance is een belangrijk onderdeel van compliance. De systemen zorgen voor de mechanica van beveiliging, opslag en toegang, evenals de juiste verwijdering en bewaring. Data governance helpt er ook voor te zorgen dat gegevens nauwkeurig zijn om mee te beginnen en dat ze voldoen aan bedrijfsnormen voordat ze in het systeem worden ingevoerd, terwijl ze worden gebruikt en wanneer ze uit het systeem worden opgehaald voor gebruik of opslag elders. Organisatorisch beheer bepaalt hoe verantwoordelijke personen processen en technologieën gebruiken om data te beheren en te beschermen.
Gegevensbeveiliging is een groot probleem in de huidige wereld van hackers, virussen, cyberaanvallen en datalekken. Terwijl beveiliging is ingebouwd in systemen en applicaties, is data governance er om ervoor te zorgen dat die systemen correct worden opgezet en beheerd om de gegevens te beschermen, en dat procedures en verantwoordelijkheden worden afgedwongen om de gegevens buiten de systemen en database te beschermen.
Wat is een bedrijfsdatastrategie en waarom zou je er een moeten hebben?
Tegenwoordig zijn bedrijfsstrategieën afhankelijk van data om processen te automatiseren, klant- en werknemerservaringen aan te passen, groei door nieuwe markten of acquisities te stimuleren en te innoveren. Het succes van je bedrijf hangt dus in toenemende mate af van het afstemmen van je datastrategie op je bedrijfsstrategie. Een datastrategie moet resoneren op alle niveaus van de organisatie. Het moet betekenis en context hebben voor het bedrijf.
Een bedrijf heeft een datastrategie nodig om zijn werk te prioriteren. We weten allemaal dat de hoeveelheid data die een bedrijf genereert en gebruikt aanzienlijk toeneemt. Er zullen altijd meer gegevensproblemen en -vereisten zijn dan resources. Bedrijven hebben een manier nodig om gegevensactiviteiten te prioriteren op basis van wat via de datastrategie de meeste waarde zal opleveren. De strategie moet “levend en ademend” zijn en volledig zijn afgestemd op de bedrijfsprioriteiten, maar toch flexibel genoeg om te verschuiven naarmate het bedrijf transformeert en volwassen wordt. Het kan niet alleen woorden zijn in een document, maar moet ‘leven’ nemen binnen de organisatie.
Een datastrategie schetst alle datafuncties die moeten worden gebouwd om het bedrijfsresultaat te bereiken. Dat omvat niet alleen functies en tools voor datamanagement, maar ook bedrijfsfuncties zoals organisatiestructuur, dataverwerving en datanetwerkstrategie, compliance- en ethische functies. Het stelt een stappenplan op om over meerdere jaren capaciteiten te ontwikkelen, waarbij verwachtingen worden gesteld over wat kan worden geleverd, in welk tijdsbestek, voor welke kosten en managementondersteuning dat nodig is.
De ontwikkeling van datamanagement
Effectief datamanagement is al meer dan 50 jaar van cruciaal belang voor zakelijk succes: van hulp aan bedrijven om de nauwkeurigheid van informatierapportage te verbeteren, trends te zien en betere beslissingen te nemen, tot de bevordering van digitale transformatie en de versterking van nieuwe technologieën en bedrijfsmodellen. Data zijn een nieuw soort kapitaal geworden en toekomstgerichte organisaties zijn altijd op zoek naar nieuwe en betere manieren om data in hun voordeel te gebruiken. Dit zijn de nieuwste trends in modern datamanagement die je beslist in de gaten moet houden en waarvan je moet onderzoeken of ze relevant zijn voor je bedrijf en branche:
Datafabric: de meeste organisaties hebben tegenwoordig verschillende soorten data geïmplementeerd in de cloud en op locatie, en ze gebruiken meerdere databasemanagementsystemen, verwerkingstechnologieën en tools. Een data fabric, een aangepaste combinatie van architectuur en technologie, maakt gebruik van metadata, dynamische data-integratie en orkestratie om een soepele toegang tot en het delen van data in een gedistribueerde omgeving mogelijk te maken.
Datamanagement in de cloud: veel bedrijven verplaatsen een deel of al hun datamanagementplatform naar de cloud. Clouddatamanagement profiteert van alle voordelen die de cloud te bieden heeft, waaronder schaalbaarheid, geavanceerde databeveiliging, verbeterde gegevenstoegang, geautomatiseerde back-ups en noodherstel, kostenbesparingen en meer. Clouddatabases en database-as-a-service (DBaaS)-oplossingen, clouddatawarehouses en clouddatalakes worden steeds populairder.
Gegevens als een product: gegevens als een product hebben betrekking op het behandelen van je interne gegevens als een eerste-orderproduct, met de taak van je datateam(s) – en als uitbreiding je Chief Data Officer of een vergelijkbare leidinggevende – om de rest van je organisatie te voorzien van de juiste gegevens die het nodig heeft op het juiste moment en op het juiste kwaliteitsniveau. Het doel is om een groter gebruik van je gegevens in het algemeen mogelijk te maken, zoals meer tijdige en nauwkeurigere analytische inzichten.
Augmented data management: een van de nieuwere trends heet "augmented data management". Augmented data management maakt gebruik van AI en machine learning om datamanagementprocessen zelf te configureren en af te stemmen. Augmented data management automatiseert alles, van datakwaliteit en stamgegevensbeheer tot data-integratie, waardoor vakkundig technisch personeel zich kan richten op activiteiten met een hogere waarde.
Augmented analytics: Augmented analytics maakt gebruik van kunstmatige intelligentie (AI)-technologieën, machine learning en Natural Language Processing (NLP) om niet alleen automatisch de belangrijkste inzichten te vinden, maar ook om toegang tot geavanceerde analytics te democratiseren, zodat iedereen, niet alleen datawetenschappers, vragen kan stellen over zijn data en op een natuurlijke, conversationele manier antwoorden kan krijgen.
Samenvatting
We weten dat informatie wordt afgeleid van gegevens. En als informatie macht is, dan zou het effectief beheren en benutten van je data heel goed de supermacht van je bedrijf kunnen zijn. Als zodanig ontwikkelen de verantwoordelijkheden voor datamanagement en de rol van de Chief Data (and Analytics) Officer zich tot belangrijke veranderingsagenten in de organisatie: het stimuleren van cloudadoptie, het benutten van nieuwe trends en technologieën en het leveren van strategische waarde voor het bedrijf.
Oplossingen voor database- en datamanagement
SAP kan je helpen jouw bedrijfsgegevens te beheren, te beheren en te integreren.
Ideeën die u nergens anders zult vinden
Meld u aan voor een dosis business intelligence die rechtstreeks in uw inbox wordt bezorgd.