flex-height
text-black

Vrouw die data aan haar bureau analyseert

Wat is data mesh?

Data mesh is een benadering van datamanagement waarbij gebruik wordt gemaakt van een gedistribueerd architectonisch framework.

default

{}

default

{}

primary

default

{}

secondary

Overzicht van data mesh

Data mesh is een nieuwe manier om naar informatie te kijken. Het komt voort uit het groeiende concept dat data eigenlijk zelf een product is, een tool, een middel om een doel te bereiken – niet gewoon iets wat bedrijven verzamelen en analyseren in een poging om dingen te begrijpen die al zijn gebeurd.

Definitie van data mesh

Data mesh is een benadering van datamanagement waarbij gebruik wordt gemaakt van een gedistribueerd architectonisch framework. Met andere woorden, het verspreidt eigendom en verantwoordelijkheid voor specifieke datasets over het hele bedrijf aan gebruikers met de gespecialiseerde expertise om te begrijpen wat die data betekent en hoe ze optimaal kunnen worden gebruikt.

Data mesh architectuur verbindt en haalt data uit verschillende bronnen, zoals data lakes en warehouses. Vervolgens worden de relevante datasets verdeeld over de juiste menselijke experts en domeinteams in het hele bedrijf. In wezen wordt een omvangrijke schat aan data in een centraal data lake gesorteerd en verdeeld in beheersbare onderdelen die het meest geschikt zijn om deze te begrijpen en te benutten.

Herkomst data mesh

Data mesh is ontstaan rond 2009 als antwoord op de uitdagingen van het schalen van data-architecturen in grote, complexe organisaties. Het belangrijkste idee achter data mesh is het decentraliseren van data-eigendom en -architectuur, het behandelen van data als een product en het toewijzen van verantwoordelijkheid aan domeingeoriënteerde teams. Data mesh combineert principes van domeingestuurd ontwerp, productdenken en selfservice-infrastructuur, waardoor organisaties datasystemen kunnen schalen zonder monolithische bottlenecks te creëren.

Gecentraliseerde datamanagementmodellen mislukken vaak in grote organisaties door:

Voordelen van data mesh

Oude databases en beperkte infrastructuur voor datamanagement hebben ertoe bijgedragen dat data in één kluis moeten worden bewaard en naar goeddunken van een paar datamanagers worden uitgemeten. Nu is data de brandstof dat je bedrijf aandrijft; die moet beschikbaar zijn voor de vakspecialisten die het beste weten hoe ze data kunnen laten werken en in concurrerende tijden winst moeten maken.

De belangrijkste voordelen van de architectuur van data mesh kunnen in drie categorieën worden samengevat:

Schaalbaarheid en flexibiliteit

Verbeterde toegankelijkheid van data: Data mesh zorgt ervoor dat alle juiste mensen in je organisatie toegang hebben tot de data die ze nodig hebben, zodat ze het beste in hun werk kunnen zijn.

Aanpasbare datapijplijnen en -processen: Veel van de beste en potentieel meest winstgevende projecten worden in de ijskast gezet door het enorme gedoe van het cureren van de unieke en op maat gemaakte datasets die nodig zijn om succes te behalen. Met een data mesh kunnen teams snel nieuwe projectmodellen openen en testen zonder het traditionele verlies van tijd of resources.

Minder knelpunten: dit is een duidelijke win/win voor zowel IT-teams als data-eigenaren. Bovendien kunnen bedrijven, door een bron van frustratie en irritatie te verminderen, helpen om silo's af te breken die een gezonde bedrijfsontwikkeling in de weg staan.

Kwaliteit en vertrouwen

Verbeterde analysemogelijkheden: wanneer organisaties data zien als een product dat elke dag moet worden gebruikt, beginnen teams een datagerichte aanpak van planning en strategie te volgen. Dit leidt tot minder fouten en een meer objectieve, minder opiniegedreven benadering van de bedrijfsontwikkeling.

Domeinoverkoepelende samenwerking en hergebruik

Minder druk op centrale datamanagementteams: dit betekent niet alleen het verminderen van achterstanden en frustratie, maar ook het vrijmaken van talloze uren voor je getalenteerde IT-teams om zich te wijden aan meer gespecialiseerde, interessante en winstgevende activiteiten.

Door eigendom te decentraliseren en data als een product te behandelen, stelt data mesh organisaties in staat om sneller te gaan, vertrouwen in inzichten op te bouwen en naadloos op te schalen tussen domeinen.

Kernbeginselen van data mesh

Als we het hebben over data lakes en data mesh, hebben we het in wezen over big data. Wat data "big" maakt, is niet alleen zijn enorme volume. Big data wordt onder andere ook gedefinieerd door complex, variabel, snel gegenereerd en ongestructureerd te zijn.

Een lineaire database is als een spreadsheet: het heeft kolommen en rijen en onveranderlijke categorieën waarin alle datacomponenten moeten passen. Sommige van de data die worden gegenereerd uit machines, sensoren en industriële bronnen zijn gestructureerd en passen netjes in een lineaire database. Hoeveel datavolume je ook te verwerken hebt, als het 100% gestructureerd is, voldoet het niet aan de criteria voor big data en kan het worden ondergebracht in een lineaire database, waardoor het relatief eenvoudig is om te filteren en te extraheren.

Maar steeds meer is moderne big data ongestructureerd en bestaat uit visuele componenten, open tekst, en zelfs video en rich media. Deze cruciale data kunnen duizenden terabytes aan informatie voor veel bedrijven omvatten en kunnen eenvoudigweg niet worden opgeslagen in een standaard lineaire database.

Voer het data lake in. Naarmate de volumes aan big data toenamen, werden data lakes ontwikkeld als een plaats waar complexe data kon worden opgeslagen en toegankelijk vanuit een centrale repository in zijn ruwe formaat. Hoewel data lakes een uitstekende oplossing vormen voor het probleem van big data, hebben ze toch zwakke punten. data lakes missen bepaalde analytische functies, waardoor ze afhankelijk zijn van andere services voor het ophalen, indexeren, transformeren, opvragen en analyticsfunctionaliteit.

Vier beginselen van data mesh zijn gericht op de uitdagingen van data lakes:

1. Domeineigendom

Eigendom in datallakes is complex om te definiëren wanneer te veel spelers data genereren en openen. Bij gebrek aan duidelijk omschreven rollen en verantwoordelijkheden kan dezelfde dataset door verschillende partijen verschillend worden beheerd, waardoor inconsistenties ontstaan die het gebruik ervan bemoeilijken. Ook andere data worden uiteindelijk verwaarloosd wanneer ze niet actief worden beheerd door degenen die er uiteindelijk gebruik van zullen maken.

De architectuur van data mesh lost dit op door eigendom te decentraliseren. Het zorgt ervoor dat datagovernance duidelijk per domein wordt gedistribueerd, zodat elk team of elke domeinexpert de data die ze produceren en gebruiken beheert. Om dit te ondersteunen, gebruikt data mesh ook een federatieve governancestructuur om ook centrale controle van datamodellering, beveiligingsbeleid en compliance mogelijk te maken. Eigenaarschap van data mesh zorgt voor verantwoordingsplicht en verbetert de bruikbaarheid van data.

2. Data als product

Data lakes kunnen er niet in slagen de datakwaliteit te garanderen wanneer het volume van de data te groot wordt of wanneer centrale datamanagers dat zelf niet begrijpen. Data mesh architectuur beschouwt data fundamenteel als een waardevol product, dat de kwaliteit en volledigheid van data centraal stelt in datamanagement. Vermoedelijk kent elk team de belangrijkste criteria en kwesties die ze willen extrapoleren uit de data die ze verzamelen. Door deze criteria en prioriteiten in de architectuur te integreren, kan data mesh helpen om de continue en geprioriteerde levering van schone, frisse en volledige data te garanderen, zelfs wanneer er grotere datasets bij betrokken zijn. En als algoritmen voor machine learning worden toegepast, worden deze criteria en resulterende datasets na verloop van tijd steeds nauwkeuriger en nuttiger.

3. Selfservice dataplatform

Data lakes kunnen knelpunten veroorzaken door hun gecentraliseerde architectuur en traditioneel moeilijke processen en protocollen voor het ophalen van gegevens. Dit betekent meestal dat de controle over een grote hoeveelheid geconsolideerde data tot één IT- of datamanagementteam behoort. En naarmate de hoeveelheden data (en de vraag naar het ophalen ervan) toenemen, worden deze IT-teams overbelast.

Bovendien moeten de data naar behoren worden geëvalueerd en gestructureerd om naleving en naleving van de beginselen van datagovernance te waarborgen. Bij buitensporige druk kan er een tendens zijn om zich door deze nalevingsfasen te haasten, wat potentiële risico's en verlies voor het bedrijf oplevert. Dit wordt aangepakt door een selfservice dataplatform mogelijk te maken. Het geeft toegang en controle aan geautoriseerde gespecialiseerde gebruikers die een grotere gevestigde interesse in de data hebben, terwijl ze strikte, gebakken beveiligingsprotocollen gebruiken. Dit vermindert knelpunten en versnelt de datalevering.

4. Federatieve governance

Hoewel decentralisatie essentieel is, kunnen organisaties governance niet opgeven. Data mesh maakt gebruik van een federatief governancemodel om autonomie en consistentie in evenwicht te brengen. Dit betekent dat domeinen hun eigen dataproducten beheren, maar moeten voldoen aan gedeelde normen voor beveiliging, compliance en interoperabiliteit in de hele organisatie. Deze hybride aanpak van data mesh governance zorgt voor flexibiliteit zonder dat dit ten koste gaat van vertrouwen of naleving van de regelgeving.

Hoewel er uitdagingen op het gebied van data mesh bestaan, heeft een gedecentraliseerde en gedemocratiseerde architectuur voor datamanagement bedrijven slimmer, flexibeler en nauwkeuriger gemaakt. Hoe? Door ervoor te zorgen dat de juiste data direct beschikbaar zijn voor de juiste mensen, waar en wanneer ze die nodig hebben. Data mesh maakt data-as-a-product een werkelijke realiteit, waardoor barrières worden weggenomen en de waarde van informatie wordt geprioriteerd, zodat teams snellere, onbelemmerde toegang tot essentiële data kunnen krijgen.

Architectuur en frameworks voor data mesh

We hebben besproken hoe data mesh een gedecentraliseerde vorm van gegevensarchitectuur is die data beschouwt als een essentiële bedrijfsbeheertool. En belangrijker nog, hoe onafhankelijke teams verantwoordelijk zijn voor het omgaan met de data binnen hun werk- en expertisegebieden, terwijl ze nog steeds voldoen aan centraal bepaalde datamanagementpraktijken. Deze mentaliteitsverandering vormt de kern van data mesh.

Een helikopterview op een data mesh-architectuur

In een data mesh zijn domeinen de belangrijkste producenten en consumenten van data, die elk hun data als product bezitten om kwaliteit en relevantie te waarborgen. Het selfserviceplatform biedt de infrastructuur voor het publiceren, ontdekken en gebruiken van deze dataproducten, samen met geautomatiseerde beveiligings- en compliancefuncties. Governance werkt in een federatief model, waarbij wereldwijde normen voor interoperabiliteit en veiligheid in evenwicht zijn met lokale autonomie, zodat domeinen kunnen innoveren met behoud van vertrouwen en consistentie in de hele organisatie.

Om beter te begrijpen hoe de architectuur van data mesh in elkaar past, duiken we in de drie hoofdcomponenten.

Databronnen

Deze vertegenwoordigen de dataopslagruimte, zoals een data lake, waarin de primaire onbewerkte data worden ingevoerd. Of het nu wordt verzameld uit cloud IIoT-netwerken, klantfeedbackformulieren of gesloopte webdata, dit is de onbewerkte input die gebruikers zullen refereren en verwerken waar nodig in het netwerk. Terwijl een data lake-benadering al deze data naar één centrale plaats zou leiden, verdeelt de methode voor data mesh in plaats daarvan de verantwoordelijkheid voor de opname, opslag, verwerking en extractie van deze onbewerkte data binnen een reeks verantwoordelijke domeinen.

Data mesh infrastructuur

Informatie is niet alleen geïsoleerd binnen afzonderlijke departementale domeinen, maar kan ook naar wens worden gedeeld in het operationele netwerk van de organisatie, terwijl het blijft voldoen aan de vastgestelde richtlijnen voor datagovernance. Dit is een direct gevolg van twee van de belangrijkste pijlers van data mesh: een selfservice dataplatform en federatief bestuur. Het selfservice dataplatform biedt de tools en infrastructuur die elk domein nodig heeft om hun data universeel op te nemen, te transformeren, te verwerken en te bedienen. Ondertussen zorgen de federatieve governanceprincipes voor standaardisatie in een hele organisatie, waardoor moeiteloos interoperabiliteit van data tussen alle domeinteams mogelijk wordt.

Data-eigenaren

Als laatste onderdeel van een datanetwerk zijn data-eigenaren verantwoordelijk voor het toepassen van de compliance-, governance- en categorisatieprotocollen voor de data van hun afdeling. HR-bestanden moeten bijvoorbeeld worden opgeslagen met behulp van bepaalde beveiligingsprotocollen, ze mogen niet voor dit of dat doel worden gebruikt, ze mogen alleen worden vrijgegeven aan een dergelijke persoon. Uiteraard heeft elke afdeling categorieën en soorten data die uniek zijn voor hun afdeling of doeleinden. In een data lake systeem moeten IT-teams worstelen met al deze verschillende protocollen en categorieën voor alle verschillende data-eigenaren die spullen in het lake hebben gedumpt. Terwijl data mesh architectuur domeineigenaren volledige autoriteit en controle geeft over deze zaken, want wie beter dan vakdeskundigen kunnen hun eigen data beheren en ervoor zorgen dat deze voldoen aan de kwaliteitsnormen?

Het operationele model van de data mesh

Het operationele model van data mesh brengt mensen, processen en technologie samen om decentraal datamanagement op schaal mogelijk te maken. Deze samenwerking zorgt ervoor dat data naadloos over de hele organisatie stroomt, waardoor vertrouwen, flexibiliteit en hergebruik worden bevorderd zonder te vertrouwen op één gecentraliseerd team. Data mesh maakt interoperabiliteit en vindbaarheid mogelijk door het handhaven van gedeelde normen en het bieden van een gemeenschappelijk platform, consistente formaten en zoektermen, en governanceregels voor het publiceren en verbruiken van dataproducten. Met tools voor data mesh, zoals datacatalogi en -registers, kunnen teams dataproducten snel in de hele organisatie vinden, op een veilige manier openen en gebruiken.

Zie een data mesh als een moderne stad: Elke buurt (domein) beheert zijn eigen nutsvoorzieningen en diensten, zoals water, elektriciteit en afval, omdat ze hun lokale behoeften het beste kennen. De stad biedt gedeelde infrastructuur, zoals wegen en openbaar vervoer (zelfbedieningsplatform) en veiligheidsnormen (governance), zodat wijken kunnen verbinden, toegang hebben tot stadshulpbronnen en zonder chaos kunnen samenwerken. Op deze manier stromen hulpbronnen vrij door de stad, iedereen volgt gemeenschappelijke regels en innovatie gedijt lokaal terwijl de hele stad soepel functioneert.

Data mesh in de praktijk: voorbeelden en use cases

Om oplossingen voor datamanagement te ontwikkelen en succesvoller te maken, moeten ze bruikbaar en relevant zijn voor een breed scala aan applicaties en processen. Naarmate de architectuur van data mesh en gebruikersvriendelijkheid verbeteren, zien we een groter aantal bedrijfsfuncties die organisaties kunnen verbeteren met een veilige en gedistribueerde benadering van data als een product en een tool.

Laten we wat algemene use cases voor data mesh verkennen.

Sales

Voor verkoopteams komt het er allemaal op neer om leads te verwerven, te koesteren en af te sluiten. Hoe meer tijd je salesteamleden aan hun bureau doorbrengen om administratieve taken uit te voeren, hoe minder tijd ze hebben om relaties op te bouwen met nieuwe klanten. Met de architectuur van data mesh hoeven gebruikers van het verkoopteam geen experts op het gebied van datamanagement en -retrieval te zijn om de krachtigste en meest relevante datasets en combinaties binnen handbereik te hebben. Wanneer verkoopafdelingen over de juiste data beschikken om te analyseren, worden ze omgezet in meer bruikbare inzichten en strategieën.

Voorbeeld van sales data mesh: regionale of productspecifieke verkoopteams kunnen hun CRM- en pijplijndatadomeinen bezitten, waardoor nauwkeurige prognoses en realtime dashboards mogelijk zijn zonder te hoeven wachten op een centraal IT-team.

Supply chain en logistiek

Moderne supply chains zijn kwetsbaar voor een enorme reeks verstoringen. Een concurrentievoordeel komt wanneer bedrijven snel kunnen schakelen en met gelijke flexibiliteit kunnen reageren op zowel bedreigingen als kansen. De wereldwijde data over de supply chain van vandaag de dag komen snel en dik binnen, van feedback van klanten tot IIoT-netwerken en digital twins. Wanneer ervaren en bekwame supply chain managers zelf in staat zijn om een van die datasets in realtime te cureren en in te zoomen, krijgen bedrijven een krachtige bron van inzicht en inzicht.

Voorbeeld van data mesh voor de supply chain: voor optimalisatie van de supply chain is realtime inzicht nodig in voorraadniveaus, leveranciersprestaties en logistieke data. Data mesh geeft elk domein – inkoop, opslag, transport – eigendom van zijn dataproducten, waardoor snellere beslissingen en kostenefficiënte activiteiten mogelijk zijn.

Productie

Als onderdeel van de supply chain zijn de productieactiviteiten van een bedrijf even kwetsbaar voor snelle marktverschuivingen en volatiele klantbehoeften. In het verleden zouden design en R&D teams moeten vertrouwen op historische klantdata, die ze van andere afdelingen ontvangen. Vandaag de dag biedt de data mesh live toegang tot data voor gebruikers achter de redactietabel, over de R&D en testteams, en helemaal tot aan de productievloer. Realtime feedback van klanten kan productontwikkeling in een oogwenk en up-to-the-minute intel van IIoT-netwerken en digitale simulaties helpen om fabrieken veiliger, sneller en efficiënter te laten draaien.

Voorbeeld van Manufacturing data mesh: teams op vestigingsniveau kunnen data over sensor- en machineprestaties bezitten, waardoor voorspellend onderhoud mogelijk is en downtime wordt verminderd door decentrale analyses.

Marketing

Vandaag de dag bepalen de klantvragen en -verwachtingen de toekomst, en ze veranderen en groeien in een ongekend tempo. Een enkel merk heeft meestal talloze consumentencontactpunten op sociale media, gerichte digitale advertenties en online en omnichannel winkelportals. De huidige markt ziet de groeiende behoefte aan snel maatwerk, kortere productlevenscycli en enorme keuzeniveaus en concurrentie. Om deze trends te begrijpen en voor te blijven, hebben moderne marketeers realtime en gelijktijdige toegang nodig tot een breed scala aan datasets. In het verleden betekende dit het aanvragen van (en wachten op) deze data bij andere afdelingen. Met een data-mesh setup kunnen marketeers deze data echter op het juiste moment, op hun eigen voorwaarden, cureren en openen.

Voorbeeld van marketing data mesh: voor het opbouwen van een 360-gradenview voor klanten moeten data uit meerdere kanalen worden geïntegreerd, zoals e-mail, sociale media en betaalde advertenties. Data mesh stelt elk kanaal in staat om zijn eigen dataproduct te bezitten, zodat er nauwkeurige, realtime inzichten zijn voor gepersonaliseerde campagnes en betere klantervaringen.

Human resources

HR-teams moeten grote hoeveelheden uiterst complexe en gevoelige data beheren. En met de groeiende trend naar externe en hybride werkplekken, worden die data elke dag gecompliceerder en geografisch diverser. Om nog maar te zwijgen van de steeds veranderende set compliance- en juridische kwesties waar HR-teams zo dringend op moeten blijven letten. Van in dienst nemen tot met pensioen: HR-leiders moeten een aantal van de meest uiteenlopende datasets in elke organisatie kunnen valideren, beoordelen en analyseren. De architectuur van data mesh biedt de juiste beveiligingsprotocollen en strikt beperkte toegang. Tegelijkertijd stelt het geautoriseerde HR-gebruikers in staat om snel en zonder afhankelijkheid van complexe interne protocollen en multidepartementale bureaucratie toegang te krijgen tot data en informatie.

Voorbeeld van HR-data mesh: wervings-, salarisadministratie- en prestatiemanagementteams kunnen hun eigen datadomeinen besturen, de compliance verbeteren en realtime personeelsanalyses mogelijk maken voor strategische besluitvorming.

Finance

Net als bij HR zijn financiële en boekhoudteams ook verantwoordelijk voor enorm cruciale en gevoelige data. Moderne ERP-systemen brengen een revolutie teweeg in finance, waarbij in-memory databasetechnologie wordt gebruikt om actuele rapporten, analyses en projecties aan te passen. Maar zelfs wanneer financiële teams gebruikmaken van de beste databases en ERP's, ondervinden ze vaak nog steeds obstakels als gevolg van oude en starre culturen, zware silo's en bureaucratische, old-school processen. De architectuur van data mesh brengt een fundamentele verschuiving teweeg in de manier waarop financiële data worden bekeken en beheerd. Het kan zelfs stagnerend denken opschudden dat kan gebeuren wanneer organisaties teams in staat stellen om hun eigen verouderingsdataprocessen te bezitten en te herzien.

Voorbeeld van financiële data mesh: financiële planningsteams kunnen datadomeinen voor omzet, onkosten en investeringen bezitten, waardoor nauwkeurige prognoses en flexibele scenariomodellering worden gewaarborgd zonder dat ze hoeven te vertrouwen op één centraal team.

Het is duidelijk dat data mesh niet zomaar een zoveelste modewoord is en een trend in datastrategie is die serieus moet worden genomen. Bedrijven van elke omvang en branche maken gebruik van data mesh, op zoek naar manieren om data te gebruiken om inzichten en waarde te creëren.

Alternatieven voor data mesh

Hoewel data mesh een gedecentraliseerde benadering van datamanagement biedt, is het niet de enige optie. Traditionele architecturen zoals data lakes en datawarehouses worden nog steeds veel gebruikt voor het centraliseren en opslaan van grote hoeveelheden data, vaak gekoppeld aan data lakehouses die gestructureerde en ongestructureerde datamogelijkheden combineren. Andere modellen, zoals data fabric, richten zich op het creëren van een uniforme laag voor data-integratie en -orkestratie in verschillende systemen. Elk alternatief pakt schaalbaarheid, governance en toegankelijkheid anders aan, waardoor de keuze afhankelijk is van organisatorische behoeften en volwassenheid.

Laten we kijken naar de alternatieven voor data mesh en hoe ze zich met elkaar vergelijken.

Data mesh vs. data lake/lakehouse

Data mesh
data lake/data lakehouse
Kernconcept
Decentrale architectuur met federatief bestuur
Gecentraliseerde repository voor ruwe of semigestructureerde data
Focus
Eigendom, governance en vindbaarheid
Opslag en verwerking van grootschalige data
Beste voor
Organisaties die worstelen met knelpunten en schaalbaarheid
Bedrijven die één bron nodig hebben voor analytics en ML-workloads
Wanneer kiezen
Wanneer datakwaliteit, autonomie en domeinoverkoepelende samenwerking het belangrijkst zijn
Wanneer kosteneffectieve opslag en batchanalyses prioriteit hebben

Data mesh vs. datawarehouse

Data mesh
Datawarehouse
Kernconcept
Gedistribueerde dataproducten beheerd door domeinen
Gecentraliseerde, gestructureerde repository voor analytics
Focus
Schaalbaarheid, flexibiliteit en gedecentraliseerde governance
Krachtige query's en BI-rapportage
Beste voor
Complexe organisaties met diverse, snel veranderende databehoeften
Bedrijven met hoofdzakelijk gestructureerde data en gestandaardiseerde rapportage
Wanneer kiezen
Wanneer flexibiliteit, domeineigendom en interoperabiliteit cruciaal zijn
Wanneer consistente, historische rapportage en compliance topprioriteiten zijn

Data mesh vs. data fabric

Data mesh
Datastructuur
Kernconcept
Gedecentraliseerd, domeingestuurd data-eigendom
Centrale integratielaag voor datatoegang
Focus
Organisatiemodel voor schaalbaarheid en autonomie
Technologiegestuurde connectiviteit en automatisering
Beste voor
Grote organisaties met complexe domeinstructuren
Bedrijven die behoefte hebben aan uniforme toegang in verschillende silo's
Wanneer kiezen
Wanneer flexibiliteit, domeinverantwoordelijkheid en data-as-a-product prioriteiten zijn
Wanneer naadloze integratie en automatisering in hybride omgevingen het belangrijkste doel is

Implementatie van data mesh

De implementatie van een data mesh vereist een strategische aanpak die decentralisatie in evenwicht brengt met gedeelde normen. Hier zijn de belangrijkste stappen van de data mesh:

  1. Identificeer pilotdomeinen: begin klein door twee of drie domeinen te selecteren met duidelijke bedrijfswaarde en een sterke maturiteit van data. Deze teams zullen dienen als early adopters, waarbij het data mesh model wordt bewezen voordat ze in de hele organisatie worden geschaald.
  2. Het platform opzetten: bouw een selfservicedataplatform dat algemene tools biedt voor het publiceren, ontdekken en gebruiken van dataproducten. Dit omvat datacatalogi, API's en geautomatiseerde beveiligingsfuncties om frictie voor domeinteams te verminderen.
  3. Definieer federatief bestuur: creëer governancebeleid dat wereldwijde normen voor beveiliging, compliance en interoperabiliteit afdwingt en tegelijkertijd autonomie van domeinen mogelijk maakt. Governance moet duidelijke rollen, definities van dataproducten en kwaliteitsverwachtingen omvatten.

Anti-patronen om te vermijden

Wanneer data mesh verkeerd wordt gedaan door natuurlijke organisatiepatronen niet te volgen, kan het leiden tot verwarring en onenigheid. Een anti-patroon in data mesh is een terugkerende aanpak of praktijk die nuttig lijkt maar uiteindelijk de kernprincipes van de architectuur ondermijnt. Anti-patronen om te vermijden omvatten:

Vijf best practices voor data mesh

  1. Begin klein en itereer: Gebruik pilotdomeinen om processen te verfijnen alvorens te schalen.
  2. Data als een product behandelen: definieer eigenaarschap, SLA's en bruikbaarheidsstandaarden voor elke dataset.
  3. Investeer in gedeelde tools: Maak publicatie en ontdekking gemakkelijk voor domeinteams.
  4. Integreer governance in een vroeg stadium: breng autonomie en compliance vanaf het begin in evenwicht.
  5. Focus op bedrijfsresultaten: stem dataproducten af op meetbare waarde, niet alleen op technische doelen.

Door domeineigendom, een robuust platform en federatief bestuur te combineren, kunnen organisaties flexibiliteit, vertrouwen en domeinoverkoepelende samenwerking verbeteren, zonder de knelpunten van traditionele gecentraliseerde modellen.

Meting en metrieken

Voor het evalueren van succes zijn data mesh meetwaarden nodig die technische prestaties in evenwicht brengen met bedrijfsresultaten. Deze meetwaarden kunnen het volgende omvatten:

Samen bieden deze meetwaarden richtinggevend inzicht in de vraag of data mesh flexibiliteit, vertrouwen en schaalbaarheid biedt zonder one-size-fits-all benchmarks te hanteren.

Veelgestelde vragen over data mesh

Wat is datademocratisering?
Bij datademocratisering draait het om het oplossen van de data-uitdagingen waarmee mensen in hun dagelijkse werk worden geconfronteerd. Data mesh ondersteunt dit door eigendom te decentraliseren naar bedrijfsdomeinen, zodat data worden beheerd door degenen die het dichtst bij hun context staan, en door een selfserviceplatform te bieden dat het publiceren, ontdekken en gebruiken van gegevensproducten eenvoudiger maakt. Meer informatie over de definitie, principes en hoe werknemers zich op hun gemak kunnen voelen bij het stellen van datagerelateerde vragen en het krijgen van antwoorden vind je in deze blog.
Wat is interoperabiliteit?

Interoperabiliteit wordt gedefinieerd als het vermogen van een systeem of product om zonder bijzondere inspanning van de gebruiker met andere systemen of producten te werken. Techtarget voegt eraan toe dat het organisaties helpt een hogere efficiëntie en een holistischer beeld van informatie en data te bereiken. Voor meer gedetailleerde informatie, deze Open MOOC les biedt de basisprincipes van data-interoperabiliteit, evenals de verschillende soorten en lagen van interoperabiliteit van data.

In de context van data gaat interoperabiliteit verder dan eenvoudige connectiviteit, inclusief vindbaarheid (het gemakkelijk vinden van dataproducten over verschillende domeinen via catalogi of registers), contracten (duidelijke, machineleesbare overeenkomsten over dataschema's, API's en SLA's om consistent gebruik te helpen garanderen) en gedeelde normen (gemeenschappelijke governance, metagegevens en beveiligingspraktijken voor frictionless gegevensuitwisseling tussen domeinen).

Een voorbeeld van interoperabiliteit is wanneer het domein Klant een dataproduct publiceert met klantprofielen, waarna het domein Verkoop deze data gebruikt om pijplijnanalyses te verrijken. Interoperabiliteit zorgt ervoor dat het verkoopteam het klantdataproduct in een catalogus kan ontdekken, op zijn contract voor schema- en kwaliteitsgaranties kan vertrouwen en het kan integreren met behulp van gedeelde standaarden zonder handmatig werk.

Wat is het verschil tussen data mesh en data fabric?

Data mesh en data fabric zijn verschillende architecturale benaderingen binnen de datamanagementstrategie van een bedrijf.

Data fabric is een technocentrische aanpak die steeds meer naadloze manieren probeert te vinden om complexe metadata en ongestructureerde informatie te beheren door AI, machine learning en geavanceerde analytics samen te voegen. Data mesh daarentegen is, hoewel afhankelijk van alle technologische ontwikkelingen binnen de data fabric, meer gericht op het integreren van datamanagementprocessen met de menselijke gebruikers die ervan afhankelijk zijn, en op het vinden van manieren om vanuit het perspectief van de gebruiker de toegang tot data en de bruikbaarheid ervan te stroomlijnen en te vereenvoudigen.

Er is iets van een kippen-en-ei-relatie tussen data mesh en data fabric: er zijn steeds meer technologieën voor datastructuur nodig om datamanagement te kunnen ontwikkelen met de snelheid die het nodig heeft. Zonder een begeleidende evolutie van menselijke processen en organisatiestrategieën zullen mensen echter niet in staat zijn om de geavanceerde technologieën voor data fabric naar behoren te benutten. Net zoals DOS en complexe interfaces plaatsvonden voor de meer naadloze computerbesturingssystemen waar we vandaag de dag van genieten, zullen data mesh- en data fabric-architecturen steeds meer naadloos op elkaar aansluiten naarmate deze processen en technologieën zich verder ontwikkelen.

Welk probleem lost data mesh op?
Data mesh lost het probleem van knelpunten op die door gecentraliseerde datateams zijn gecreëerd, versnelt de tijd tot inzicht en maakt schaalbaarheid mogelijk. Traditionele modellen concentreren dataownership en -verwerking in één team, wat leidt tot vertragingen en minder flexibiliteit. Data mesh pakt dit aan door vier principes toe te passen: domeineigendom, data as a product, een selfservice dataplatform en federated governance. Samen decentraliseren de beginselen van data mesh de verantwoordelijkheid, verbeteren ze de toegankelijkheid en versnellen ze de besluitvorming.
Is data mesh een technologie of een operationeel model?
Data mesh is een werkmodel, niet één technologie of gereedschap. Het is een manier om te organiseren hoe teams met data werken door eigendom te decentraliseren naar bedrijfsdomeinen en data als een product te behandelen. Het data mesh-model wordt ondersteund door gedeelde platformfuncties, zoals selfservice-infrastructuur, datacatalogi en governancetools, waarmee teams data effectief kunnen publiceren, delen en beheren. In plaats van bestaande technologieën te vervangen, biedt data mesh een framework voor het opschalen van data in een hele organisatie zonder knelpunten in gecentraliseerde teams te creëren.