Hvad er datamasse?

Datamasse er en tilgang til datastyring, der anvender en distribueret arkitektonisk ramme.

Datamaskeoversigt

Data mesh repræsenterer en ny måde at se på information. Det er født af det voksende koncept, at data faktisk selv er et produkt, et værktøj, et middel til en ende – ikke bare noget, virksomheder samler og analyserer senere i et bagudskuende forsøg på at forstå ting, der allerede er sket.

Datamaskedefinition

Datamasse er en tilgang til datastyring, der anvender en distribueret arkitektonisk ramme. Med andre ord: det spreder ejerskab og ansvar for specifikke datasæt på tværs af virksomheden, til de brugere, der har den specialiserede ekspertise til at forstå, hvad disse data betyder, og hvordan man udnytter dem bedst muligt.

 

Data mesh arkitektur forbinder og trækker data fra forskellige kilder som data søer og lagre og distribuerer de relevante datasæt til de relevante menneskelige eksperter og domæneteam på tværs af virksomheden. I bund og grund sorteres og distribueres en voluminøs maengde data i en central datasø i håndterbare bidder til dem, der er bedst egnet til at forstå og udnytte den.

placeholder

 

 

Datamaskeprincipper for udfordringer med datasø

Når vi taler om data søer og data mesh, taler vi i bund og grund om Big Data. Hvad der gør data "Big" er ikke blot dens enorme volumen. Blandt andre kriterier defineres Big Data også ved at være kompleks, variabel, hurtigt genereret og ustruktureret.


En lineær database er som et regneark: Den har kolonner og rækker og uforanderlige kategorier, som alle datakomponenter skal passe ind i. Nogle af de data, der genereres fra maskiner, sensorer og industrielle kilder, er struktureret og passer pænt ind i en lineær database. Uanset hvor meget datavolumen du skal håndtere, hvis den er 100% struktureret, opfylder den ikke Big Data-kriterierne og kan placeres i en lineær database, hvilket gør det relativt ligetil at filtrere og udtrække.

 

Men i stigende grad, moderne Big Data er ustruktureret og består af visuelle komponenter, åben tekst, og endda video og rige medier. Disse vigtige data kan bestå af tusindvis af terabyte oplysninger for mange virksomheder, og det kan simpelthen ikke gemmes i en standard lineær database.

 

Indtast datasøen. I takt med at Big Data-mængderne begyndte at stige, blev datalagre udviklet som et sted, hvor komplekse data kunne lagres i og tilgås fra et centralt lager i dets rå format. Mens datalagre udgør en fremragende løsning på Big Data-problemet, har de ikke desto mindre svagheder. Datasøgene mangler visse analytiske funktioner, hvilket gør dem afhængige af andre tjenester til hentning, indeksering, transformation, forespørgsler og analysefunktioner. Og set ud fra en virksomhedsledelses synspunkt frembyder datalagre også tre yderligere udfordringer:

 

1. Kompleks ejerskab Ejerskab i data søer er kompleks at definere, når for mange spillere genererer og får adgang til data. I mangel af klart definerede roller og ansvarsområder kan de samme datasæt forvaltes forskelligt af forskellige parter, hvilket skaber uoverensstemmelser, der gør det vanskeligt at bruge. På samme måde bliver andre data forsømt, når de ikke forvaltes aktivt af dem, der i sidste ende vil bruge dem. Data mesh arkitektur sikrer , at data governance er klart fordelt efter domæne, så hvert team eller domæne ekspert styrer de data, de producerer og bruger. Til at understøtte dette bruger datamængder også en sammensluttet styringsstruktur for også at give mulighed for central kontrol med datamodellering, sikkerhedspolitikker og overholdelse.

 

2. Datakvalitet Dataløsninger kan ikke sikre datakvalitet, når datamængden bliver for stor, eller når centrale dataansvarlige ikke selv forstår det. Data mesh arkitektur grundlæggende behandler data som et værdifuldt produkt, hvilket sætter kvaliteten og fuldstændigheden af data på forkant med datastyring. Formodentlig kender hvert hold de vigtigste kriterier og spørgsmål, som de ønsker at ekstrapolere fra de data, de indsamler. Ved at integrere disse kriterier og prioriteter i arkitekturen kan datamaskinen bidrage til at sikre kontinuerlig og prioriteret levering af rene, friske og fuldstændige data, selv når større datasæt er involveret. Og når maskinindlæringsalgoritmer anvendes, bliver disse kriterier og resulterende datasæt naturligvis stadig mere nøjagtige og nyttige over tid.

 

3. Flaskehalse Dataløsninger kan skabe flaskehalse på grund af deres centraliserede arkitektur og traditionelt vanskelige dataopsamlingsprocesser og protokoller. Det betyder typisk, at kontrollen med en stor mængde konsoliderede data kommer ned til et enkelt IT eller data management team. Og i takt med at datamængden (og behovet for at hente dem) stiger, bliver disse it-teams overbeskattet.

 

Desuden skal dataene gennemgås og struktureres korrekt for at sikre overholdelse og overholdelse af principperne for dataforvaltning. Når der opstår et unødigt pres, kan der være en tendens til at haste igennem disse compliance-faser, hvilket skaber potentiel risiko og tab for virksomheden. Data mesh arkitektur på den anden side giver adgang og kontrol til autoriserede specialiserede brugere, der har en større interesse i data - alt imens der anvendes strenge, bagte sikkerhedsprotokoller.

 

 

Data mesh principper opstod som en direkte reaktion på disse voksende data lake udfordringer. Decentraliseret og demokratiseret datastyringsarkitektur har gjort virksomheder smartere, mere agile og mere præcise ved at sikre, at de rigtige data er umiddelbart tilgængelige for de rigtige mennesker, uanset hvor og hvornår de har brug for det. Data mesh gør data som et produkt til en reel virkelighed, reducerer barrierer og prioriterer værdien af information, så teams kan få hurtigere, uhindret adgang til vigtige data.

Datamaskearkitektur forklaret

Vi har diskuteret, hvordan datamaskine er en decentraliseret form for dataarkitektur, der behandler data som et vigtigt virksomhedsstyringsværktøj. Og det er vigtigt, at uafhængige teams er ansvarlige for at håndtere dataene inden for deres arbejdsområder og ekspertise, samtidig med at de sikrer overholdelse af centralt fastlagte datastyringspraksisser. Denne ændring i tankegangen er kernen i datamaengden.

 

For bedre at forstå, hvordan dette opnås, kan vi se data mesh arkitekturen som har tre hovedkomponenter:

 

1. Datakilder repræsenterer lageret (som en datasø), som de primære rådata fodres med. Uanset om det er indsamlet fra cloud IIoT-netværk, kundefeedbackformularer eller skrabede webdata, er dette de rå inputdata, der vil blive refereret og behandlet efter behov af brugere på tværs af netværket. Mens en datasømetode vil indsnævre alle disse data til ét centralt sted, fordeler datametodologien i stedet ansvaret for indtagelse, lagring, behandling og udvinding af disse rådata inden for en række ansvarlige domæner.

 

2. Data mesh infrastruktur betyder, at disse oplysninger ikke kun er isoleret inden for de enkelte afdelingers domæner, men også kan deles efter behag på tværs af organisationens operationelle netværk, samtidig med at de overholder etablerede retningslinjer for datastyring. Dette er et direkte resultat af to af de centrale søjler i datamaskinen: En selvbetjent dataplatform og fødereret styring. Den selvbetjeningsdataplatform leverer de værktøjer og den infrastruktur, der er nødvendig for hvert domæne til universelt at indtage, transformere, behandle og betjene deres data. I mellemtiden sikrer de fødererede forvaltningsprincipper standardisering på tværs af en organisation, hvilket giver mulighed for ubesværet interoperabilitet af data mellem alle domæneteams.

 

3. Dataejere er den sidste komponent i en datamasse og er ansvarlige for at anvende compliance-, governance- og kategoriseringsprotokollerne for deres afdelingers data. For eksempel skal HR-filer gemmes ved hjælp af visse sikkerhedsprotokoller, de må ikke bruges til dette eller det formål, de må kun frigives til such-og-sådan en person. Hver afdeling vil naturligvis have kategorier og typer af data, der er unikke for deres afdeling eller formål. I et dataslagssystem skal it-teams tage fat i alle disse forskellige protokoller og kategorier for alle de forskellige dataejere, der har dumpet ting i søen. Hvor data mesh arkitektur giver domæneejere fuld autoritet og kontrol over disse spørgsmål, fordi igen, der bedre end emne område eksperter til at forvalte deres egne data og sikre, at det opfylder kvalitetsstandarder.

placeholder

Data mesh i praksis: Hvem bruger det og hvorfor

For at datastyringsløsninger kan udvikle sig og blive mere succesfulde, skal de være anvendelige og relevante for en lang række applikationer og operationer. I takt med at data mesh arkitekturen og brugervenligheden forbedres, ser vi en øget vifte af forretningsfunktioner, der kan forbedres med en sikker og distribueret tilgang til data som et produkt og et værktøj.

 

Her er nogle almindelige business use cases:

  • Salg: For salgsteams handler det om at erhverve, pleje og lukke leads. Jo mere tid dine salgsteammedlemmer bruger på deres skriveborde til at udføre administrative opgaver, jo mindre tid har de til at opbygge relationer med nye kunder. Med data mesh arkitektur, salgsteams brugere behøver ikke at være data management og hente eksperter for at have de mest kraftfulde og relevante datasæt og kombinationer lige ved hånden. Når salgsafdelingerne har alle de rigtige data at analysere, omsættes de til mere handlingsrettede indsigter og strategier.

  • Forsyningskæde og logistik: Moderne forsyningskæder er sårbare over for en lang række afbrydelser. En konkurrencemæssig fordel kommer, når virksomheder kan dreje hurtigt og reagere på både trusler og muligheder med lige smidighed. Dagens globale forsyningskædedata kommer hurtigt og tykt – fra kundefeedback til IIoT-netværk og digitale tvillinger. Når erfarne og dygtige forsyningskædechefer selv er i stand til at kuratere og bore i et af disse datasæt i realtid, får virksomhederne en stærk kilde til indsigt og indsigt.

  • Produktion: Som en del af forsyningskæden er en virksomheds produktionsaktiviteter lige så sårbare over for hurtige markedsændringer og ustabile kundebehov. Tidligere skulle design- og F&U-teams stole på historiske kundedata, som de fik fra andre afdelinger. I dag bringer datamaskinen direkte dataadgang til brugere bag redaktionstabellen, på R&D og testteams og hele vejen til produktionsgulvet. Real-time kunde feedback kan informere produktudvikling på et øjeblik, og opdateret intel fra IIoT netværk og digitale simuleringer kan hjælpe fabrikker køre sikrere, hurtigere og mere effektivt.

  • Marketing: I dag former kundernes krav og forventninger fremtiden og ændrer sig og vokser i et hidtil uset tempo. Et enkelt mærke har typisk utallige forbrugerberøringspunkter på tværs af sociale medier, målrettede digitale annoncer og online og omnichannel indkøbsportaler. Det nuværende marked ser det voksende ønske om hurtig tilpasning, kortere produktlivscyklus og enorme valg- og konkurrenceniveauer. For at forstå og udnytte disse tendenser skal moderne marketingfolk have realtidsadgang og samtidig adgang til en lang række datasæt. Det har tidligere betydet, at man har bedt om (og afventet) disse data fra andre afdelinger. Med en opsætning af datamasken kan marketingfolk dog kuratere og få adgang til disse data i øjeblikket på deres egne betingelser.

  • Personale: HR-teams skal håndtere store mængder af ekstremt komplekse og følsomme data. Og med den stigende tendens til fjerntliggende og hybride arbejdspladser bliver disse data mere komplicerede og geografisk forskelligartede hver dag. For ikke at nævne det stadigt skiftende sæt af compliance og juridiske spørgsmål, som HR-teams så hurtigt skal holde sig på toppen af. Fra ansættelse til pensionering skal HR-ledere være i stand til at validere, vurdere og analysere nogle af de mest vidt forskellige datasæt i alle firmaer. Data mesh arkitektur giver mulighed for passende sikkerhedsprotokoller og tæt begrænset adgang – samtidig med at det gør det muligt for autoriserede HR-brugere at få adgang til data og information hurtigt og uden afhængighed af komplekse interne protokoller og flere afdelinger bureaukrati.

  • Finans: Som med HR, Finans og regnskabsteams er også ansvarlige for enormt afgørende og følsomme data. Moderne ERP-systemer revolutionerer økonomi ved hjælp af in-memory-databaseteknologi til at tilpasse opdaterede rapporter, analyser og fremskrivninger. Men selv når finansteams anvender de bedste databaser og ERP'er, støder de stadig på forhindringer, fordi de er plaget af langvarige og stive kulturer, tunge siloer og bureaukratiske, gammeldags processer. Data mesh arkitektur bringer et grundlæggende skift i, hvordan finansdata ser på og forvaltes – og kan endda ryste op stillestående tænkning, der kan ske, når teams har mulighed for at eje og revidere deres egne aldrende dataprocesser.

Det er klart, at datamasken ikke bare er endnu et buzzword og er en datastrategitrend, der skal tages alvorligt. Virksomheder i alle størrelser og brancher bruger datamasse og leder efter måder at bruge data på til at skabe indsigt og værdi.

Fordele ved datamasse

Tidligere har legacy-databaser og begrænsede datahåndteringsinfrastrukturer bidraget til, at data er noget, der skal opbevares i en enkelt vaeg og udmåles efter nogle få datamanagerers skøn. Nu er data det brændstof, der driver din virksomhed, og det bør gives frit til de fagspecialister, der bedst ved, hvordan man får det til at fungere og drive profit i konkurrenceprægede tider.

 

De vigtigste fordele ved data mesh arkitektur kan opsummeres som:

  • Øget datatilgængelighed. Data mesh sikrer, at alle de rigtige mennesker i hele din organisation kan få adgang til de data, de har brug for – for at være de absolut bedste til deres job.

  • Forbedrede analysefunktioner. Når data ses som et produkt, der skal bruges hver dag, begynder teams at tage en data-first tilgang til planlægning og strategi. Dette fører til færre fejl og en mere objektiv, mindre meningsbaseret tilgang til forretningsudvikling.

  • Brugerdefinerbare datapirpelines og -processer. Mange af de bedste og potentielt mest rentable projekter bliver lagt på hylden på grund af det enorme besvær med at kuratere de unikke og tilpassede datasæt, der er nødvendige for at opnå succes. Med en datamasse kan teams hurtigt få adgang til og teste nye projektmodeller uden det traditionelle tab af tid eller ressourcer.

  • Flaskehalse kan reduceres. Det er en oplagt sejr/gevinst for både it-teams og dataejere. Ved at reducere en kilde til frustration og irritation kan virksomheder desuden være med til at nedbryde siloer, der står i vejen for en sund forretningsudvikling.

  • Reduceret belastning af centrale datastyringsteams. Det betyder ikke kun at reducere efterslæb og frustration, men også at frigøre utallige timer for dine talentfulde it-teams til at afsætte til mere specialiserede, interessante og rentable aktiviteter.

Data Mesh ofte stillede spørgsmål

I sin kerne handler datademokratisering om at løse de dataudfordringer, som folk står over for i deres daglige arbejde. Flere detaljer om definitionen, principperne og hvordan man kan hjælpe medarbejdere med at føle sig trygge ved at stille datarelaterede spørgsmål og få svar er angivet i denne blog.

Interoperabilitet defineres som et systems eller et produkts evne til at arbejde med andre systemer eller produkter uden særlig indsats fra brugerens side. Techtarget tilføjer, at det hjælper organisationer med at opnå højere effektivitet og et mere holistisk syn på information og data. For mere detaljerede oplysninger giver denne Open MOOC lektion det grundlæggende i datainteroperabilitet samt de forskellige typer og lag af interoperabilitet af data.

 

Data mesh og data stof er forskellige arkitektoniske tilgange inden for en virksomheds data management strategi.

 

Datamateriale er en technocentrisk tilgang, der søger at finde stadig mere problemfri måder at administrere komplekse metadata og ustruktureret information ved at flette AI, machine learning og avancerede analyser. Datamaterialet er på den anden side mere fokuseret på at integrere datastyringsprocesser med de menneskelige brugere, der er afhængige af dem – og finde måder at strømline og forenkle dataadgang og anvendelighed ud fra et personperspektiv.

 

Der er noget af et kyllinge- og æggeforhold mellem datamasse og datamateriale: Der er brug for stadigt fremskredne datastofteknologier, hvis datastyringen skal udvikle sig så hurtigt, det skal. Men uden en ledsagende udvikling i menneskelige processer og organisatoriske strategier vil folk ikke være i stand til at udnytte de fremadskridende datastofteknologier ordentligt. Ligesom DOS og komplekse grænseflader gav plads til de mere problemfrie computeroperativsystemer, vi nyder godt af i dag, er arkitekturer af datamaskiner og datastoffer bestemt til at vokse sig mere og mere problemfri, efterhånden som disse processer og teknologier skrider frem.

placeholder

SAP's data- og analyseløsninger

Identificere, analysere og transformere de mest relevante data på tværs af din virksomhed.

placeholder

Ideer, du ikke finder andre steder

Tilmeld dig en dosis business intelligence leveret direkte i din indbakke.

twitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixel