Hvad er et datawarehouse?

Et datawarehouse (DW) er et digitalt lagringssystem, der forbinder og harmoniserer store mængder data fra mange forskellige kilder.

Datalageroversigt

Et datawarehouse (DW) er et digitalt lagringssystem, der forbinder og harmoniserer store mængder data fra mange forskellige kilder. Formålet er at fodre business intelligence (BI), rapportering og analyser og understøtte myndighedskrav – så virksomheder kan omsætte deres data til indsigt og træffe intelligente, datadrevne beslutninger. Datalagre gemmer aktuelle og historiske data på ét sted og fungerer som en enkelt sandhedskilde for en organisation.

 

Data strømmer ind i et datawarehouse fra driftssystemer (som ERP og CRM), databaser og eksterne kilder såsom partnersystemer, Internet of Things (IoT)-enheder, vejrapps og sociale medier – som regel på en almindelig kadence. Fremkomsten af cloud computing har forårsaget et skift i landskabet. I de seneste år er datalagringslokationer flyttet væk fra traditionel on-premise-infrastruktur til flere lokationer, herunder on-premise, privat cloud og offentlig cloud.

 

Moderne datalagre er designet til at håndtere både strukturerede og ustrukturerede data, som videoer, billedfiler og sensordata. Nogle udnytter integreret analyse- og in-memory-databaseteknologi (som indeholder datasættet i computerhukommelsen i stedet for i disklager) for at give adgang i realtid til pålidelige data og sikre beslutningstagning. Uden datalagring er det meget svært at kombinere data fra heterogene kilder, sikre, at de er i det rigtige format til analyse, og få både en aktuel og lang række af data over tid.

Hvad er et datawarehouse?

Fordele ved datalagring

Et veldesignet datawarehouse er grundlaget for ethvert succesfuldt BI-- eller analyseprogram. Dens vigtigste opgave er at drive de rapporter, dashboards og analytiske værktøjer, der er blevet uundværlige for virksomheder i dag. Et datawarehouse giver oplysninger til dine datadrevne beslutninger – og hjælper dig med at foretage det rigtige kald på alt fra ny produktudvikling til lagerniveauer. Der er mange fordele ved et datawarehouse. Her er blot nogle få: 

  • Bedre forretningsanalyser: Med datalagring har beslutningstagere adgang til data fra flere kilder og behøver ikke længere at træffe beslutninger baseret på ufuldstændige oplysninger.  

  • Hurtigere forespørgsler: Datalagre er bygget specielt til hurtig datahentning og analyse. Med en DW, kan du meget hurtigt forespørge store mængder konsoliderede data med lidt til ingen støtte fra IT.  

  • Forbedret datakvalitet: Før data indlæses i DW, oprettes dataoprydningstilfælde af systemet og registreres i en arbejdsliste til videre behandling, hvilket sikrer, at data omdannes til et konsistent format til at understøtte analyser – og beslutninger – baseret på høj kvalitet, nøjagtige data.

  • Historisk indsigt: Ved at lagre rige historiske data giver et datawarehouse beslutningstagere mulighed for at lære af tidligere tendenser og udfordringer, lave forudsigelser og drive løbende forretningsforbedringer.

placeholder

Datawarehouse skærmbillede, der viser dataoprindelse.

Hvad kan et datawarehouse gemme?

Da datalagre først blev populaere i slutningen af 1980'erne, blev de designet til at gemme oplysninger om mennesker, produkter og transaktioner. Disse data – kaldet strukturerede data – var pænt organiseret og formateret for nem adgang. Virksomhederne ønskede dog snart at gemme, hente og analysere ustrukturerede data – såsom dokumenter, billeder, videoer, e-mails, indlæg på sociale medier og rå data fra maskinsensorer.

 

Et moderne datawarehouse kan rumme både strukturerede og ustrukturerede data. Ved at sammenlægge disse datatyper og nedbryde siloer mellem de to, kan virksomheder få et komplet, omfattende billede for den mest værdifulde indsigt.

Nogle nøgleord

Der er masser af termer at give mening med i DW's verden. Her er nogle af de vigtigste. Udforsk nogle andre termer og ofte stillede spørgsmål i vores ordliste.

 

Datawarehouse vs. database

 

Databaser og datalagre er begge datalagringssystemer, men de tjener forskellige formål. En database gemmer som regel data for et bestemt forretningsområde. Et datawarehouse lagrer aktuelle og historiske data for hele virksomheden og feeds BI og analyser. Datalagre bruger en databaseserver til at hente data ind fra en organisations databaser og har yderligere funktioner til datamodellering, styring af dataløbetid, datakildeintegration og meget mere.

 

Datawarehouse vs. data lake

 

Både datalagre og datalag bruges til lagring af Big Data, men det er meget forskellige lagringssystemer. Et datawarehouse gemmer data, der er blevet formateret til et bestemt formål, hvorimod en datasø gemmer data i sin rå, ubehandlede tilstand – hvis formål endnu ikke er defineret. Datalagre og søer supplerer ofte hinanden. Når rådata, der er gemt i en sø, f.eks. er nødvendige for at besvare et forretningsspørgsmål, kan de udtrækkes, renses, transformeres og bruges i et datalager til analyse. Mængden af data, databaseperformance og lagerpriser spiller en vigtig rolle, når du skal vælge den rigtige lagerløsning.

Diagram over et Data Warehouse sammenlignet med en data lake.

Datawarehouse vs. datamart

 

Et datamarked er en underafdeling af et datawarehouse, der er opdelt specifikt til en afdeling eller branche – f.eks. salg, marketing eller økonomi. Nogle data marts er også oprettet til selvstændige driftsformål. Mens et datalager fungerer som det centrale dataarkiv for en hel virksomhed, leverer et datamarked relevante data til en udvalgt gruppe af brugere. Dette forenkler dataadgang, fremskynder analyse og giver dem kontrol over deres egne data. Flere datamarkeder implementeres ofte i et datawarehouse.

Diagram over en datamat, og hvordan den virker.

Hvad er nøglekomponenterne i et datawarehouse?

Et typisk datawarehouse har fire hovedkomponenter: en central database, ETL-værktøjer (udtræk, transformation, belastning), metadata og adgangsværktøjer. Alle disse komponenter er udviklet til hastighed, så du kan få resultater hurtigt og analysere data på farten.

Diagram, der viser komponenterne i et datalager.

  1. Central database: En database fungerer som grundlaget for dit datawarehouse. Traditionelt har disse været standard relationelle databaser, der kører på stedet eller i skyen. Men på grund af Big Data, behovet for ægte, real-time ydeevne, og en drastisk reduktion i omkostningerne ved RAM, in-memory databaser er hurtigt ved at vinde i popularitet.
  2. Dataintegration: Data hentes fra kildesystemer og ændres for at tilpasse oplysningerne til hurtigt analytisk forbrug ved hjælp af en række dataintegrationsmetoder såsom ETL (udtræk, transformation, belastning) og ELT samt realtidsdatareplikering, bulk-load-behandling, datatransformation og datakvalitets- og forbedringstjenester.
  3. Metadata: Metadata er data om dine data. Den angiver kilde, anvendelse, værdier og andre funktioner i datasættene i dit datawarehouse. Der er forretningsmetadata, som tilføjer kontekst til dine data, og tekniske metadata, som beskriver, hvordan du får adgang til data – herunder hvor de befinder sig, og hvordan de er struktureret.
  4. Adgangsværktøjer til datawarehouse: Adgangsværktøjer giver brugerne mulighed for at interagere med data i dit datawarehouse. Eksempler på adgangsværktøjer omfatter: forespørgsels- og rapporteringsværktøjer, applikationsudviklingsværktøjer, data mining-værktøjer og OLAP-værktøjer.

Datawarehouse arkitektur

Tidligere opererede datalagre i lag, der matchede strømmen af forretningsdata.

Diagram over data warehouse-arkitektur. Et typisk datawarehouse indeholder de tre separate lag ovenfor. I dag kombinerer moderne datalagre OLTP og OLAP i et enkelt system.

  • Datalag: Data udtrækkes fra dine kilder og transformeres og indlæses derefter i det nederste niveau ved hjælp af ETL-værktøjer. Det nederste niveau består af din database server, data marts, og data søer. Metadata oprettes på dette niveau – og dataintegrationsværktøjer, som f.eks. datavirtualisering, bruges til problemfrit at kombinere og aggregere data.

  • Semantisk lag: OLTP-servere (online analytisk behandling) og onlinetransaktionsbehandlingsservere (OLTP) omstrukturerer dataene til hurtige, komplekse forespørgsler og analyser.

  • Analyselag: Det øverste niveau er frontend-klientlaget. Den indeholder data warehouse-adgangsværktøjerne, der giver brugerne mulighed for at interagere med data, oprette dashboards og rapporter, overvåge KPI'er, mine og analysere data, build-apps og meget mere. Dette niveau omfatter ofte et arbejdsområde eller et sandkasseområde til dataudforskning og udvikling af nye datamodeller.

Datalagre er designet til at understøtte beslutningstagning og er primært bygget og vedligeholdt af it-teams, men i løbet af de seneste par år har de udviklet sig til at styrke forretningsbrugere – hvilket reducerer deres afhængighed af it for at få adgang til dataene og udlede handlingsrettede indsigter. Nogle få vigtige datalagringsfunktioner, der har styrket forretningsbrugere, er:

  1. Det semantiske lag eller forretningslaget, der indeholder naturlige sprogudtryk og giver alle mulighed for øjeblikkeligt at forstå data, definere relationer mellem elementer i datamodellen og supplere datafelter med nye forretningsoplysninger.
  2. Virtuelle arbejdsområder giver teams mulighed for at bringe datamodeller og forbindelser ind på ét sikkert og styret sted, der understøtter bedre samarbejde med kolleger gennem et fælles område og et fælles datasæt.
  3. Cloud har forbedret beslutningstagningen yderligere ved globalt at give medarbejderne et omfattende sæt værktøjer og funktioner, så de nemt kan udføre dataanalyseopgaver. De kan forbinde nye apps og datakilder uden megen it-support.

Top syv fordele ved et cloud-datawarehouse

Cloud-baserede datalagre stiger i popularitet – med god grund. Disse moderne lagre tilbyder flere fordele i forhold til traditionelle, on-premise versioner. Her er de syv største fordele ved et cloud-datawarehouse:

  1. Hurtig at implementere: Med cloud-datalagring kan du købe næsten ubegrænset computerkraft og datalagring med få klik – og du kan bygge dit eget datawarehouse, data marts og sandkasser fra hvor som helst, på få minutter.
  2. Lave samlede ejeromkostninger (TCO): Data warehouse-as-a-service (DWaaS) prisfastsættelsesmodeller er sat op, så du kun betaler for de ressourcer, du har brug for, når du har brug for dem. Du behøver ikke at forudsige dine langsigtede behov eller betale for mere beregning i løbet af året end nødvendigt. Du kan også undgå startomkostninger som dyrt hardware, serverrum og vedligeholdelsespersonale. Adskillelse af lagerpriser fra computerpriserne giver dig også en måde at drive omkostningerne ned på.
  3. Elasticitet: Med et cloud-datalager kan du dynamisk skalere op eller ned efter behov. Cloud giver os et virtualiseret, meget distribueret miljø, der kan håndtere enorme mængder af data, der kan skalere op og ned.
  4. Sikkerhed og katastrofeberedskab: I mange tilfælde giver cloud-datalagre faktisk større datasikkerhed og kryptering end on-premise DW'er. Data bliver også automatisk duplikeret og sikkerhedskopieret, så du kan minimere risikoen for tabte data.
  5. Realtidsteknologier: Cloud-datalagre, der er bygget på in-memory-databaseteknologi, kan levere ekstremt hurtige databehandlingshastigheder for at levere realtidsdata til øjeblikkelig situationsbevidsthed.
  6. Nye teknologier: Cloud data warehouses giver dig mulighed for nemt at integrere nye teknologier som maskinindlæring, hvilket kan give en guidet oplevelse for forretningsbrugere og beslutningssupport i form af anbefalede spørgsmål at stille, som et eksempel.
  7. Styrk forretningsbrugere: Cloud data warehouses giver medarbejderne mulighed for på lige fod og globalt med en enkelt visning af data fra mange kilder og et omfattende sæt værktøjer og funktioner til nemt at udføre dataanalyseopgaver. De kan forbinde nye apps og datakilder uden it.
placeholder

Datalagring understøtter omfattende analyser af firmaudgifter efter afdeling, leverandører, region og status for at nævne nogle få.

Bedste fremgangsmåder for datalagring

Når du bygger et nyt datawarehouse eller tilføjer nye applikationer til et eksisterende lager, er der dokumenterede trin til at nå dine mål, samtidig med at du sparer tid og penge. Nogle er fokuseret på din virksomheds brug, og andre praksisser er en del af dit overordnede it-program. Følgende liste er et godt udgangspunkt, og du vil hente yderligere best practice, når du arbejder med dine teknologi- og servicepartnere. 

Business Best Practices

  • Definer de oplysninger, du har brug for. Når du har en god forståelse af dine oprindelige behov, kan du finde de datakilder, der understøtter dem. Ofte vil faggrupper, kunder og leverandører have dataanbefalinger til dig.

  • Dokumentere placeringen, strukturen og kvaliteten af dine aktuelle data. Derefter kan du identificere datamangler og forretningsregler til at transformere dataene, så de opfylder dine lagerkrav.

  • Opbyg et team. Dette omfatter ledende sponsorer, ledere og medarbejdere, der vil bruge og levere oplysningerne. Identificer fx de standardrapporter og KPI'er, de skal bruge til at udføre deres job.

  • Prioriter dine data warehouse-applikationer. Vælg et eller to pilotprojekter, der har rimelige krav og god forretningsværdi.

  • Vælg en stærk datawarehouse teknologipartner. De skal have de implementeringstjenester og erfaring, der er nødvendige for dine projekter. Sørg for, at de understøtter dine implementeringsbehov, herunder både cloud-tjenester og lokale valgmuligheder.

  • Udvikle en god projektplan. Samarbejd med dit team om en realistisk plan og tidsplan, der understøtter kommunikation og statusrapportering.

IT Best Practices

  • Overvåg ydeevne og sikkerhed. Oplysningerne i dit datalager er værdifulde, men de skal være let tilgængelige for at give værdi til organisationen. Overvåg systembrugen omhyggeligt for at sikre, at ydelsesniveauerne er høje.

  • Vedligehold datakvalitetsstandarder, metadata, struktur og governance. Nye kilder til værdifulde data bliver rutinemæssigt tilgængelige, men de kræver konsistent styring som en del af et datalager. Følg procedurer for datarensning, definition af metadata og overholdelse af styringsstandarder.

  • Giv en agil arkitektur. Efterhånden som din virksomheds og forretningsenheders forbrug stiger, vil du opdage en bred vifte af data mart og lagerbehov. En fleksibel platform vil støtte dem langt bedre end et begrænset, restriktivt produkt.

  • Automatiser processer som fx vedligeholdelse. Ud over at tilføje værdi til Business Intelligence kan maskinindlæring automatisere tekniske styringsfunktioner for datawarehouse for at opretholde hastigheden og reducere driftsomkostningerne.

  • Brug skyen strategisk. Forretningsenheder og afdelinger har forskellige implementeringsbehov. Brug On-Premise-systemer, når det er nødvendigt, og udnyt cloud-datalagre for at få skalerbarhed, reducerede omkostninger og adgang til telefon og tablet.

Sammenfatning

Moderne datalagre og i stigende grad cloud-datalagre vil være en vigtig del af ethvert initiativ til digital transformation for moderselskaber og deres forretningsenheder. De udnytter de aktuelle forretningssystemer, især når du kombinerer data fra flere interne systemer med nye, vigtige oplysninger fra eksterne organisationer.

 

Dashboards, KPI'er, alarmer og rapportering understøtter chef-, ledelses- og personalekrav samt vigtige kunde- og leverandørbehov. Datalagre leverer også hurtig, kompleks datamining og analyser, og de forstyrrer ikke andre forretningssystemers ydeevne.

 

I betragtning af fleksibiliteten til at starte små og udvide efter behov, kan både virksomhedskontorer og forretningsenheder forbedre beslutningstagningen og bottom-line ydeevne med moderne data warehouse-teknologi.

Ofte stillede spørgsmål om datawarehouse

En data lake er et sted at gemme alle former for Big Data, uanset om det er strukturerede data fra forretningsapplikationer eller ustrukturerede data fra mobile apps, sociale medier eller Internet of Things (IoT) enheder. Da data lagres i sit naturlige format – struktureret, ustruktureret, semistruktureret eller binært – kan konvertering, normalisering eller anden behandling være nødvendig for at muliggøre analyser på tværs af flere datatyper. De fleste dataløsninger er cloud-baserede på grund af de store mængder data, de lagrer, behovet for højhastighedsforbindelser til distribuerede kilder og behovet for skalerbarhed.

ETL står for “ekstrakt, transformation og belastning.” Disse aktiviteter udgør tilsammen den proces, der anvendes til at hente data fra kilden og konvertere dem til et brugbart format – og derefter flytte dem til et datawarehouse eller et andet datalager. ETL er især nyttig på transaktionsdata, men mere avancerede værktøjer kan også administrere en række ustrukturerede datatyper.

En datamargin er et opdelt segment af et datawarehouse, der er orienteret mod et specifikt forretningsområde eller team, fx økonomi eller marketing. Data marts gør det nemmere for afdelingerne hurtigt at få adgang til de data og den indsigt, der er relevante for dem, og også at styre deres egne datasæt i det større datalager.

Datamodeller er et grundlæggende element i softwareudvikling og analyse. En datamodel er en beskrivelse af, hvordan data er struktureret, og i hvilken form dataene vil blive gemt i databasen. En datamodel giver en ramme af relationer mellem dataelementer i en database samt en guide til brug af dataene.

 

Datamodellering er processen med at oprette datamodeller. Når der oprettes en database- eller datalagerstruktur, starter designeren med et diagram over, hvordan data vil flyde ind og ud af databasen eller datawarehouse. Dette flowdiagram anvendes til at definere kendetegnene for dataformater, strukturer og databasehåndteringsfunktioner for effektivt at understøtte kravene til dataflow. Modelleringen giver en standardiseret metode til at definere og formatere databaseindhold konsistent på tværs af systemer, hvilket gør det muligt for forskellige applikationer at dele de samme data.

Et Enterprise Data Warehouse (EDW) gemmer alle aktuelle og historiske forretningsdata på ét sted – indbegrebet af stamdatastyring, datalagring og en datastrategi baseret på en holistisk tilgang til datastyring. EDWs giver et indbydende miljø for analysesoftware og vedligeholdelse af nøjagtige, virksomhedsdækkende KPI'er og rapportering. Mange EDW'er er cloud-baserede for skalerbarhed, adgang og brugervenlighed.

placeholder

Udforsk moderne data warehouse-værktøjer

SAP Datasphere er næste generation af SAP Data Warehouse Cloud.

placeholder

Ideer, du ikke finder andre steder

Tilmeld dig en dosis business intelligence leveret direkte i din indbakke.

twitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixel