Hvad er et datawarehouse?
Et datawarehouse (DW) er et digitalt lagringssystem, der forbinder og harmoniserer store mængder data fra mange forskellige kilder.
Datalageroversigt
Et datawarehouse (DW) er et digitalt lagringssystem, der forbinder og harmoniserer store mængder data fra mange forskellige kilder. Formålet er at fodre business intelligence (BI), rapportering og analyser og understøtte myndighedskrav – så virksomheder kan omsætte deres data til indsigt og træffe intelligente, datadrevne beslutninger. Datalagre gemmer aktuelle og historiske data på ét sted og fungerer som en enkelt sandhedskilde for en organisation.
Data strømmer ind i et datawarehouse fra driftssystemer (som ERP og CRM), databaser og eksterne kilder såsom partnersystemer, Internet of Things (IoT)-enheder, vejrapps og sociale medier – som regel på en almindelig kadence. Fremkomsten af cloud computing har forårsaget et skift i landskabet. I de seneste år er datalagringslokationer flyttet væk fra traditionel on-premise-infrastruktur til flere lokationer, herunder on-premise, privat cloud og offentlig cloud.
Moderne datalagre er designet til at håndtere både strukturerede og ustrukturerede data, som videoer, billedfiler og sensordata. Nogle udnytter integreret analyse- og in-memory-databaseteknologi (som indeholder datasættet i computerhukommelsen i stedet for i disklager) for at give adgang i realtid til pålidelige data og sikre beslutningstagning. Uden datalagring er det meget svært at kombinere data fra heterogene kilder, sikre, at de er i det rigtige format til analyse, og få både en aktuel og lang række af data over tid.
Hvad er et datawarehouse?
Fordele ved datalagring
Et veldesignet datawarehouse er grundlaget for ethvert succesfuldt BI-- eller analyseprogram. Dens vigtigste opgave er at drive de rapporter, dashboards og analytiske værktøjer, der er blevet uundværlige for virksomheder i dag. Et datawarehouse giver oplysninger til dine datadrevne beslutninger – og hjælper dig med at foretage det rigtige kald på alt fra ny produktudvikling til lagerniveauer. Der er mange fordele ved et datawarehouse. Her er blot nogle få:
Bedre forretningsanalyser: Med datalagring har beslutningstagere adgang til data fra flere kilder og behøver ikke længere at træffe beslutninger baseret på ufuldstændige oplysninger.
Hurtigere forespørgsler: Datalagre er bygget specielt til hurtig datahentning og analyse. Med en DW, kan du meget hurtigt forespørge store mængder konsoliderede data med lidt til ingen støtte fra IT.
Forbedret datakvalitet: Før data indlæses i DW, oprettes dataoprydningstilfælde af systemet og registreres i en arbejdsliste til videre behandling, hvilket sikrer, at data omdannes til et konsistent format til at understøtte analyser – og beslutninger – baseret på høj kvalitet, nøjagtige data.
Historisk indsigt: Ved at lagre rige historiske data giver et datawarehouse beslutningstagere mulighed for at lære af tidligere tendenser og udfordringer, lave forudsigelser og drive løbende forretningsforbedringer.
Datawarehouse skærmbillede, der viser dataoprindelse.
Hvad kan et datawarehouse gemme?
Da datalagre først blev populaere i slutningen af 1980'erne, blev de designet til at gemme oplysninger om mennesker, produkter og transaktioner. Disse data – kaldet strukturerede data – var pænt organiseret og formateret for nem adgang. Virksomhederne ønskede dog snart at gemme, hente og analysere ustrukturerede data – såsom dokumenter, billeder, videoer, e-mails, indlæg på sociale medier og rå data fra maskinsensorer.
Et moderne datawarehouse kan rumme både strukturerede og ustrukturerede data. Ved at sammenlægge disse datatyper og nedbryde siloer mellem de to, kan virksomheder få et komplet, omfattende billede for den mest værdifulde indsigt.
Nogle nøgleord
Der er masser af termer at give mening med i DW's verden. Her er nogle af de vigtigste. Udforsk nogle andre termer og ofte stillede spørgsmål i vores ordliste.
Datawarehouse vs. database
Databaser og datalagre er begge datalagringssystemer, men de tjener forskellige formål. En database gemmer som regel data for et bestemt forretningsområde. Et datawarehouse lagrer aktuelle og historiske data for hele virksomheden og feeds BI og analyser. Datalagre bruger en databaseserver til at hente data ind fra en organisations databaser og har yderligere funktioner til datamodellering, styring af dataløbetid, datakildeintegration og meget mere.
Datawarehouse vs. data lake
Både datalagre og datalag bruges til lagring af Big Data, men det er meget forskellige lagringssystemer. Et datawarehouse gemmer data, der er blevet formateret til et bestemt formål, hvorimod en datasø gemmer data i sin rå, ubehandlede tilstand – hvis formål endnu ikke er defineret. Datalagre og søer supplerer ofte hinanden. Når rådata, der er gemt i en sø, f.eks. er nødvendige for at besvare et forretningsspørgsmål, kan de udtrækkes, renses, transformeres og bruges i et datalager til analyse. Mængden af data, databaseperformance og lagerpriser spiller en vigtig rolle, når du skal vælge den rigtige lagerløsning.
Diagram over et Data Warehouse sammenlignet med en data lake.
Datawarehouse vs. datamart
Et datamarked er en underafdeling af et datawarehouse, der er opdelt specifikt til en afdeling eller branche – f.eks. salg, marketing eller økonomi. Nogle data marts er også oprettet til selvstændige driftsformål. Mens et datalager fungerer som det centrale dataarkiv for en hel virksomhed, leverer et datamarked relevante data til en udvalgt gruppe af brugere. Dette forenkler dataadgang, fremskynder analyse og giver dem kontrol over deres egne data. Flere datamarkeder implementeres ofte i et datawarehouse.
Diagram over en datamat, og hvordan den virker.
Hvad er nøglekomponenterne i et datawarehouse?
Et typisk datawarehouse har fire hovedkomponenter: en central database, ETL-værktøjer (udtræk, transformation, belastning), metadata og adgangsværktøjer. Alle disse komponenter er udviklet til hastighed, så du kan få resultater hurtigt og analysere data på farten.
Diagram, der viser komponenterne i et datalager.
- Central database: En database fungerer som grundlaget for dit datawarehouse. Traditionelt har disse været standard relationelle databaser, der kører på stedet eller i skyen. Men på grund af Big Data, behovet for ægte, real-time ydeevne, og en drastisk reduktion i omkostningerne ved RAM, in-memory databaser er hurtigt ved at vinde i popularitet.
- Dataintegration: Data hentes fra kildesystemer og ændres for at tilpasse oplysningerne til hurtigt analytisk forbrug ved hjælp af en række dataintegrationsmetoder såsom ETL (udtræk, transformation, belastning) og ELT samt realtidsdatareplikering, bulk-load-behandling, datatransformation og datakvalitets- og forbedringstjenester.
- Metadata: Metadata er data om dine data. Den angiver kilde, anvendelse, værdier og andre funktioner i datasættene i dit datawarehouse. Der er forretningsmetadata, som tilføjer kontekst til dine data, og tekniske metadata, som beskriver, hvordan du får adgang til data – herunder hvor de befinder sig, og hvordan de er struktureret.
- Adgangsværktøjer til datawarehouse: Adgangsværktøjer giver brugerne mulighed for at interagere med data i dit datawarehouse. Eksempler på adgangsværktøjer omfatter: forespørgsels- og rapporteringsværktøjer, applikationsudviklingsværktøjer, data mining-værktøjer og OLAP-værktøjer.
Datawarehouse arkitektur
Tidligere opererede datalagre i lag, der matchede strømmen af forretningsdata.
Diagram over data warehouse-arkitektur. Et typisk datawarehouse indeholder de tre separate lag ovenfor. I dag kombinerer moderne datalagre OLTP og OLAP i et enkelt system.
Datalag: Data udtrækkes fra dine kilder og transformeres og indlæses derefter i det nederste niveau ved hjælp af ETL-værktøjer. Det nederste niveau består af din database server, data marts, og data søer. Metadata oprettes på dette niveau – og dataintegrationsværktøjer, som f.eks. datavirtualisering, bruges til problemfrit at kombinere og aggregere data.
Semantisk lag: OLTP-servere (online analytisk behandling) og onlinetransaktionsbehandlingsservere (OLTP) omstrukturerer dataene til hurtige, komplekse forespørgsler og analyser.
Analyselag: Det øverste niveau er frontend-klientlaget. Den indeholder data warehouse-adgangsværktøjerne, der giver brugerne mulighed for at interagere med data, oprette dashboards og rapporter, overvåge KPI'er, mine og analysere data, build-apps og meget mere. Dette niveau omfatter ofte et arbejdsområde eller et sandkasseområde til dataudforskning og udvikling af nye datamodeller.
Datalagre er designet til at understøtte beslutningstagning og er primært bygget og vedligeholdt af it-teams, men i løbet af de seneste par år har de udviklet sig til at styrke forretningsbrugere – hvilket reducerer deres afhængighed af it for at få adgang til dataene og udlede handlingsrettede indsigter. Nogle få vigtige datalagringsfunktioner, der har styrket forretningsbrugere, er:
- Det semantiske lag eller forretningslaget, der indeholder naturlige sprogudtryk og giver alle mulighed for øjeblikkeligt at forstå data, definere relationer mellem elementer i datamodellen og supplere datafelter med nye forretningsoplysninger.
- Virtuelle arbejdsområder giver teams mulighed for at bringe datamodeller og forbindelser ind på ét sikkert og styret sted, der understøtter bedre samarbejde med kolleger gennem et fælles område og et fælles datasæt.
- Cloud har forbedret beslutningstagningen yderligere ved globalt at give medarbejderne et omfattende sæt værktøjer og funktioner, så de nemt kan udføre dataanalyseopgaver. De kan forbinde nye apps og datakilder uden megen it-support.
Top syv fordele ved et cloud-datawarehouse
Cloud-baserede datalagre stiger i popularitet – med god grund. Disse moderne lagre tilbyder flere fordele i forhold til traditionelle, on-premise versioner. Her er de syv største fordele ved et cloud-datawarehouse:
- Hurtig at implementere: Med cloud-datalagring kan du købe næsten ubegrænset computerkraft og datalagring med få klik – og du kan bygge dit eget datawarehouse, data marts og sandkasser fra hvor som helst, på få minutter.
- Lave samlede ejeromkostninger (TCO): Data warehouse-as-a-service (DWaaS) prisfastsættelsesmodeller er sat op, så du kun betaler for de ressourcer, du har brug for, når du har brug for dem. Du behøver ikke at forudsige dine langsigtede behov eller betale for mere beregning i løbet af året end nødvendigt. Du kan også undgå startomkostninger som dyrt hardware, serverrum og vedligeholdelsespersonale. Adskillelse af lagerpriser fra computerpriserne giver dig også en måde at drive omkostningerne ned på.
- Elasticitet: Med et cloud-datalager kan du dynamisk skalere op eller ned efter behov. Cloud giver os et virtualiseret, meget distribueret miljø, der kan håndtere enorme mængder af data, der kan skalere op og ned.
- Sikkerhed og katastrofeberedskab: I mange tilfælde giver cloud-datalagre faktisk større datasikkerhed og kryptering end on-premise DW'er. Data bliver også automatisk duplikeret og sikkerhedskopieret, så du kan minimere risikoen for tabte data.
- Realtidsteknologier: Cloud-datalagre, der er bygget på in-memory-databaseteknologi, kan levere ekstremt hurtige databehandlingshastigheder for at levere realtidsdata til øjeblikkelig situationsbevidsthed.
- Nye teknologier: Cloud data warehouses giver dig mulighed for nemt at integrere nye teknologier som maskinindlæring, hvilket kan give en guidet oplevelse for forretningsbrugere og beslutningssupport i form af anbefalede spørgsmål at stille, som et eksempel.
- Styrk forretningsbrugere: Cloud data warehouses giver medarbejderne mulighed for på lige fod og globalt med en enkelt visning af data fra mange kilder og et omfattende sæt værktøjer og funktioner til nemt at udføre dataanalyseopgaver. De kan forbinde nye apps og datakilder uden it.
Datalagring understøtter omfattende analyser af firmaudgifter efter afdeling, leverandører, region og status for at nævne nogle få.
Bedste fremgangsmåder for datalagring
Når du bygger et nyt datawarehouse eller tilføjer nye applikationer til et eksisterende lager, er der dokumenterede trin til at nå dine mål, samtidig med at du sparer tid og penge. Nogle er fokuseret på din virksomheds brug, og andre praksisser er en del af dit overordnede it-program. Følgende liste er et godt udgangspunkt, og du vil hente yderligere best practice, når du arbejder med dine teknologi- og servicepartnere.
Business Best Practices
Definer de oplysninger, du har brug for. Når du har en god forståelse af dine oprindelige behov, kan du finde de datakilder, der understøtter dem. Ofte vil faggrupper, kunder og leverandører have dataanbefalinger til dig.
Dokumentere placeringen, strukturen og kvaliteten af dine aktuelle data. Derefter kan du identificere datamangler og forretningsregler til at transformere dataene, så de opfylder dine lagerkrav.
Opbyg et team. Dette omfatter ledende sponsorer, ledere og medarbejdere, der vil bruge og levere oplysningerne. Identificer fx de standardrapporter og KPI'er, de skal bruge til at udføre deres job.
Prioriter dine data warehouse-applikationer. Vælg et eller to pilotprojekter, der har rimelige krav og god forretningsværdi.
Vælg en stærk datawarehouse teknologipartner. De skal have de implementeringstjenester og erfaring, der er nødvendige for dine projekter. Sørg for, at de understøtter dine implementeringsbehov, herunder både cloud-tjenester og lokale valgmuligheder.
Udvikle en god projektplan. Samarbejd med dit team om en realistisk plan og tidsplan, der understøtter kommunikation og statusrapportering.
IT Best Practices
Overvåg ydeevne og sikkerhed. Oplysningerne i dit datalager er værdifulde, men de skal være let tilgængelige for at give værdi til organisationen. Overvåg systembrugen omhyggeligt for at sikre, at ydelsesniveauerne er høje.
Vedligehold datakvalitetsstandarder, metadata, struktur og governance. Nye kilder til værdifulde data bliver rutinemæssigt tilgængelige, men de kræver konsistent styring som en del af et datalager. Følg procedurer for datarensning, definition af metadata og overholdelse af styringsstandarder.
Giv en agil arkitektur. Efterhånden som din virksomheds og forretningsenheders forbrug stiger, vil du opdage en bred vifte af data mart og lagerbehov. En fleksibel platform vil støtte dem langt bedre end et begrænset, restriktivt produkt.
Automatiser processer som fx vedligeholdelse. Ud over at tilføje værdi til Business Intelligence kan maskinindlæring automatisere tekniske styringsfunktioner for datawarehouse for at opretholde hastigheden og reducere driftsomkostningerne.
Brug skyen strategisk. Forretningsenheder og afdelinger har forskellige implementeringsbehov. Brug On-Premise-systemer, når det er nødvendigt, og udnyt cloud-datalagre for at få skalerbarhed, reducerede omkostninger og adgang til telefon og tablet.
Sammenfatning
Moderne datalagre og i stigende grad cloud-datalagre vil være en vigtig del af ethvert initiativ til digital transformation for moderselskaber og deres forretningsenheder. De udnytter de aktuelle forretningssystemer, især når du kombinerer data fra flere interne systemer med nye, vigtige oplysninger fra eksterne organisationer.
Dashboards, KPI'er, alarmer og rapportering understøtter chef-, ledelses- og personalekrav samt vigtige kunde- og leverandørbehov. Datalagre leverer også hurtig, kompleks datamining og analyser, og de forstyrrer ikke andre forretningssystemers ydeevne.
I betragtning af fleksibiliteten til at starte små og udvide efter behov, kan både virksomhedskontorer og forretningsenheder forbedre beslutningstagningen og bottom-line ydeevne med moderne data warehouse-teknologi.
Ofte stillede spørgsmål om datawarehouse
Udforsk moderne data warehouse-værktøjer
SAP Datasphere er næste generation af SAP Data Warehouse Cloud.
Ideer, du ikke finder andre steder
Tilmeld dig en dosis business intelligence leveret direkte i din indbakke.