Mikä on tietovarasto?

Tietovarasto (DW) on digitaalinen tallennusjärjestelmä, joka yhdistää ja harmonisoi suuria määriä dataa monista eri lähteistä.

Tietovaraston yleistiedot

Tietovarasto (DW) on digitaalinen tallennusjärjestelmä, joka yhdistää ja harmonisoi suuria määriä dataa monista eri lähteistä. Sen tarkoituksena on syöttää Business Intelligence (BI), raportointi ja analyysit sekä tukea lakisääteisiä vaatimuksia – jotta yritykset voivat muuttaa tietonsa oivalluksiksi ja tehdä älykkäitä, datalähtöisiä päätöksiä. Tietovarastot tallentavat nykyiset ja historialliset tiedot yhteen paikkaan ja toimivat organisaation yhtenä tietolähteenä.

 

Tiedot kulkevat tietovarastoon operatiivisista järjestelmistä (kuten ERP ja CRM), tietokannoista ja ulkoisista lähteistä, kuten kumppanijärjestelmistä, esineiden internetin (IoT) laitteista, sääsovelluksista ja sosiaalisesta mediasta – yleensä säännöllisin väliajoin. Pilvipalvelujen syntyminen on muuttanut maisemaa. Viime vuosina tietovarastot ovat siirtyneet perinteisestä on-premise-infrastruktuurista useisiin sijainteihin, mukaan lukien on premise, yksityinen pilvi ja julkinen pilvi.

 

Nykyaikaiset tietovarastot on suunniteltu käsittelemään sekä jäsenneltyä että rakenteetonta dataa, kuten videoita, kuvatiedostoja ja sensoritietoja. Jotkut hyödyntävät integroitua analytiikka- ja in-memory-tietokantateknologiaa (joka pitää tietojoukon tietokoneen muistissa eikä levytallennustilassa), jotta voit käyttää luotettavia tietoja reaaliaikaisesti ja tehdä luotettavaa päätöksentekoa. Ilman tietovarastointia on erittäin vaikeaa yhdistää tietoa heterogeenisista lähteistä, varmistaa, että se on oikeassa muodossa analytiikkaa varten, ja saada sekä nykyisen että pitkän aikavälin näkymä datasta ajan mittaan.

Mikä on tietovarasto?

Tietovarastoinnin (data warehousing) hyödyt

Hyvin suunniteltu tietovarasto on minkä tahansa onnistuneen BI-ohjelman tai analytiikkaohjelman perusta. Sen päätehtävänä on ottaa käyttöön raportit, hallintapaneelit ja analyysityökalut, joista on tullut nykypäivän yrityksille välttämättömiä. Tietovarasto tarjoaa tietoa tietopohjaisiin päätöksiisi – ja auttaa sinua tekemään oikean puhelun aina uudesta tuotekehityksestä varastosaldoihin. Tietovarastosta on monia etuja. Tässä vain muutama: 

  • Parempi liiketoiminta-analytiikka: Tietovarastoinnin myötä päätöksentekijät pääsevät käsiksi tietoihin useista eri lähteistä, eikä heidän tarvitse enää tehdä päätöksiä puutteellisten tietojen perusteella.  

  • Nopeammat kyselyt: Tietovarastot on rakennettu erityisesti nopeaa tiedonhakua ja analysointia varten. DW: n avulla voit hyvin nopeasti kysellä suuria määriä konsolidoituja tietoja, joilla on vain vähän tai ei lainkaan tukea IT:ltä.  

  • Tietojen laadun parantaminen: Järjestelmä luo tietojen puhdistustapaukset ennen DW:hen lataamista ja tallentaa ne työvarantoon jatkokäsittelyä varten. Näin varmistetaan, että tiedot muunnetaan yhtenäiseen muotoon, joka tukee analyyseja – ja päätöksiä – korkealaatuisten ja tarkkojen tietojen perusteella.

  • Historiallinen näkemys: Tallentamalla monipuolisia historiatietoja tietovarasto antaa päätöksentekijöille mahdollisuuden oppia menneistä trendeistä ja haasteista, tehdä ennusteita ja edistää liiketoiminnan jatkuvaa parantamista.

placeholder

Tietovaraston näyttökuva, joka näyttää tietojen alkuperän.

Mitä tietovarasto voi tallentaa?

Kun tietovarastoista tuli suosittuja 1980-luvun lopulla, ne suunniteltiin tallentamaan tietoa ihmisistä, tuotteista ja liiketoimista. Nämä tiedot – joita kutsutaan strukturoiduiksi tiedoiksi – oli siististi järjestetty ja muotoiltu helppokäyttöisiksi. Yritykset halusivat kuitenkin pian tallentaa, hakea ja analysoida jäsentämätöntä dataa, kuten asiakirjoja, kuvia, videoita, sähköposteja, sosiaalisen median julkaisuja ja konetunnistimien raakatietoja.

 

Nykyaikaiseen tietovarastoon mahtuu sekä rakenteellisia että rakenteettomia tietoja. Yhdistämällä nämä tietotyypit ja jakamalla siilot näiden kahden välillä yritykset voivat saada kokonaiskuvan arvokkaimmista tiedoista.

Joitakin keskeisiä termejä

DW:n maailmassa on paljon järkeviä termejä. Tässä muutamia tärkeimpiä. Tutustu sanastoomme joihinkin muihin termeihin ja usein kysyttyihin kysymyksiin.

 

Tietovarasto vs. tietokanta

 

Tietokannat ja tietovarastot ovat molemmat tiedontallennusjärjestelmiä, mutta ne palvelevat eri tarkoituksia. Tietokanta tallentaa tietoja yleensä tietyltä liiketoiminta-alueelta. Tietovarasto tallentaa nykyiset ja historialliset tiedot koko liiketoiminnasta ja syöttää BI:n ja analytiikan. Tietovarastoissa käytetään tietokantapalvelinta tietojen keräämiseen organisaation tietokannoista, ja niissä on lisätoimintoja muun muassa tietomallinnusta, tietojen elinkaaren hallintaa ja tietolähdeintegraatiota varten.

 

Tietovarasto vs. tietojärvi

 

Big Datantallentamiseen käytetään sekä tietovarastoja että tietojärviä , mutta ne ovat hyvin erilaisia tallennusjärjestelmiä. Tietovarasto tallentaa tietoja, jotka on muotoiltu tiettyä tarkoitusta varten, kun taas tietojärvi tallentaa tiedot käsittelemättömään tilaan, jonka tarkoitusta ei ole vielä määritetty. Tietovarastot ja järvet täydentävät usein toisiaan. Kun esimerkiksi järveen tallennettuja raakatietoja tarvitaan liiketoimintakysymykseen vastaamiseen, niitä voidaan poimia, puhdistaa, muuntaa ja käyttää tietovarastossa analysointia varten. Tietojen määrällä, tietokannan suorituskyvyllä ja tallennustilan hinnoittelulla on tärkeä rooli oikean tallennusratkaisun valinnassa.

Tietovaraston kaavio verrattuna tietojärveen.

Tietovarasto versus tietokauppa

 

Tietokauppa on tietovaraston aliosa, joka on jaettu erityisesti osastoa tai toimialaa varten, kuten myyntiä, markkinointia tai taloushallintoa varten. Joitakin datatammeja luodaan myös itsenäisiä operatiivisia tarkoituksia varten. Tietovarasto toimii koko yrityksen keskitettynä tietoarkistona, kun taas datakauppa palvelee relevantteja tietoja valitulle käyttäjäryhmälle. Tämä yksinkertaistaa tiedonsaantia, nopeuttaa analyyseja ja antaa heille mahdollisuuden hallita omia tietojaan. Tietovarastossa otetaan usein käyttöön useita tietosegmenttejä.

Kaavio datakaupasta ja siitä, miten se toimii.

Mitkä ovat tietovaraston keskeiset komponentit?

Tyypillisessä tietovarastossa on neljä pääkomponenttia: keskustietokanta, ETL (ote, muunto, lataus) -työkalut, metatiedot ja käyttötyökalut. Kaikki nämä komponentit on suunniteltu nopeuteen, jotta voit saada tuloksia nopeasti ja analysoida tietoja lennosta.

Kaavio, joka näyttää tietovaraston komponentit.

  1. Keskustietokanta: Tietokanta toimii tietovaraston perustana. Perinteisesti nämä ovat olleet vakiomuotoisia relaatiotietokantoja, jotka kulkevat paikan päällä tai pilvessä. Big Datan, todellisen reaaliaikaisen suorituskyvyn tarpeen ja RAM-muistin kustannusten jyrkän laskun vuoksi in-memory-tietokantojen suosio kasvaa nopeasti.
  2. Tietojen integrointi: Tiedot haetaan lähdejärjestelmistä ja niitä muutetaan tiedon yhdenmukaistamiseksi nopeaa analyyttista kulutusta varten käyttäen erilaisia tietojen integroinnin lähestymistapoja, kuten ETL (ote, muunto, lataus) ja ELT, sekä reaaliaikainen tietojen replikointi, joukkokuormituksen käsittely, tietojen muuntaminen sekä tietojen laatu ja rikastuspalvelut.
  3. Metatiedot: Metatiedot ovat tietojasi koskevia tietoja. Se määrittää tietojoukkojen lähteen, käytön, arvot ja muut ominaisuudet tietovarastossa. On olemassa liiketoiminnan metatietoja, jotka lisäävät kontekstia tietoihisi, ja teknisiä metatietoja, jotka kuvaavat tietojen käyttöä – mukaan lukien niiden sijaintipaikka ja rakenne.
  4. Tietovaraston käyttötyökalut: Access-työkalujen avulla käyttäjät voivat olla vuorovaikutuksessa tietovaraston tietojen kanssa. Käyttötyökaluja ovat esimerkiksi kysely- ja raportointityökalut, sovelluskehitystyökalut, tiedonlouhintatyökalut ja OLAP-työkalut.

Data warehousen arkkitehtuuri

Aiemmin tietovarastot toimivat liiketoimintatietojen kulkua vastaavina kerroksina.

Kaavio tietovaraston arkkitehtuurista. Tyypillinen tietovarasto sisältää kolme erillistä kerrosta yllä. Nykyaikaiset tietovarastot yhdistävät OLTP:n ja OLAP:n yhdeksi järjestelmäksi.

  • Tietokerros: Tiedot poimitaan lähteistä ja muunnetaan ja ladataan alempaan tasoon ETL-työkalujen avulla. Alin taso koostuu tietokantapalvelimesta, datamarteista ja tietojärvistä. Metadata luodaan tässä tasossa – ja datan integrointityökaluja, kuten datan virtualisointia, käytetään datan saumattomaan yhdistämiseen ja kokoamiseen.

  • Semanttinen kerros: Keskitasolla verkkoanalyyttisen käsittelyn (OLAP) ja online-tapahtumakäsittelyn (OLTP) palvelimet järjestävät tiedot uudelleen nopeita, monimutkaisia kyselyitä ja analyyseja varten.

  • Analyysikerros: Ylätaso on edustan asiakaskerros. Se sisältää tietovaraston käyttötyökalut, joiden avulla käyttäjät voivat olla vuorovaikutuksessa tietojen kanssa, luoda kojetauluja ja raportteja, valvoa tunnuslukuja, louhia ja analysoida tietoja, luoda sovelluksia ja paljon muuta. Tämä taso sisältää usein työpöydän tai hiekkalaatikkoalueen tietojen tutkimista ja uuden tietomallin kehittämistä varten.

Tietovarastot on suunniteltu tukemaan päätöksentekoa, ja ne ovat pääasiassa tietotekniikkatiimien rakentamia ja ylläpitämiä, mutta viime vuosina ne ovat kehittyneet tehostamaan yrityskäyttäjiä, mikä vähentää heidän riippuvuuttaan tietotekniikasta, jotta he voivat päästä käsiksi tietoihin ja saada käyttökelpoista tietoa. Muutamia keskeisiä tietovarastointiominaisuuksia, jotka ovat mahdollistaneet liiketoimintakäyttäjät, ovat:

  1. Semanttinen tai liiketoimintakerros, joka tarjoaa luonnollisen kielen lausekkeita ja jonka avulla kaikki ymmärtävät välittömästi tietoja, määrittävät tietomallin elementtien välisiä suhteita ja täydentävät tietokenttiä uusilla liiketoimintatiedoilla.
  2. Virtuaalisten työtilojen avulla tiimit voivat tuoda tietomalleja ja yhteyksiä yhteen suojattuun ja hallittuun paikkaan, joka tukee parempaa yhteistyötä kollegoiden kanssa yhden yhteisen tilan ja yhden yhteisen tietojoukon kautta.
  3. Pilvipalvelut ovat parantaneet päätöksentekoa entisestään, sillä ne tarjoavat työntekijöille monipuoliset työkalut ja ominaisuudet, joiden avulla he voivat helposti suorittaa tietojen analysointitehtäviä. Ne voivat yhdistää uusia sovelluksia ja tietolähteitä ilman suurta IT-tukea.

Pilvitietovaraston seitsemän tärkeintä etua

Pilvipohjaisten tietovarastojen suosio kasvaa – hyvästä syystä. Nämä modernit varastot tarjoavat useita etuja verrattuna perinteisiin, on-premise-versioihin. Tässä ovat pilvitietovaraston seitsemän tärkeintä etua:

  1. Nopea käyttöönotto: Pilvitietovarastoinnin avulla voit ostaa lähes rajattomasti laskentatehoa ja tietojen tallennusta vain muutamalla napsautuksella – ja voit rakentaa oman tietovaraston, datamartit ja hiekkalaatikot mistä tahansa, muutamassa minuutissa.
  2. Alhaiset kokonaiskäyttökustannukset (TCO): Tietovarasto-as-a-service (DWaaS) hinnoittelumallit on määritetty niin, että maksat vain tarvitsemistasi resursseista, kun tarvitset niitä. Sinun ei tarvitse ennustaa pitkän aikavälin tarpeita tai maksaa enemmän laskennasta koko vuoden ajan kuin on tarpeen. Voit myös välttää alkukustannukset, kuten kalliit laitteistot, palvelinhuoneet ja huoltohenkilöstö. Varastointihinnoittelun erottaminen laskennallisesta hinnoittelusta antaa myös mahdollisuuden alentaa kustannuksia.
  3. Elastisuus: Pilvitietovaraston avulla voit skaalata dynaamisesti ylös tai alas tarpeen mukaan. Pilvi tarjoaa virtualisoidun, erittäin hajautetun ympäristön, joka pystyy hallitsemaan valtavia tietomääriä, jotka voivat kasvaa ja pienentyä.
  4. Turvallisuus ja katastrofien palautuminen: Monissa tapauksissa pilvitietovarastot tarjoavat vahvemman tietoturvan ja salauksen kuin on-premise-tietokoneet. Tiedot myös kopioidaan ja varmuuskopioidaan automaattisesti, joten voit minimoida kadonneiden tietojen riskin.
  5. Reaaliaikaiset teknologiat: in-memory-tietokantateknologiaan perustuvat pilvitietovarastot voivat tarjota erittäin nopeita tiedonkäsittelynopeuksia reaaliaikaisen tiedon toimittamiseksi hetkellistä tilannetietoisuutta varten.
  6. Uudet teknologiat: Pilvitietovarastojen avulla voit helposti integroida uusia teknologioita, kuten koneoppimista, joka voi tarjota ohjatun kokemuksen liiketoimintakäyttäjille ja päätöksenteon tukea esimerkiksi suositeltujen kysymysten muodossa.
  7. Paranna yrityskäyttäjiä: Pilvitietovarastot tarjoavat työntekijöille yhdenvertaisen ja globaalin mahdollisuuden tarkastella tietoja useista eri lähteistä ja käyttää monipuolista työkalujen ja ominaisuuksien valikoimaa, joiden avulla tietojen analysointitehtävät on helppo suorittaa. Ne voivat yhdistää uusia sovelluksia ja tietolähteitä ilman IT:tä.
placeholder

Tietovarastointi tukee yrityksen kulujen kattavaa analyysia osaston, toimittajan, alueen ja tilan mukaan.

Tietovarastoinnin parhaat käytännöt

Kun rakennat uuden tietovaraston tai lisäät uusia sovelluksia olemassa olevaan varastoon, on todistettu, että saavutat tavoitteesi säästäen samalla aikaa ja rahaa. Jotkut ovat keskittyneet liiketoimintasi käyttöön, ja muut käytännöt ovat osa yleistä IT-ohjelmaasi. Seuraava lista on hyvä lähtökohta, ja keräät lisää parhaita käytäntöjä työskennellessäsi teknologia- ja palvelukumppaneiden kanssa. 

Liiketoiminnan parhaat käytännöt

  • Määritä tarvitsemasi tiedot. Kun sinulla on hyvä käsitys alkuperäisistä tarpeistasi, löydät niitä tukevat tietolähteet. Usein kaupparyhmillä, asiakkailla ja toimittajilla on tietosuosituksia sinulle.

  • Dokumentoi nykyisten tietojesi sijainti, rakenne ja laatu. Sen jälkeen voit tunnistaa tietoaukkoja ja liiketoimintasääntöjä tietojen muuntamiseksi vastaamaan varastovaatimuksia.

  • Rakenna tiimi. Tähän sisältyvät johdon tukijat, johtajat ja henkilöstö, jotka käyttävät ja toimittavat tietoja. Määritä esimerkiksi vakioraportointi ja tunnusluvut, joita he tarvitsevat tehtäviensä suorittamiseen.

  • Priorisoi tietovarastosovelluksesi. Valitse yksi tai kaksi pilottihanketta, joilla on kohtuulliset vaatimukset ja hyvä liiketoiminnallinen arvo.

  • Valitse vahva tietovarastoteknologiakumppani. Heillä on oltava projekteissasi tarvittavat käyttöönottopalvelut ja -kokemus. Varmista, että ne tukevat käyttöönottotarpeitasi, mukaan lukien sekä pilvipalvelut että on-premise-vaihtoehdot.

  • Laadi hyvä hankesuunnitelma. Työskentele tiimisi kanssa realistisen suunnitelman ja aikataulun parissa, joka tukee viestintää ja tilaraportointia.

IT parhaat käytännöt

  • Valvo suorituskykyä ja turvallisuutta. Tietovarastosi tiedot ovat arvokkaita, mutta niiden on oltava helposti saatavilla, jotta ne antavat organisaatiolle lisäarvoa. Valvo järjestelmän käyttöä huolellisesti varmistaaksesi, että suorituskykytasot ovat korkeat.

  • Ylläpidä tietojen laatustandardeja, metatietoja, rakennetta ja hallintoa. Uusia arvokkaan tiedon lähteitä on rutiininomaisesti saatavilla, mutta ne vaativat johdonmukaista hallintaa osana tietovarastoa. Noudata tietojen puhdistamiseen, metatietojen määrittämiseen ja hallinnointinormien noudattamiseen liittyviä menettelyjä.

  • Tarjoa ketterää arkkitehtuuria. Kun yrityksesi ja liiketoimintayksikkösi käyttö lisääntyy, huomaat laajan valikoiman datakauppa- ja varastotarpeita. Joustava alusta tukee niitä paljon paremmin kuin rajoitettu, rajoittava tuote.

  • Automatisoi prosesseja, kuten ylläpitoa. Sen lisäksi, että koneoppiminen tuo lisäarvoa Business Intelligenceen, se voi automatisoida tietovaraston teknisiä hallintatoimintoja nopeuden ylläpitämiseksi ja käyttökustannusten vähentämiseksi.

  • Käytä pilveä strategisesti. Liiketoimintayksiköillä ja osastoilla on erilaiset käyttöönottotarpeet. Käytä on-premise-järjestelmiä tarvittaessa ja aktivoi pilvitietovarastot skaalautuvuutta, pienempiä kustannuksia sekä puhelimen ja tabletin käyttöä varten.

Yhteenvetona

Nykyaikaiset tietovarastot ja yhä pilvipohjaisemmat tietovarastot ovat keskeinen osa kaikkia emoyhtiöille ja niiden liiketoimintayksiköille suunnattuja digitalisaatiohankkeita. Ne aktivoivat nykyisiä liiketoimintajärjestelmiä, erityisesti kun yhdistät useista sisäisistä järjestelmistä peräisin olevia tietoja uusiin, tärkeisiin tietoihin ulkopuolisilta organisaatioilta.

 

Kojetaulut, KPI:t, hälytykset ja raportoinnin tuen johtajan, johdon ja henkilöstön vaatimukset sekä tärkeät asiakkaiden ja toimittajien tarpeet. Tietovarastot tarjoavat myös nopeaa ja monimutkaista tiedonlouhintaa ja analytiikkaa, eivätkä ne häiritse muiden liiketoimintajärjestelmien suorituskykyä.

 

Kun otetaan huomioon joustavuus aloittaa pienet ja laajenevat tarpeen mukaan, sekä yritystoimistot että liiketoimintayksiköt voivat parantaa päätöksentekoa ja pohjalinjan suorituskykyä nykyaikaisen tietovarastoteknologian avulla.

Tietovaraston usein kysytyt kysymykset

Datajärvi on paikka, johon voidaan tallentaa kaikenlaista Big Dataa, oli se sitten strukturoitua dataa liiketoimintasovelluksista tai strukturoimatonta dataa mobiilisovelluksista, sosiaalisesta mediasta tai esineiden internetistä (IoT). Koska tiedot tallennetaan niiden luonnollisessa muodossa – strukturoimattomana, rakenteettomana, puolistrukturoituna tai binaarisena – muuntoa, normalisointia tai muuta käsittelyä saatetaan tarvita analyysien mahdollistamiseksi useissa tietotyypeissä. Useimmat tietojärvet ovat pilvipohjaisia, koska niiden tallentamat tietomäärät ovat suuria, nopeat yhteydet hajautettuihin lähteisiin ovat tarpeen ja skaalautuvuuden tarve.

ETL tarkoittaa ”uuttaa, muuntaa ja kuormaa”. Yhdessä nämä toiminnot muodostavat prosessin, jolla tiedot otetaan lähteestä ja muunnetaan käyttökelpoiseen muotoon – ja siirretään sitten tietovarastoon tai muuhun tietovarastoon. ETL on erityisen hyödyllinen tapahtumatiedoissa, mutta kehittyneemmillä työkaluilla voidaan myös hallita erilaisia rakenteettomia tietotyyppejä.

Tietokauppa on tietovaraston jaettu segmentti, joka on suunnattu tiettyyn liiketoiminta-alueeseen tai tiimiin, kuten taloushallintoon tai markkinointiin. Datamarttien avulla osastojen on helpompi päästä nopeasti käsiksi heille relevantteihin tietoihin ja analyyseihin sekä hallita omia tietojoukkojaan laajemmassa tietoarkistossa.

Tietomallit ovat ohjelmistokehityksen ja analytiikan peruselementti. Tietomalli on kuvaus tiedon rakenteesta ja siitä, missä muodossa tiedot tallennetaan tietokantaan. Tietomalli tarjoaa puitteet tietokannan tietoelementtien välisille suhteille sekä oppaan tietojen käyttöön.

 

Tietomallinnus on tietomallien luontiprosessi. Kun tietokanta tai tietovarastorakenne luodaan, suunnitteluohjelma aloittaa kaaviolla siitä, miten tiedot virtaavat tietokantaan tai tietovarastosta. Tämän vuokaavion avulla määritetään tietomuotojen, rakenteiden ja tietokantojen käsittelytoimintojen ominaisuudet, jotta tietovirtojen vaatimuksia voidaan tukea tehokkaasti. Mallinnus tarjoaa standardoidun menetelmän tietokannan sisällön määrittämiseen ja muotoiluun yhdenmukaisesti kaikissa järjestelmissä, jolloin eri sovellukset voivat jakaa samaa dataa.

Yritystietovarasto (EDW) tallentaa kaikki nykyiset ja historialliset liiketoimintatiedot yhteen paikkaan – perustietojen hallinnan, tietovarastoinnin ja kokonaisvaltaiseen tiedonhallintaan perustuvan tietostrategian. EDW:t tarjoavat tervetulleen ympäristön analyysiohjelmistoille ja tarkkojen, koko yrityksen kattavien tunnuslukujen ja raportoinnin ylläpidolle. Monet EDW:t ovat pilvipohjaisia skaalautuvuuden, käytön ja helppokäyttöisyyden vuoksi.

placeholder

Tutustu moderneihin tietovarastotyökaluihin

SAP Datasphere on SAP Data Warehouse Cloudin seuraava sukupolvi.

placeholder

Ideoita, joita et löydä mistään muualta

Saat käyttöösi annoksen Business Intelligence -tietoja suoraan saapuneiden kansioosi.

twitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixel