flex-height
text-black

Palvelinhuone

Tiedonhallinnan sanasto

Tutustu dataan liittyviin termeihin ja määritelmiin tiedonhallinnan sanastossamme.

Mikä on tietokanta?
Tietokanta on mahdollisuus järjestää, tallentaa, hallita, suojata ja valvoa pääsyä tietoihin. Tietokannat on suunniteltu useiden eri järjestelmien (skeeman) mukaan, joista monet noudattavat relaatiomallia helpottamaan ohjelmien ja tietokyselyjen käyttöä. Yleisiä tietokantatyyppejä ovat relaatiotietokantojen hallintajärjestelmät (RDBMS), in-memory-tietokannat, objektiperusteiset tietokannat (OODBMS), NoSQL-tietokannat ja NewSQL-tietokannat – joista jokaisella on omat etunsa.
Mitä on tiedonhallinta?
Tiedonhallinta tarkoittaa kaikkia toimintoja, joita tarvitaan tietojen keräämiseen, hallintaan, suojaamiseen, käsittelyyn ja toimittamiseen. Tietojenhallintajärjestelmiä ovat tietokannat, tietovarastot ja tiedonkeruuvälineet, tiedonkeruu-, tallennus- ja hakutyökalut sekä apuohjelmat, jotka auttavat validoinnissa, laadussa ja integroinnissa sovellusten ja analyysityökalujen kanssa. Yritykset tarvitsevat tietostrategian, jotta ne voivat ottaa vastuun tietyistä vastuualueista peräisin olevista tai niihin liittyvistä tiedoista.
Mikä on tietokannan hallinta?
Tietokannan hallinta viittaa prosesseihin ja menettelyihin, joita tarvitaan tietojen tallentamiseen, käsittelyyn, käsittelyyn ja suojaamiseen. Monissa organisaatioissa vastuu tällaisten menettelyjen luomisesta ja valvonnasta on ensisijaisesti tietokannan hallinnoijan (DBA) tai vastaavan tehtävän vastuulla. Useimmat organisaatiot luottavat kaupalliseen tietokantojen hallintajärjestelmään (DBMS) ensisijaisena työkaluna tietokantansa hallinnassa.
Mikä on tietokannan hallintajärjestelmä (DBMS)?
Tietokannan hallintajärjestelmä (DBMS) on ohjelmisto työkalupakki, joka tarjoaa tallennusrakenteen ja tiedonhallintajärjestelmän tietokannan hallintaan. DBMS voi olla erottamaton osa lisensoitua toiminnanohjausjärjestelmää (ERP), vaadittava erillinen osto, osa järjestelmäohjelmistoa (käyttöjärjestelmä) tai erikseen lisensoitu ohjelmistotuote. Olipa lähde mikä tahansa, on olennaista, että sovellukset rakennetaan DBMS:n ympärille ja/tai että ne integroidaan kokonaan DBMS:n ympärille, koska ne ovat toisistaan riippuvaisia molempien sovellusten ja DBMS:n tehokkaan toiminnan kannalta. DBMS on pohjimmiltaan tietokantahallinnan työkalupakki.
Mikä on SQL-tietokanta?
SQL-tietokanta on relaatiotietokanta, joka tallentaa tietoja taulukoihin ja riveihin. Tietokohteet (rivit) linkitetään yleisten tietokohteiden perusteella tehokkuuden mahdollistamiseksi, redundanssin välttämiseksi ja helpon ja joustavan haun helpottamiseksi. SQL:n nimi juontuu strukturoidusta kyselykielestä, työkalupaketista ja luonnollisen kielen kyselyprotokollasta, joita käyttäjät voivat oppia ja soveltaa mihin tahansa yhteensopivaan tietokantaan tietojen tallennusta, käsittelyä ja hakua varten.
Mikä on NoSQL-tietokanta?
NoSQL-tietokannat kehitettiin rakenteettoman datan käsittelyyn, jota SQL ei voi tukea rakenteen puuttumisen vuoksi. NoSQL käyttää luovia tekniikoita ylittääkseen tämän rajoituksen, mukaan lukien dynaamiset kaaviot ja erilaiset esikäsittelytekniikat. Yleisimpiä ei-strukturoidun datan tietokantatyyppejä ovat avainarvo-, asiakirja-, sarake- ja kaaviotietokannat, ja ne sisältävät usein muun muassa video-, grafiikka-, vapaateksti- ja raakaanturitulosteita.
Mikä on relaatiotietokannan hallintajärjestelmä (RDBMS)?
Relaatiotietokannan hallintajärjestelmä on relaatiotietomalliin perustuva tietokantojen hallintajärjestelmä (DBMS). RDBMS:n sisältö tallennetaan taulukoihin, jotka koostuvat riveistä ja sarakkeista ja joissa kukin taulukko edustaa tiettyä objektia tai entiteettiä tietokannassa, joka voi liittyä toiseen. RDBMS sisältää yleensä useita taulukoita ja sisältää lisäfunktioita, jotka ylläpitävät tietojen tarkkuutta, yhdenmukaisuutta, eheyttä ja suojausta, sekä SQL-liittymän, jonka avulla tietoja voidaan käyttää suhteessa toisiinsa monimutkaisten kyselyjen avulla.
Mikä on CDBMS?
CDBMS on Gartnerin keksimä termi, joka kuvaa pääasiassa yllä olevan RDBMS:n pilvikäyttöönottomallia.
Mitä ovat strukturoidut tiedot?
Rakenteelliset tiedot muotoillaan siististi riveihin ja sarakkeisiin ja kohdistetaan ennalta määritettyihin kenttiin. Tavallisesti Excel-laskentataulukoihin tai relaatiotietokantoihin tallennettuja esimerkkejä ovat rahoitustapahtumat, demografiset tiedot ja konelokit. Viime aikoihin asti jäsennelty data oli ainoa käytettävissä oleva datatyyppi yrityksille.
Mitä ovat rakenteettomat tiedot?
Rakenteettomia tietoja ei ole järjestetty riveihin ja sarakkeisiin, mikä vaikeuttaa tietojen tallentamista, analysointia ja hakua. Esimerkkejä ovat käsittelemätön esineiden internet (IoT) -data, video- ja äänitiedostot, sosiaalisen median kommentit ja puhelinkeskuksen transkriptit. Rakenteeton data tallennetaan yleensä tietojärviin, NoSQL-tietokantoihin tai moderneihin tietovarastoihin.
Mikä on puolistrukturoitu data?
Puolirakenteisilla tiedoilla on joitakin organisatorisia ominaisuuksia, kuten semanttisia tunnisteita tai metatietoja, mutta ne eivät vastaa laskentataulukon tai relaatiotietokannan rivejä ja sarakkeita. Hyvä esimerkki puolistrukturoidusta datasta on sähköposti – joka sisältää strukturoitua dataa, kuten lähettäjän ja vastaanottajan osoitteet, mutta myös rakenteetonta dataa, kuten itse sanoma.
Mitä on tietojen kohdistus?
Tietojen kohdistus on eri tietorakenteiden tai tietokantojen kenttien täsmäytysprosessi. Tämä on välttämätön vaihe, jos tietokantoja yhdistetään, jos tietoja siirretään järjestelmästä tai tietokannasta toiseen tai jos eri tietolähteitä on tarkoitus käyttää yhdessä sovelluksessa tai analyysityökalussa – kuten usein tapahtuu tietovarastoinnissa. Tietojen kohdistus tunnistaa yksiselitteiset, ristiriitaiset ja päällekkäiset tiedot, jotta voidaan kehittää sääntöjoukko kaikkien tietojen tuomiseksi koordinoituun kaavioon tai muotoon.
Mikä on tietomallinnus?
Uuden tai vaihtoehtoisen tietokantarakenteen luonnissa suunnittelija aloittaa kaaviolla siitä, miten tietoja virtaa tietokantaan ja tietokannasta. Tietovirtojen kaaviointia kutsutaan tietomallinnukseksi. Tästä vuokaaviosta ohjelmistoinsinöörit voivat määrittää tietomuotojen, rakenteiden ja tietokannan käsittelytoimintojen ominaisuudet tukeakseen tehokkaasti tietovirran vaatimuksia.
Mikä on tietovarastointi?
Tietovarasto tarjoaa yhden kattavan tallennustilan monesta eri lähteestä – sekä sisäisestä että ulkoisesta – dataa varten. Sen päätarkoitus on toimittaa tietoja liiketoimintatietoja (BI), raportointia ja analyyseja varten. Nykyaikaiset tietovarastot voivat tallentaa ja hallita kaikkia tietotyyppejä, rakenteellisia ja rakenteettomia, ja ne ovat tyypillisesti käytössä pilvessä skaalautuvuuden ja helppokäyttöisyyden parantamiseksi.
Mikä on tietojärvi?
Tietojärvi on laaja tietovaranto, joka on tallennettu sen raaka- tai luonnollisessa muodossa. Tietojärviä käytetään tyypillisesti Big Datan tallentamiseen, mukaan lukien jäsennelty, strukturoimaton ja puolistrukturoitu data.
Mitä Big Data on?
Big Data on termi, joka kuvaa erittäin suuria strukturoidun, strukturoimattoman ja puolistrukturoidun datan aineistoja. Big Dataa luonnehtivat usein viisi Vs:tä: kerätyn datan pelkkä määrä, tietotyyppien moninaisuus, datan syntynopeus, datan todenperäisyys ja sen arvo. Big Data -hallintajärjestelmien ja analytiikan avulla yritykset voivat louhia Big Dataa syvälle päätöksentekoa ja toimintaa ohjaavaan oivallukseen.
Mikä on pieni data?
Toisin kuin Big Data, joka on valtavan laaja ja monimutkainen, pieni data on helppo ymmärtää. Pienet tietojoukot voivat sisältää mitä tahansa markkinointikyselyistä jokapäiväisiin laskentataulukoihin – ja ne voivat olla jopa yhtä pieniä kuin yksi sosiaalisen median viesti tai sähköposti. Yhä useammat yritykset käyttävät Big Datan lisäksi pientä dataa tekoäly- ja koneoppimisalgoritmiensa kouluttamiseen entistä syvällisempiä tietoja varten.
Mitä ovat paksut tiedot?
Paksu data on laadullista tietoa, joka antaa käsityksen kuluttajien jokapäiväisestä tunne-elämästä. Se sisältää havaintoja, tunteita ja reaktioita – asioita, joita on tyypillisesti vaikea kvantifioida. Big Dataan yhdistettynä syntyy hyvin kattava kuva kuluttajan mieltymyksistä ja vaatimuksista.
Mikä on tietojen integrointi?
Tietojen integrointi on tietojen sieppaamista, muuntamista, yhdistämistä ja toimittamista, missä ja milloin sitä tarvitaan. Tämä integrointi tapahtuu yrityksessä ja sen ulkopuolella – kumppaneiden välillä sekä kolmansien osapuolten tietolähteissä ja käyttötapauksissa – kaikkien sovellusten ja liiketoimintaprosessien tietojen kulutusvaatimusten täyttämiseksi. Tekniikoita ovat muun muassa joukko-/erätietojen siirto, poiminta, muunto, lataus (ETL), muutostietojen rekisteröinti, tietojen replikointi, tietojen virtualisointi, suoratoistotietojen integrointi, tietojen orkestrointi ja paljon muuta.
Mitä on tietojen virtualisointi?
Tietojen virtualisointi tarjoaa yrityksille yhtenäisen näkymän kaikkiin yritystietoihin – erilaisissa järjestelmissä ja muodoissa – virtuaalisessa tietokerroksessa. Tietojen kopioinnin sijaan tietojen virtualisointi jättää tiedot lähdejärjestelmiinsä ja yksinkertaisesti näyttää niistä virtuaalisen esityksen käyttäjille ja sovelluksille reaaliajassa. Tietojen virtualisointi on moderni lähestymistapa tietojen integrointiin, jonka avulla käyttäjät voivat löytää ja käsitellä tietoja riippumatta sen fyysisestä sijainnista, muodosta tai protokollasta.
Mikä on tietokangas?
Datakangas on räätälöity arkkitehtuurin ja teknologian yhdistelmä. Se käyttää dynaamista tietojen integrointia ja orkestrointia eri sijaintien, lähteiden ja tietotyyppien yhdistämiseen. Tietokangasalustassa määriteltyjen oikeiden rakenteiden ja virtojen avulla yritykset voivat nopeasti käyttää ja jakaa tietoja riippumatta siitä, missä ne ovat tai miten ne on luotu.
Mikä on tietoverkko?
Data Mesh on lähestymistapa tiedonhallintaan, joka käyttää hajautettua arkkitehtonista kehystä. Toisin sanoen se levittää omistajuutta ja vastuuta tietyistä tietoaineistoista koko liiketoiminnalle, niille käyttäjille, joilla on asiantuntemusta ymmärtääkseen, mitä nämä tiedot tarkoittavat ja miten niitä käytetään parhaalla mahdollisella tavalla.
Mikä on tietoputki?
Tietoputki kuvaa joukon automatisoituja ja toistettavia prosesseja, joilla etsitään, puhdistetaan, muunnetaan ja analysoidaan minkä tahansa tyyppisiä tietoja sen lähteessä. Koska tiedot analysoidaan lähellä sitä, missä ne on generoitu, liiketoimintakäyttäjät voivat nopeasti analysoida ja jakaa tarvitsemansa tiedot halvemmalla organisaatiolle. Tietoputkistoja voidaan parantaa myös koneoppimisen kaltaisilla tekniikoilla, jotta ne olisivat nopeampia ja tehokkaampia.
Mitä ovat datasiilot?
Tietosiilo on vinotermi tilanteelle, jossa yksittäiset osastot tai yrityksen toimintoalueet eivät jaa tietoja muiden osastojen kanssa. Tämä eristäytyminen estää koordinoidun pyrkimyksen kohti yrityksen tavoitteita ja johtaa heikkoon suorituskykyyn (ja huonoon asiakaspalveluun), korkeisiin kustannuksiin ja yleiseen kyvyttömyyteen vastata markkinoiden vaatimuksiin ja muutoksiin. Päällekkäisiä ja tarpeettomia tietoja on vaikea sovittaa yhteen, mikä estää yrityksiä koordinoida toimintoja ja hallita liiketoimintaa tehokkaasti.
Mikä on tietojen muuntaminen?
Tietojen muuntaminen on prosessi, jossa raakatiedot otetaan ja muunnetaan muotoon, joka on yhteensopiva vakiintuneiden tietokantojen ja sovellusten kanssa. Prosessi voi sisältää rakenteen, puhdistuksen, rikastamisen ja tietojen validoinnin tarpeen mukaan, jotta raakatiedoista olisi hyötyä.
Mikä on tietoturva?
Tietoturva on tapa tehdä tiedoista turvallisia – turvallisia luvattomalta käytöltä tai altistumiselta, katastrofeilta tai järjestelmän vikaantumisilta ja samalla helposti laillisten käyttäjien ja sovellusten käytettävissä. Menetelmiä ja työkaluja ovat tietojen salaus, avainten hallinta, varmennus- ja varmuuskopiointikäytännöt sekä kulunvalvonta. Tietoturva on kaikenkokoisten ja -tyyppisten organisaatioiden vaatimus suojata asiakas- ja organisaatiotietoja jatkuvasti kasvavilta tietoturvaloukkausten ja yksityisyyden suojan riskeiltä. Redundanssi ja varmuuskopiot ovat tärkeitä liiketoiminnan jatkuvuuden ja katastrofien palautumisen kannalta.
Mikä on tietosuoja?
Tietosuoja tarkoittaa käytäntöjä ja käytäntöjä, joiden mukaan tietoja käsitellään tavalla, joka suojaa niitä luvattomalta käytöltä tai luovuttamiselta. Tietosuojakäytännöt ja -käytännöt kattavat sen, miten tietoja kerätään ja tallennetaan organisaation tietostrategian mukaisesti, miten niitä voidaan jakaa tai olla jakamatta kolmansille osapuolille ja miten noudattaa lakisääteisiä rajoituksia. Tietosuoja on liiketoiminnallinen välttämättömyys, joka täyttää asiakkaan odotukset ja suojaa samalla tallennettujen tietojen eheyttä ja turvallisuutta.
Mikä on tiedon laatu?
Datan laatu on sumea termi, joka kuvaa datan soveltuvuutta ja luotettavuutta. Hyvä ja laadukas data tarkoittaa yksinkertaisesti sitä, että tiedot ovat tarkkoja (edustavat todella sitä, mitä ne kuvaavat), luotettavia (yhdenmukaisia, tarkastettavia, asianmukaisesti hallittuja ja suojattuja) ja täydellisiä käyttäjien ja sovellusten vaatimassa laajuudessa. Tietojen laatu voidaan varmistaa vain asianmukaisesti suunnitellulla ja toteutetulla datastrategialla, joka toteutetaan teollisuuden vahvuisilla työkaluilla ja järjestelmillä sekä tarkasti noudatettavilla tiedonhallintapolitiikoilla ja -menettelyillä.
Mitä on tietojen validointi?
Tietojen validointi on prosessi, jossa määritetään tietojen laatu, tarkkuus ja oikeellisuus ennen niiden tuontia tai käyttöä. Validointi voi koostua useista toiminnoista ja prosesseista tietojen todentamiseksi ja yleensä tietokohteiden ”puhdistamiseksi”, mukaan lukien kaksoiskappaleiden poistaminen, ilmeisten virheiden tai puuttuvien kohteiden korjaaminen ja mahdolliset muotoilun muutokset (tietojen puhdistus). Tietojen validointi varmistaa, että tärkeiden päätösten tekemiseen tarvitsemasi tiedot ovat tarkkoja ja luotettavia.
Mitä on tietojen puhdistus?
Tietojen puhdistus tarkoittaa virheiden poistamista tai korjaamista tietojoukosta, taulusta tai tietokannasta. Nämä virheet voivat sisältää vioittuneita, epätarkkoja, epäolennaisia tai puutteellisia tietoja. Tämä prosessi, jota kutsutaan myös tietojen puhdistukseksi, löytää kaksinkertaisia tietoja ja muita ristiriitoja, kuten kirjoitusvirheitä ja numeerisia joukkoja, joita ei lasketa yhteen. Tietojen puhdistus voi poistaa virheellisiä tietoja tai korjata ilmeisiä virheitä, kuten tyhjiä kenttiä tai puuttuvia koodeja.
Mikä on tietojen eheys?
Tietojen eheys viittaa tietojen todenperäisyyteen pitkällä aikavälillä. Kun tiedot on syötetty tai tuotu, ne on sekoitettu, validoitu, puhdistettu ja tallennettu, tietojen eheys on väite, että tietojen laatua ylläpidetään ja käyttäjät voivat olla varmoja siitä, että tiedot, jotka on syötetty, eivät ole muuttuneet eivätkä muutu. Haettavat tiedot ovat samat kuin alun perin tallennetut. Joskus tietojen laadun synonyyminä käytetty tietojen eheys on enemmän luotettavuutta ja luotettavuutta.
Mitä on tietojen hallinnointi?
Tietojen hallinnointi on joukko käytäntöjä ja käytäntöjä, joilla varmistetaan asianmukainen tiedonhallinta koko organisaatiossa. Siinä perustetaan tietotekninen infrastruktuuri ja nimetään henkilöt (tai asemat), joilla on valtuudet ja vastuu tietyntyyppisten tietojen käsittelystä ja suojaamisesta. Tehokas tietojen hallinta varmistaa, että tiedot ovat saatavilla, luotettavia, turvallisia ja yhteensopivia – ja että niitä ei käytetä väärin.
Mikä on tietojen hallinta?
Tietojen hallinta on tietojen hallinnointikäytäntöjen ja -menettelyjen toteuttamista tietojen tarkkuuden, luotettavuuden, eheyden ja turvallisuuden varmistamiseksi. Henkilöt, joille on kohdistettu tietojen hallintavastuita, hallinnoivat ja valvovat menettelyjä ja työkaluja, joita käytetään tietojen käsittelyyn, tallentamiseen ja suojaamiseen.
Mikä on tietoarkkitehtuuri?
Tietoarkkitehtuuri on rakenne, käytännöt ja säännöt, jotka määrittävät organisaation tiedot ja miten niitä käytetään ja hallitaan. Tietoarkkitehtuuri sisältää yksityiskohtia siitä, miten datastrategia toteutetaan liiketoiminnan tarpeiden ja tavoitteiden tueksi – ja toimii perustana tietokantojen kehittämiselle, menettelytavoille, suojauksille, turvallisuudelle ja tietojen hallinnalle.
Mitä on perustietojen hallinta?
Perustietojen hallinta (MDM) on käytäntö luoda yksi "master"-viitelähde kaikille tärkeille liiketoimintatiedoille. Se sisältää käytännöt ja menettelyt perustietojen käsittelyn määrittämistä, hallintaa ja hallintaa (tai hallintaa) varten. Keskitetty perustietojen hallinta poistaa ristiriidat ja sekaannukset, jotka johtuvat hajanaisista tietokannoista, joissa on päällekkäisiä tietoja ja koordinoimattomia tietoja, jotka saattavat olla vanhentuneita, vioittuneita tai ajallisesti syrjäytettyjä – päivitetään yhteen paikkaan mutta ei toiseen. Jos yhdellä versiolla palvellaan koko yritystä, organisaation kaikki osat toimivat samoilla määritelmillä, standardeilla ja oletuksilla.
Mitä analyysit ovat?
Analytiikka-termillä tarkoitetaan datan systemaattista analysointia. Analyysisovellukset ja työkalupaketit sisältävät matemaattisia algoritmeja ja laskentakoneita, jotka voivat käsitellä suuria tietojoukkoja paljastaakseen malleja, trendejä, suhteita ja muita tietoja, joiden avulla käyttäjät voivat esittää kysymyksiä ja saada hyödyllisiä tietoja liiketoiminnastaan, toiminnoistaan ja markkinoistaan. Monet modernit analyysityökalut on suunniteltu ei-teknisten liike-elämän henkilöiden käyttöön, minkä ansiosta he voivat tehdä näitä analyyseja minimaalisella avustuksella datatutkijoilta tai IT-asiantuntijoilta.
Mitä ovat lisätyt analyysit?
Lisätyt analyysit ovat analytiikkaa, jota ”lisätään” tekoälytekniikoilla, mukaan lukien koneoppiminen ja luonnollisen kielen käsittely (NLP). Lisätyt analyysit eivät ainoastaan auta käyttäjiä löytämään syvällisempiä tietoja nopeammin – he voivat automatisoida monia monimutkaisia prosessin vaiheita ja antaa myös ei-teknisten käyttäjien kysellä tietoja luonnollisella ja keskustelullisella tavalla.
Mitä tiedonlouhinta on?
Tiedonlouhinta tarkoittaa hyödyllisen tiedon poimintaa suurista tietoaineistoista. Tiedonlouhintaa tekevät usein liiketoimintakäyttäjät, jotka käyttävät analyysityökaluja paljastaakseen malleja, trendejä, poikkeavuuksia, suhteita, riippuvuuksia ja muita hyödyllisiä tietoja. Tiedonlouhinnassa on laaja valikoima sovelluksia petosten ja kyberturvallisuusongelmien havaitsemisesta ennusteiden parantamiseen ja suorituskyvyn parantamismahdollisuuksien löytämiseen.
Mitä on tietojen profilointi?
Tietojen profilointi on käytäntö kerätä tilastoja ja ominaisuuksia aineistosta, kuten sen tarkkuus, täydellisyys ja pätevyys. Tietojen profilointi on yksi tietojen validointi- ja puhdistustyössä käytetyistä tekniikoista, sillä se voi auttaa havaitsemaan tietojen laatuongelmia, kuten irtisanomisia, puuttuvia arvoja ja epäyhtenäisyyksiä.
SAP-logo

SAP-tuote

Mitä on tiedonhallinta?

Lue, miten organisaatiosi voi muuntaa tietonsa arvokkaaksi voimavaraksi.

Lisätietoja