flex-height
text-black

Serverová miestnosť

Glosár správy údajov

Preskúmajte celý rad pojmov a definícií týkajúcich sa údajov v našom glosári správy údajov.

Čo je databáza?
Databáza je zariadenie na organizovanie, uchovávanie, správu, ochranu a kontrolu prístupu k údajom. Databázy sú navrhnuté podľa množstva rôznych schém (schém), z ktorých mnohé sa riadia relačným modelom pre jednoduchší prístup programami a dotazmi na dáta. Bežné typy databáz zahŕňajú systémy relačnej správy databáz (RDBMS), databázy in-memory, objektovo orientované databázy (OODBMS), databázy NoSQL a databázy NewSQL – každá s vlastnými výhodami.
Čo je správa údajov?
Správa údajov sa vzťahuje na všetky funkcie potrebné na zhromažďovanie, kontrolu, ochranu, manipuláciu a doručovanie údajov. Systémy správy údajov zahŕňajú databázy, dátové sklady a dátové trhy, nástroje na zber, uchovávanie a vyhľadávanie údajov a nástroje na pomoc pri overovaní, kvalite a integrácii s aplikáciami a analytickými nástrojmi. Podniky potrebujú dátovú stratégiu na stanovenie zodpovednosti za údaje, ktoré vznikajú alebo sú endemické v konkrétnych oblastiach zodpovednosti.
Čo je správa databáz?
Správa databáz sa vzťahuje na procesy a postupy, ktoré sú potrebné na ukladanie, spracovanie, manipuláciu a ochranu údajov. V mnohých organizáciách je za vytvorenie a dohľad nad takýmito procedúrami zodpovedný primárny správca databázy (DBA) alebo podobná pozícia. Väčšina organizácií sa spolieha na systém správy komerčných databáz (DBMS) ako primárny nástroj na správu ich databázy.
Čo je systém správy databáz (DBMS)?
Systém správy databáz (DBMS) je softvérový súbor nástrojov, ktorý poskytuje štruktúru ukladacieho priestoru a nástroj na správu dát pre správu databáz. DBMS môže byť neoddeliteľnou súčasťou licencovaného systému plánovania podnikových zdrojov (ERP), požadovaného samostatného nákupu, časti systémového softvéru (operačného systému) alebo samostatne licencovaného softvérového produktu. Bez ohľadu na zdroj je nevyhnutné, aby boli aplikácie postavené okolo a/alebo úplne integrované s DBMS, pretože sú vzájomne závislé od efektívnej funkčnosti aplikácií aj DBMS. DBMS je v podstate súbor nástrojov pre správu databáz.
Čo je databáza SQL?
Databáza SQL je relačná databáza, ktorá ukladá údaje do tabuliek a riadkov. Dátové položky (riadky) sú prepojené na základe spoločných údajových položiek, aby sa umožnila efektívnosť, zabránilo redundancii a uľahčilo jednoduché a flexibilné vyhľadávanie. Názov SQL pochádza z jazyka štruktúrovaných dotazov, sady nástrojov a protokolu dotazov v prirodzenom jazyku, ktorý sa používatelia môžu naučiť a použiť pre akúkoľvek vyhovujúcu databázu na ukladanie, manipuláciu a získavanie údajov.
Čo je databáza NoSQL?
NoSQL databázy boli vyvinuté pre spracovanie neštruktúrovaných dát, ktoré SQL nemôže podporovať kvôli nedostatku štruktúry. NoSQL využíva kreatívne techniky na prekonanie tohto obmedzenia vrátane dynamických schém a rôznych predprocesorových techník. Najbežnejšie typy databáz pre neštruktúrované údaje sú databázy kľúč-hodnota, dokument, stĺpec a graf databázy a často zahŕňajú veci ako video, grafika, voľný text a nespracovaný výstup senzora.
Čo je relačný systém správy databáz (RDBMS)?
Systém relačnej správy databáz je systém správy databáz (DBMS), ktorý je založený na modeli relačných údajov. Obsah RDBMS je uložený v tabuľkách, pozostávajúci z riadkov a stĺpcov, pričom každá tabuľka predstavuje konkrétny objekt alebo entitu v databáze, ktorá môže súvisieť s iným. RDBMS zvyčajne obsahuje viacero tabuliek a zahŕňa ďalšie funkcie, ktoré zachovávajú presnosť, konzistentnosť, integritu a bezpečnosť údajov, ako aj rozhranie SQL na prístup k údajom vo vzájomnom vzťahu prostredníctvom komplexných dotazov.
Čo je CDBMS?
CDBMS je termín vytvorený Gartnerom, ktorý popisuje hlavne model nasadenia cloudu pre RDBMS vyššie.
Čo sú štruktúrované údaje?
Štruktúrované údaje sú úhľadne naformátované do riadkov a stĺpcov a mapované na preddefinované polia. Typicky uložené v excelových tabuľkových hárkoch alebo relačných databázach, príklady zahŕňajú finančné transakcie, demografické informácie a protokoly počítača. Až donedávna boli štruktúrované údaje jediným použiteľným typom údajov pre podniky.
Čo sú neštruktúrované údaje?
Neštruktúrované údaje nie sú usporiadané do riadkov a stĺpcov, čo sťažuje ukladanie, analýzu a vyhľadávanie. Príkladom sú nespracované údaje o internete vecí (Internet of Things, IoT), video a zvukové súbory, komentáre v sociálnych médiách a prepisy call centra. Neštruktúrované údaje sa zvyčajne ukladajú do dátových jazier, databáz NoSQL alebo moderných dátových skladov.
Čo sú pološtruktúrované údaje?
Pološtruktúrované dáta majú niektoré organizačné vlastnosti, ako sú sémantické značky alebo metadáta, ale nezodpovedajú riadkom a stĺpcom tabuľkovej kalkulácie alebo relačnej databázy. Dobrým príkladom pološtruktúrovaných údajov je e-mail – ktorý obsahuje niektoré štruktúrované údaje, ako sú adresy odosielateľa a príjemcu, ale aj neštruktúrované údaje, ako je samotná správa.
Čo je mapovanie údajov?
Mapovanie dát je proces porovnania polí medzi rôznymi dátovými štruktúrami alebo databázami. Je to nevyhnutný krok, ak sa majú databázy kombinovať, ak sa údaje migrujú z jedného systému alebo databázy do druhého, alebo ak sa majú použiť rôzne zdroje údajov v rámci jednej aplikácie alebo analytického nástroja – ako sa to často stáva pri skladovaní údajov. Mapovanie údajov identifikuje jedinečné, konfliktné a duplicitné informácie, aby bolo možné vytvoriť súbor pravidiel na uvedenie všetkých údajov do koordinovanej schémy alebo formátu.
Čo je modelovanie údajov?
Pri vytváraní novej alebo alternatívnej štruktúry databázy návrhár začína diagramom toho, ako budú údaje prúdiť do databázy a von z databázy. Diagnostika tokov údajov sa nazýva modelovanie údajov. Z tohto diagramu toku môžu softvéroví inžinieri definovať charakteristiky dátových formátov, štruktúr a funkcií spracovania databázy, aby efektívne podporovali požiadavky na tok údajov.
Čo je skladovanie údajov?
Dátový sklad poskytuje jedno komplexné úložisko pre dáta z mnohých rôznych zdrojov - interných aj externých. Jeho hlavným účelom je poskytnúť dáta pre business intelligence (BI), reporting a analytiku. Moderné dátové sklady môžu ukladať a spravovať všetky typy údajov, štruktúrované a neštruktúrované a zvyčajne sú nasadené v cloude pre väčšiu škálovateľnosť a jednoduchosť používania.
Čo je to dátové jazero?
Údajové jazero je rozsiahly súbor dát uložených v jeho nespracovanom alebo prirodzenom formáte. Údajové jazerá sa zvyčajne používajú na ukladanie veľkých dát vrátane štruktúrovaných, neštruktúrovaných a pološtruktúrovaných dát.
Čo je Big Data?
Big Data je pojem, ktorý popisuje extrémne veľké množiny dát štruktúrovaných, neštruktúrovaných a pološtruktúrovaných dát. Big Data je často charakterizovaný piatimi verziami: obyčajný objem zozbieraných dát, rôznorodosť typov dát, rýchlosť, pri ktorej sa dáta generujú, pravdivosť dát a ich hodnota. Vďaka riadiacim systémom Big Data a analytike môžu spoločnosti ťažiť Big Data pre podrobné prehľady, ktoré usmerňujú rozhodovanie a akcie.
Čo sú to malé údaje?
Na rozdiel od Big Data, ktorý je veľmi objemný a zložitý, malé dáta sú pre človeka ľahko pochopiteľné. Malé súbory údajov môžu zahŕňať čokoľvek od marketingových prieskumov až po každodenné tabuľky – a dokonca môžu byť také „malé“ ako jediný príspevok alebo e-mail na sociálnych médiách. Spoločnosti čoraz častejšie používajú malé dáta, okrem Big Data, na trénovanie svojich algoritmov umelej inteligencie a strojového učenia pre ešte hlbšie prehľady.
Čo sú hrubé údaje?
Hrubé údaje sú kvalitatívne informácie, ktoré poskytujú prehľad o každodennom emocionálnom živote spotrebiteľov. Zahŕňa pozorovania, pocity a reakcie – veci, ktoré sa zvyčajne ťažko kvantifikujú. V kombinácii s Big Data vzniká veľmi komplexný obraz o preferenciách a požiadavkách spotrebiteľa.
Čo je integrácia údajov?
Integrácia údajov je praktické prijímanie, transformácia, kombinovanie a poskytovanie údajov tam, kde a kedy je to potrebné. Táto integrácia sa uskutočňuje v podniku a mimo neho (medzi partnermi, ako aj v zdrojoch údajov a prípadoch použitia tretích strán), aby sa splnili požiadavky na spotrebu dát všetkých aplikácií a obchodných procesov. Techniky zahŕňajú hromadný/dávkový pohyb údajov, extrakciu, transformáciu, načítanie (ETL), zaznamenávanie údajov zmien, replikáciu údajov, virtualizáciu údajov, integráciu streamovaných údajov, orchestráciu údajov a ďalšie.
Čo je virtualizácia údajov?
Virtualizácia údajov poskytuje spoločnostiam jednotný pohľad na všetky podnikové údaje – naprieč rôznymi systémami a formátmi – vo virtuálnej údajovej vrstve. Namiesto duplikovania dát virtualizácia dát opúšťa dáta vo svojich zdrojových systémoch a jednoducho vystavuje ich virtuálnu reprezentáciu používateľom a aplikáciám v reálnom čase. Virtualizácia údajov je moderný prístup k integrácii údajov, ktorý umožňuje používateľom objavovať a manipulovať s údajmi bez ohľadu na ich fyzické umiestnenie, formát alebo protokol.
Čo je to dátová tkanina?
Dátová tkanina je prispôsobená kombinácia architektúry a technológie. Používa dynamickú integráciu údajov a orchestráciu na prepojenie rôznych miest, zdrojov a typov údajov. So správnymi štruktúrami a tokmi, ako sú definované v rámci platformy pre dátové štruktúry, môžu spoločnosti rýchlo pristupovať k údajom a zdieľať ich bez ohľadu na to, kde sú alebo ako boli vygenerované.
Čo je to údajové pletivo?
Dátová sieť je prístup k správe údajov, ktorý využíva distribuovaný architektonický rámec. Inými slovami: rozširuje vlastníctvo a zodpovednosť za konkrétne množiny údajov v rámci podniku, na používateľov, ktorí majú odborné znalosti, aby pochopili, čo tieto údaje znamenajú a ako ich čo najlepšie využiť.
Čo je dátový kanál?
Kanál údajov popisuje súbor automatizovaných a opakovateľných procesov na vyhľadávanie, čistenie, transformáciu a analýzu akéhokoľvek typu údajov vo svojom zdroji. Keďže údaje sa analyzujú blízko miesta ich generovania, podnikoví používatelia môžu organizáciu rýchlo analyzovať a zdieľať informácie, ktoré potrebujú, za nižšie náklady. Dátové potrubia môžu byť tiež vylepšené technológiami, ako je strojové učenie, aby boli rýchlejšie a efektívnejšie.
Čo sú to dátové zásobníky?
Dátový silo je slangový pojem pre situáciu, v ktorej jednotlivé oddelenia alebo funkčné oblasti v rámci podniku nezdieľajú údaje a informácie s inými oddeleniami. Táto izolácia bráni koordinovanému úsiliu o dosiahnutie cieľov spoločnosti a vedie k slabému výkonu (a slabému zákazníckemu servisu), vysokým nákladom a všeobecnej neschopnosti reagovať na požiadavky trhu a zmeny. Duplicitné a nadbytočné dáta je ťažké zosúladiť, čím sa ešte viac zabráni akémukoľvek pokusu o koordináciu aktivít a efektívne riadenie podniku.
Čo je wrangling údajov?
Wrangling dát je proces preberania nespracovaných dát a ich transformácie do formátu, ktorý je kompatibilný s vytvorenými databázami a aplikáciami. Proces môže podľa potreby zahŕňať štruktúrovanie, čistenie, obohacovanie a overovanie údajov, aby boli nespracované údaje užitočné.
Čo je bezpečnosť údajov?
Zabezpečenie údajov je aktom zabezpečenia údajov – bezpečných pred neoprávneným prístupom alebo expozíciou, katastrofou alebo zlyhaním systému a zároveň ľahko dostupným oprávneným používateľom a aplikáciám. Metódy a nástroje zahŕňajú šifrovanie údajov, správu kľúčov, postupy redundancie a zálohovania a kontroly prístupu. Zabezpečenie údajov je požiadavkou pre organizácie všetkých veľkostí a typov, aby chránili zákaznícke a organizačné údaje pred neustále sa zvyšujúcou hrozbou porušenia ochrany údajov a rizík súvisiacich s ochranou osobných údajov. Redundancia a zálohy sú dôležité pre kontinuitu podnikania a obnovu po havárii.
Čo je ochrana osobných údajov?
Ochrana osobných údajov sa vzťahuje na zásady a postupy spracovania údajov spôsobmi, ktoré ich chránia pred neoprávneným prístupom alebo zverejnením. Zásady a postupy ochrany osobných údajov sa vzťahujú na to, ako sa informácie zhromažďujú a uchovávajú podľa stratégie organizácie v oblasti údajov, ako ich možno alebo nemusia zdieľať s tretími stranami, a ako dodržiavať regulačné obmedzenia. Ochrana osobných údajov je biznis nevyhnutnosťou, ktorá napĺňa očakávania klienta a zároveň chráni integritu a bezpečnosť uložených informácií.
Čo je kvalita údajov?
Kvalita údajov je hmlový pojem popisujúci vhodnosť a spoľahlivosť údajov. Dobré, kvalitné údaje jednoducho znamenajú, že údaje sú presné (skutočne reprezentatívne z toho, čo popisujú), spoľahlivé (konzistentné, kontrolovateľné, správne spravované a chránené) a úplné v rozsahu, ktorý používatelia a aplikácie vyžadujú. Kvalitu údajov možno zabezpečiť len prostredníctvom vhodne vypracovanej a vykonanej dátovej stratégie, ktorá sa vykonáva pomocou nástrojov a systémov priemyselnej sily spolu so zásadným dodržiavaním politík a postupov správy údajov.
Čo je overenie údajov?
Overenie údajov je proces určenia kvality, presnosti a platnosti údajov pred ich importom alebo použitím. Overenie môže pozostávať zo série aktivít a procesov na autentifikáciu údajov a všeobecne „vyčistenie“ údajových položiek vrátane odstránenia duplicít, opravy zjavných chýb alebo chýbajúcich položiek a možných zmien formátovania (očistenie údajov). Overenie údajov zabezpečuje, že informácie, ktoré potrebujete na prijímanie dôležitých rozhodnutí, sú presné a dôveryhodné.
Čo je čistenie údajov?
Očistenie údajov je proces odstránenia alebo opravy chýb z množiny údajov, tabuľky alebo databázy. Tieto chyby môžu zahŕňať poškodené, nepresné, nerelevantné alebo neúplné informácie. Tento proces, nazývaný aj drvenie údajov, nájde duplicitné údaje a ďalšie nekonzistencie, ako sú preklepy a číselné množiny, ktoré sa nespočítavajú. Očistenie údajov môže odstrániť nesprávne informácie alebo opraviť zjavné chyby, ako sú prázdne polia alebo chýbajúce kódy.
Čo je integrita údajov?
Integrita údajov sa vzťahuje na pravdivosť údajov z dlhodobého hľadiska. Po zadaní alebo importe údajov, zhodnotení, overení, vyčistení a uložení údajov je integrita údajov vyhlásením, že kvalita údajov sa udržiava a používatelia si môžu byť istí, že údaje, ktoré boli vložené, sa nezmenili a nezmenia. Získané údaje sú rovnaké ako údaje, ktoré boli pôvodne uložené. Niekedy sa používa ako synonymum pre kvalitu údajov, integrita údajov je viac o spoľahlivosti a spoľahlivosti.
Čo je správa údajov?
Správa údajov je súbor politík a postupov na zaistenie riadnej správy údajov v celej organizácii. Stanovuje IT infraštruktúru a menuje jednotlivcov (alebo pozície), ktorí majú právomoc a zodpovednosť za manipuláciu s konkrétnymi typmi údajov a ich ochranu. Efektívne riadenie údajov zaisťuje, že údaje sú dostupné, dôveryhodné, bezpečné a kompatibilné – a že sa nezneužijú.
Čo je správa údajov?
Spravovanie údajov je implementácia politík a postupov správy údajov na stanovenie presnosti, spoľahlivosti, integrity a bezpečnosti údajov. Jednotlivci priradení k zodpovednostiam za správu údajov riadia a dohliadajú na postupy a nástroje používané na spracovanie, ukladanie a ochranu údajov.
Čo je dátová architektúra?
Dátová architektúra je celkový návrh štruktúry, politík a pravidiel, ktoré definujú dáta organizácie a ako sa budú používať a spravovať. Dátová architektúra obsahuje podrobnosti o tom, ako je stratégia údajov implementovaná na podporu obchodných potrieb a cieľov, a slúži ako základ pre vývoj databáz, procedúr, záruk, zabezpečenia a dozoru nad údajmi.
Čo je správa kmeňových dát?
Master Data Management (MDM) je prax vytvárania jedného, „hlavného“ referenčného zdroja pre všetky dôležité obchodné údaje. Zahŕňa politiky a postupy na definovanie, správu a kontrolu (alebo riadiace) spracovanie kmeňových dát. Centralizovaná správa kmeňových dát eliminuje konflikt a zmätok, ktorý pochádza z rozptýlených databáz s duplicitnými informáciami a nekoordinovanými údajmi, ktoré môžu byť zastarané, poškodené alebo posunuté včas - aktualizované na jednom mieste, ale nie na inom. Mať jednu verziu slúžiacu celému podniku znamená, že všetky časti organizácie pracujú s rovnakými definíciami, štandardmi a predpokladmi.
Čo sú analýzy?
Pojem analýza sa vzťahuje na systematickú analýzu údajov. Analytické aplikácie a sady nástrojov obsahujú matematické algoritmy a výpočtové nástroje, ktoré dokážu manipulovať s veľkými množinami údajov tak, aby odhalili vzory, trendy, vzťahy a iné inteligencie, ktoré používateľom umožňujú klásť otázky a získavať užitočné informácie o ich podnikaní, operáciách a trhoch. Mnoho moderných analytických súprav nástrojov je navrhnutých pre netechnických podnikateľov, čo im umožňuje vykonávať tieto analýzy s minimálnou pomocou dátových vedcov alebo IT špecialistov.
Čo sú rozšírené analýzy?
Rozšírené analýzy sú analýzy, ktoré sú „rozšírené“ o technológie umelej inteligencie vrátane strojového učenia a spracovania prirodzeného jazyka (NLP). Rozšírené analýzy môžu nielen pomôcť používateľom odhaliť hlbšie prehľady, rýchlejšie – môžu automatizovať mnoho komplikovaných krokov v procese a umožniť aj netechnickým používateľom vyhľadávať údaje prirodzeným a konverzačným spôsobom.
Čo je dolovanie údajov?
Dolovanie dát je akt získavania užitočných informácií z veľkých množín údajov. dolovanie údajov často vykonávajú podnikoví používatelia využívajúci analytické nástroje na odhalenie vzorov, trendov, anomálií, vzťahov, závislostí a iných užitočných informácií. Ťažba údajov má širokú škálu aplikácií, od odhaľovania podvodov a obáv o kybernetickú bezpečnosť až po zlepšovanie prognóz a hľadanie príležitostí na zlepšenie výkonnosti.
Čo je profilovanie údajov?
Profilovanie údajov je prax zberu štatistík a charakteristík o súbore údajov, ako je ich presnosť, úplnosť a platnosť. Profilovanie údajov je jednou z techník používaných pri overovaní údajov a čistení údajov, pretože môže pomôcť odhaliť problémy s kvalitou údajov, ako sú nadbytočné práce, chýbajúce hodnoty a nezrovnalosti.
Logo SAP

Produkt SAP

Čo je správa údajov?

Zistite, ako môže vaša organizácia transformovať svoje údaje na cenné aktívum.

Zistiť viac