flex-height
text-black
Glosář správy dat
Seznamte se s řadou pojmů a definic souvisejících s daty v našem glosáři správy dat.
default
{}
default
{}
primary
default
{}
secondary
Co je to databáze?
Databáze je zařízení pro organizaci, ukládání, správu, zabezpečení a kontrolu přístupu k datům. Databáze jsou koncipovány podle řady různých schémat (schémat), z nichž mnohé dodržují relační model pro snadnější přístup programů a datových dotazů. Mezi běžné typy databází patří systémy pro správu relačních databází (RDBMS), in-memory databáze, objektově orientované databáze (OODBMS), databáze NoSQL a databáze NewSQL – každá s vlastními výhodami.
Co je to správa dat?
Správa dat se týká všech funkcí potřebných ke shromažďování, kontrole, ochraně, manipulaci a doručování dat. Systémy pro správu dat zahrnují databáze, datové sklady a datové tržiště; nástroje pro sběr, ukládání a vyhledávání dat; a nástroje, které pomáhají s validací, kvalitou a integrací s aplikacemi a analytickými nástroji. Podniky potřebují datovou strategii, aby stanovily odpovědnost za údaje, které pocházejí nebo jsou endemické pro určité oblasti odpovědnosti.
Co je to správa databází?
Správa databáze se týká procesů a postupů, které jsou nutné pro ukládání, zpracování, manipulaci a ochranu dat. V mnoha organizacích je odpovědnost za zřízení a dohled nad takovými postupy primární odpovědností správce databáze (DBA) nebo podobné pozice. Většina organizací se spoléhá na komerční systém správy databází (DBMS) jako na primární nástroj pro správu jejich databáze.
Co je to systém správy databází (DBMS)?
Databázový systém (DBMS) je softwarová sada nástrojů, která poskytuje strukturu úložiště a nástroj pro správu dat pro správu databází. DBMS může být nedílnou součástí licencovaného systému plánování podnikových zdrojů (ERP), požadovaného samostatného nákupu, části systémového softwaru (operačního systému) nebo samostatně licencovaného softwarového produktu. Bez ohledu na zdroj je nezbytné, aby aplikace byly postaveny kolem a/nebo zcela integrovány s DBMS, protože jsou vzájemně závislé na efektivní funkčnosti aplikací i DBMS. DBMS je v podstatě sada nástrojů pro správu databáze.
Co je to databáze SQL?
SQL databáze je relační databáze, která ukládá data do tabulek a řádků. Datové položky (řádky) jsou propojeny na základě společných datových položek, což umožňuje efektivitu, zabraňuje redundanci a usnadňuje snadné a flexibilní vyhledávání. Název SQL je odvozen od Strukturovaného dotazovacího jazyka, sady nástrojů a protokolu dotazů v přirozeném jazyce, který se mohou uživatelé naučit a aplikovat na jakoukoli kompatibilní databázi pro ukládání dat, manipulaci a vyhledávání.
Co je to databáze NoSQL?
NoSQL databáze byly vyvinuty pro zpracování nestrukturovaných dat, které SQL nemůže podporovat kvůli nedostatku struktury. NoSQL využívá kreativní techniky k překonání tohoto omezení včetně dynamických schémat a různých technik předběžného zpracování. Nejběžnější typy databází pro nestrukturovaná data jsou klíčové, dokumentové, sloupcové a grafové databáze a často zahrnují věci jako video, grafiku, volný text a surový senzor.
Co je systém pro správu relačních databází (RDBMS)?
Relační systém správy databáze je systém správy databází (DBMS), který je založen na relačním datovém modelu. Obsah RDBMS je uložen v tabulkách tvořených řádky a sloupci, přičemž každá tabulka představuje určitý objekt nebo entitu v databázi, která může souviset s jiným. RDBMS obvykle obsahuje více tabulek a obsahuje další funkce, které udržují přesnost, konzistenci, integritu a zabezpečení dat, stejně jako SQL rozhraní pro přístup k datům ve vzájemném vztahu prostřednictvím komplexních dotazů.
Co je to CDBMS?
CDBMS je termín vytvořený společností Gartner, který popisuje hlavně model nasazení cloudu pro RDBMS výše.
Co jsou strukturovaná data?
Strukturovaná data jsou úhledně formátována do řádek a sloupců a mapována na předdefinovaná pole. Typicky se ukládají do excelových tabulek nebo relačních databází, příklady zahrnují finanční transakce, demografické informace a protokoly počítačů. Až donedávna byla strukturovaná data jediným použitelným typem dat pro podniky.
Co jsou nestrukturovaná data?
Nestrukturovaná data nejsou uspořádána do řádků a sloupců, což ztěžuje ukládání, analýzu a vyhledávání. Příklady zahrnují surová data Internet of Things (IoT), video a audio soubory, komentáře na sociálních médiích a přepisy call center. Nestrukturovaná data se obvykle ukládají do datových jezer, databází NoSQL nebo moderních datových skladů.
Co jsou polostrukturovaná data?
Sémantická data mají některé organizační vlastnosti, jako jsou sémantické značky nebo metadata, ale neodpovídají řádkům a sloupcům kalkulační tabulky nebo relační databáze. Dobrým příkladem polostrukturovaných dat je e-mail, který obsahuje některá strukturovaná data, jako jsou adresy odesílatele a příjemce, ale také nestrukturovaná data, jako je samotná zpráva.
Co je to mapování dat?
Mapování dat je proces porovnání polí mezi různými datovými strukturami nebo databázemi. To je nezbytný krok, pokud mají být databáze kombinovány, pokud se data migrují z jednoho systému nebo databáze do jiného, nebo pokud se mají v rámci jedné aplikace nebo analytického nástroje používat různé zdroje dat – což se často děje v datových skladech. Mapování dat identifikuje jedinečné, konfliktní a duplicitní informace, takže lze vyvinout soubor pravidel pro převedení všech dat do koordinovaného schématu nebo formátu.
Co je to modelování dat?
Při vytváření nové nebo alternativní databázové struktury začíná návrhář diagramem, jak budou data proudit do a z databáze. Diagramování datových toků se nazývá modelování dat. Z tohoto vývojového diagramu mohou softwaroví inženýři definovat charakteristiky datových formátů, struktur a funkcí pro zpracování databáze, aby efektivně podporovali požadavky na datový tok.
Co je to skladování dat?
Datový sklad poskytuje jediné komplexní úložiště dat z mnoha různých zdrojů – jak interních, tak externích. Jeho hlavním účelem je poskytovat data pro business intelligence (BI), výkaznictví a analýzy. Moderní datové sklady mohou ukládat a spravovat všechny datové typy, strukturované i nestrukturované a jsou typicky nasazeny v cloudu pro větší škálovatelnost a snadné používání.
Co je datové jezero?
Datové jezero je rozsáhlý soubor dat uložených v jeho surovém nebo přirozeném formátu. Datová jezera se obvykle používají k ukládání velkých dat, včetně strukturovaných, nestrukturovaných a polostrukturovaných dat.
Co jsou velká data?
Big Data je pojem, který popisuje extrémně velké datové sady strukturovaných, nestrukturovaných a polostrukturovaných dat. Big Data se často vyznačují pěti V: naprostým objemem shromážděných dat, rozmanitostí datových typů, rychlostí, při které jsou data generována, pravdivostí dat a jejich hodnotou. Díky systémům a analytickým nástrojům pro správu velkých dat mohou společnosti těžit velká data a získat tak hluboké přehledy, které řídí rozhodování a akce.
Co jsou to malá data?
Na rozdíl od velkých dat, která jsou obrovsky objemná a složitá, jsou malá data pro člověka snadno pochopitelná. Malé datové sady mohou zahrnovat cokoliv od marketingových průzkumů až po každodenní tabulky – a mohou být dokonce stejně „malé“ jako jeden příspěvek na sociálních médiích nebo e-mail. Společnosti stále častěji používají malá data, kromě velkých dat, k trénování své umělé inteligence a algoritmů strojového učení pro ještě hlubší analýzy.
Co jsou to hustá data?
Tlustá data jsou kvalitativní informace, které poskytují vhled do každodenního emocionálního života spotřebitelů. Zahrnuje pozorování, pocity a reakce – věci, které je obvykle obtížné kvantifikovat. V kombinaci s Big Data se objevuje velmi komplexní obraz o preferencích a požadavcích spotřebitele.
Co je to integrace dat?
Integrace dat je praxe přijímání, transformace, kombinování a poskytování dat, kde a kdy je to potřeba. Tato integrace probíhá v podniku i mimo něj – napříč partnery i zdroji dat třetích stran a případech použití – aby splňovala požadavky na spotřebu dat všech aplikací a obchodních procesů. Techniky zahrnují hromadný/dávkový pohyb dat, extrakci, transformaci, načtení (ETL), zachycení změnových dat, replikaci dat, virtualizaci dat, integraci streamovaných dat, orchestraci dat a další.
Co je virtualizace dat?
Virtualizace dat poskytuje společnostem jednotný pohled na všechna podniková data – napříč různými systémy a formáty – ve virtuální datové vrstvě. Namísto duplikování dat virtualizace dat ponechává data ve svých zdrojových systémech a jednoduše vystavuje jejich virtuální reprezentaci uživatelům a aplikacím v reálném čase. Virtualizace dat je moderní přístup k integraci dat, který umožňuje uživatelům objevovat a manipulovat s daty bez ohledu na jejich fyzické umístění, formát nebo protokol.
Co je to datová tkanina?
Datová struktura je přizpůsobená kombinace architektury a technologie. Používá dynamickou integraci a orchestraci dat k propojení různých umístění, zdrojů a typů dat. Se správnými strukturami a toky definovanými v rámci platformy datové struktury mohou společnosti rychle přistupovat k datům a sdílet je bez ohledu na to, kde se nacházejí nebo jak byla vygenerována.
Co je to datová síť?
Datová síť je přístup ke správě dat, který používá distribuovaný architektonický rámec. Jinými slovy: šíří vlastnictví a odpovědnost za konkrétní datové soubory v celém podniku, na ty uživatele, kteří mají odborné znalosti, aby pochopili, co tyto údaje znamenají a jak je co nejlépe využít.
Co je to datový kanál?
Datový kanál popisuje sadu automatizovaných a opakovatelných procesů pro nalezení, očištění, transformaci a analýzu jakéhokoli typu dat u svého zdroje. Vzhledem k tomu, že data jsou analyzována poblíž místa, kde jsou generována, mohou podnikoví uživatelé rychle analyzovat a sdílet potřebné informace s nižšími náklady pro organizaci. Datové kanály mohou být také vylepšeny technologiemi, jako je strojové učení, aby byly rychlejší a efektivnější.
Co jsou datová sila?
Datové silo je slangový termín pro situaci, kdy jednotlivá oddělení nebo funkční oblasti v rámci podniku nesdílejí data a informace s jinými odděleními. Tato izolace zabraňuje koordinovanému úsilí o dosažení cílů společnosti a vede ke špatnému výkonu (a špatnému zákaznickému servisu), vysokým nákladům a obecné neschopnosti reagovat na požadavky a změny trhu. Duplicitní a redundantní data je obtížné odsouhlasit, dále zabránit jakémukoli pokusu o koordinaci činností a efektivnímu řízení podniku.
Co jsou to data?
Wrangling dat je proces převzetí surových dat a jejich transformace do formátu, který je kompatibilní se zavedenými databázemi a aplikacemi. Proces může zahrnovat strukturování, čištění, obohacování a ověřování dat podle potřeby, aby byla prvotní data užitečná.
Co je to zabezpečení dat?
Bezpečnost dat je akt, který zajišťuje bezpečnost a bezpečnost dat – bezpečných před neoprávněným přístupem nebo expozicí, katastrofou nebo selháním systému a zároveň snadno přístupných legitimním uživatelům a aplikacím. Metody a nástroje zahrnují šifrování dat, správu klíčů, postupy redundance a zálohování a řízení přístupu. Zabezpečení dat je požadavek pro organizace všech velikostí a typů, aby ochránily data zákazníků a organizace před stále rostoucí hrozbou narušení bezpečnosti dat a rizik pro soukromí. Redundance a zálohy jsou důležité pro kontinuitu provozu a obnovu po havárii.
Co je to ochrana osobních údajů?
Ochrana osobních údajů se týká zásad a postupů pro nakládání s daty způsobem, který je chrání před neoprávněným přístupem nebo zveřejněním. Zásady a postupy ochrany osobních údajů zahrnují způsob shromažďování a uchovávání informací podle strategie organizace pro data, jak mohou nebo nemusí být sdíleny s třetími stranami a jak dodržovat regulační omezení. Ochrana osobních údajů je nutností, která splňuje očekávání klientů a zároveň chrání integritu a bezpečnost uložených informací.
Co je to kvalita dat?
Kvalita dat je mlhavý termín popisující vhodnost a spolehlivost dat. Dobré, kvalitní údaje jednoduše znamenají, že údaje jsou přesné (skutečně reprezentují to, co popisují), spolehlivé (konzistentní, auditovatelné, správně spravované a chráněné) a úplné v rozsahu, který uživatelé a aplikace vyžadují. Kvalitu údajů lze zajistit pouze řádně navrženou a provedenou datovou strategií prováděnou pomocí nástrojů a systémů průmyslové síly spolu s pečlivě dodržovanými politikami a postupy pro správu dat.
Co je to ověření dat?
Ověření dat je proces určování kvality, přesnosti a platnosti dat před jejich importem nebo použitím. Ověření se může skládat z řady činností a procesů pro autentizaci dat a obecně „vyčištění“ datových položek, včetně odstranění duplikátů, opravy zjevných chyb nebo chybějících položek a možných změn formátování (očištění dat). Ověření dat zajišťuje, že informace, které potřebujete pro přijímání důležitých rozhodnutí, jsou přesné a důvěryhodné.
Co je to očištění dat?
Očištění dat je proces odstranění nebo opravy chyb z datové sady, tabulky nebo databáze. Tyto chyby mohou zahrnovat poškozené, nepřesné, irelevantní nebo neúplné informace. Tento proces, nazývaný také scrubbing dat, najde duplicitní data a další nekonzistence, jako jsou překlepy a numerické sady, které se nesečtou. Očištění dat může odstranit nesprávné informace nebo opravit zjevné chyby, jako jsou prázdná pole nebo chybějící kódy.
Co je to integrita dat?
Integrita dat se týká věrohodnosti dat v dlouhodobém horizontu. Jakmile jsou data zadána nebo importována, změněna, ověřena, vyčištěna a uložena, integrita dat je prohlášení, že kvalita dat je udržována a uživatelé si mohou být jisti, že data, která vstoupila, se nezměnila a nebudou se měnit. Načtená data jsou stejná jako původně uložená data. Někdy se používá jako synonymum pro kvalitu dat, integrita dat je více o spolehlivosti a spolehlivosti.
Co je to správa dat?
Správa dat je soubor zásad a postupů pro zajištění řádné správy dat v celé organizaci. Zřizuje infrastrukturu IT a jmenuje osoby (nebo pozice), které mají pravomoc a odpovědnost za nakládání s konkrétními typy údajů a jejich ochranu. Efektivní správa dat zajišťuje, že data jsou dostupná, důvěryhodná, bezpečná a v souladu s předpisy – a že nejsou zneužívána.
Co je to správa dat?
Správa dat je implementace zásad a postupů správy dat pro stanovení přesnosti, spolehlivosti, integrity a bezpečnosti dat. Jednotlivci přiřazení s odpovědností za správu dat spravují a dohlížejí na postupy a nástroje používané ke zpracování, ukládání a ochraně dat.
Co je to datová architektura?
Datová architektura je celkový návrh struktury, zásad a pravidel, které definují data organizace a jak budou používána a spravována. Datová architektura obsahuje podrobnosti o tom, jak je datová strategie implementována na podporu obchodních potřeb a cílů – a slouží jako základ pro vývoj databází, postupů, záruk, bezpečnosti a správy dat.
Co je to správa kmenových dat?
Správa kmenových dat (MDM) je praxe vytváření jediného, „hlavního“ referenčního zdroje pro všechna důležitá obchodní data. Zahrnuje zásady a postupy pro definování, správu a řízení (nebo řízení) zpracování kmenových dat. Centralizovaná správa kmenových dat eliminuje konflikty a nejasnosti, které vyplývají z rozptýlených databází s duplicitními informacemi a nekoordinovanými daty, která mohou být zastaralá, poškozená nebo přemístěná v čase – aktualizovaná na jednom místě, ale ne na jiném místě. Mít jednu verzi sloužící celému podniku znamená, že všechny části organizace pracují se stejnými definicemi, standardy a předpoklady.
Co jsou to analytické nástroje?
Pojem analytika označuje systematickou analýzu dat. Analytické aplikace a sady nástrojů obsahují matematické algoritmy a výpočetní enginy, které mohou manipulovat s velkými datovými sadami a odhalovat tak vzory, trendy, vztahy a další inteligenci, které umožňují uživatelům klást otázky a získávat užitečné informace o jejich podnikání, provozu a trzích. Mnoho moderních analytických nástrojů je navrženo pro použití netechnickými podnikateli, což jim umožňuje provádět tyto analýzy za minimální pomoci datových vědců nebo IT specialistů.
Co jsou rozšířené analytické nástroje?
Rozšířené analytické nástroje jsou analytické nástroje, které jsou „rozšířeny“ o technologie umělé inteligence, včetně strojového učení a zpracování přirozeného jazyka (NLP). Nejenže mohou rozšířené analýzy pomoci uživatelům odhalit hlubší přehledy, rychleji – mohou automatizovat mnoho složitých kroků v procesu a umožnit i netechnickým uživatelům dotazovat se na data přirozeným, konverzačním způsobem.
Co je to dolování dat?
Dolování dat je akt extrakce užitečných informací z velkých množin dat. Dolování dat často provádějí podnikoví uživatelé využívající analytické nástroje k odhalování vzorů, trendů, anomálií, vztahů, závislostí a další užitečné inteligence. Dolování dat má širokou škálu aplikací, od odhalování podvodů a kybernetické bezpečnosti až po zlepšení prognóz a hledání příležitostí ke zlepšení výkonu.
Co je to profilování dat?
Profilování dat je praxe shromažďování statistik a vlastností datového souboru, jako je jejich přesnost, úplnost a platnost. Profilování dat je jednou z technik používaných při ověřování a čištění dat, protože může pomoci odhalit problémy s kvalitou dat, jako jsou redundance, chybějící hodnoty a nekonzistence.
Produkt SAP
Co je to správa dat?
Zjistěte, jak může vaše organizace transformovat svá data na cenné aktivum.