flex-height
text-black
Glosar de gestiune date
Explorați o serie de termeni și definiții legate de date în glosarul nostru de gestiune a datelor.
Ce este o bază de date?
O bază de date este o facilitate pentru organizarea, stocarea, gestionarea, protejarea și controlul accesului la date. Bazele de date sunt proiectate în funcție de un număr de scheme diferite (schemă), dintre care multe aderă la modelul relațional pentru ușurința accesului prin programe și interogări de date. Tipurile comune de baze de date includ sisteme relaționale de gestionare a bazelor de date (RDBMS), baze de date in-memory, baze de date orientate pe obiecte (OODBMS), baze de date NoSQL și baze de date NewSQL—fiecare cu propriile avantaje.
Ce este gestiunea datelor?
Gestionarea datelor se referă la toate funcțiile necesare pentru colectarea, controlul, protejarea, manipularea și livrarea datelor. Sistemele de gestiune a datelor includ baze de date, depozite de date și data marts; instrumente pentru colectarea, stocarea și regăsirea datelor; și utilități pentru a ajuta la validare, calitate și integrare cu aplicații și instrumente analitice. Întreprinderile au nevoie de o strategie de date pentru a stabili responsabilitatea pentru datele care provin sau sunt endemice pentru anumite domenii de responsabilitate.
Ce este gestionarea bazelor de date?
Gestiunea bazelor de date se referă la procesele și procedurile care sunt necesare pentru stocarea, gestionarea, manipularea și protejarea datelor. În multe organizații, responsabilitatea pentru stabilirea și supravegherea unor astfel de proceduri este responsabilitatea principală a unui administrator de bază de date (DBA) sau a unei poziții similare. Majoritatea organizațiilor se bazează pe un sistem comercial de gestiune a bazelor de date (DBMS) ca instrument principal pentru gestionarea bazei lor de date.
Ce este un sistem de gestionare a bazelor de date (DBMS)?
Un sistem de gestionare a bazelor de date (DBMS) este kitul de instrumente software care oferă o structură de stocare și o facilitate de gestionare a datelor pentru gestionarea bazelor de date. DBMS poate face parte integrantă dintr-un sistem licențiat de planificare a resurselor întreprinderii (ERP), o achiziție separată necesară, o parte din software-ul de sistem (sistemul de operare) sau un produs software licențiat separat. Indiferent de sursă, este esențial ca aplicațiile să fie construite în jurul și/sau complet integrate cu SGBD, deoarece acestea sunt dependente reciproc pentru funcționalitatea eficientă a ambelor aplicații și a SGBD. DBMS este, în esență, un kit de instrumente pentru gestiunea bazelor de date.
Ce este o bază de date SQL?
O bază de date SQL este o bază de date relațională care stochează date în tabele și rânduri. Pozițiile de date (liniile) sunt legate pe baza elementelor de date comune pentru a permite eficiența, pentru a evita redundanța și pentru a facilita regăsirea ușoară și flexibilă. Numele SQL derivă din limbajul de interogare structurat, trusa de instrumente și protocolul de interogare a limbajului natural pe care utilizatorii le pot învăța și aplica la orice bază de date conformă pentru stocarea, manipularea și regăsirea datelor.
Ce este o bază de date NoSQL?
Bazele de date NoSQL au fost dezvoltate pentru gestionarea datelor nestructurate pe care SQL nu le poate suporta din cauza lipsei de structură. NoSQL utilizează tehnici creative pentru a depăși această limitare, inclusiv scheme dinamice și diverse tehnici de pre-procesare. Cele mai comune tipuri de baze de date pentru date nestructurate sunt bazele de date cheie, documentele, coloanele și graficele și includ adesea lucruri precum video, grafice, text liber și ieșirea senzorului brut.
Ce este un sistem relațional de gestionare a bazelor de date (RDBMS)?
Un sistem relațional de gestionare a bazelor de date este un sistem de gestionare a bazelor de date (DBMS) care se bazează pe modelul de date relaționale. Conținutul RDBMS este stocat în tabele, alcătuite din linii și coloane, fiecare tabel reprezentând un anumit obiect sau entitate din baza de date care poate fi legată de altul. Un RDBMS conține de obicei mai multe tabele și include funcții suplimentare care mențin acuratețea, consistența, integritatea și securitatea datelor, precum și o interfață SQL pentru a accesa datele în relație între ele prin query-uri complexe.
Ce este un CDBMS?
CDBMS este un termen inventat de Gartner care descrie în principal un model de implementare cloud pentru RDBMS de mai sus.
Ce sunt datele structurate?
Datele structurate sunt formatate corect în linii și coloane și mapate la câmpurile predefinite. De obicei stocate în foi de calcul Excel sau baze de date relaționale, exemple includ tranzacții financiare, informații demografice și jurnale de mașini. Până de curând, datele structurate erau singurul tip de date utilizabile pentru companii.
Ce sunt datele nestructurate?
Datele nestructurate nu sunt organizate în rânduri și coloane, ceea ce face mai dificilă stocarea, analizarea și căutarea. Exemplele includ date brute Internet of Things (IoT), fișiere video și audio, comentarii pe rețelele sociale și transcrieri de call center. Datele nestructurate sunt de obicei stocate în lacuri de date, baze de date NoSQL sau depozite de date moderne.
Ce sunt datele semi-structurate?
Datele semistructurate au unele proprietăți organizaționale, precum etichete semantice sau metadate, dar nu sunt conforme cu liniile și coloanele unei foi de calcul sau ale unei baze de date relaționale. Un bun exemplu de date semi-structurate este e-mailul - care include unele date structurate, cum ar fi adresele expeditorului și destinatarului, dar și datele nestructurate, cum ar fi mesajul în sine.
Ce este maparea datelor?
Maparea datelor este procesul de comparare a câmpurilor între diferite structuri de date sau baze de date. Acesta este un pas necesar dacă bazele de date trebuie combinate, dacă datele sunt migrate dintr-un sistem sau o bază de date în alta sau dacă trebuie utilizate surse de date diferite într-o singură aplicație sau instrument analitic – așa cum se întâmplă frecvent în depozitarea datelor. Maparea datelor va identifica informații unice, conflictuale și duplicate, astfel încât să poată fi dezvoltat un set de reguli pentru aducerea tuturor datelor într-o schemă sau într-un format coordonat.
Ce este modelarea datelor?
La crearea unei structuri de bază de date noi sau alternative, designerul începe cu o diagramă a modului în care datele vor intra și vor ieși din baza de date. Diagrama fluxurilor de date se numește modelare de date. Din această diagramă de flux, inginerii software pot defini caracteristicile formatelor de date, structurilor și funcțiilor de gestionare a bazelor de date pentru a sprijini eficient cerințele fluxului de date.
Ce este depozitarea datelor?
Un depozit de date oferă un spațiu de depozitare unic și cuprinzător pentru datele din mai multe surse diferite - atât interne, cât și externe. Scopul său principal este de a furniza date pentru business intelligence (BI), raportare și funcții analitice. Depozitele de date moderne pot stoca și gestiona toate tipurile de date, structurate și nestructurate și sunt implementate de obicei în cloud pentru o mai mare scalabilitate și ușurință în utilizare.
Ce este un lac de date?
Un lac de date este un bazin vast de date stocate în formatul său brut sau natural. Lacurile de date sunt utilizate, de obicei, pentru a stoca Big Data, inclusiv datele structurate, nestructurate și semi-structurate.
Ce sunt Big Data?
Big Data este un termen care descrie seturi de date extrem de mari de date structurate, nestructurate și semi-structurate. Big Data se caracterizează adesea prin cele cinci Vs: volumul pur de date colectate, varietatea tipurilor de date, viteza la care sunt generate datele, veridicitatea datelor și valoarea acestora. Cu sisteme de gestiune și funcții analitice Big Data, companiile pot extrage Big Data pentru analize aprofundate care ghidează luarea deciziilor și acțiunile.
Ce sunt datele mici?
Spre deosebire de Big Data, care este extrem de voluminos și complex, datele mici sunt ușor de înțeles de către oameni. Seturile mici de date pot include orice, de la sondaje de marketing la foi de calcul de zi cu zi – și pot fi chiar la fel de „mici” ca o singură postare sau e-mail pe rețelele sociale. Din ce în ce mai mult, companiile utilizează date mici, pe lângă Big Data, pentru a-și instrui AI și algoritmii de învățare automată, pentru analize și mai aprofundate.
Ce sunt datele groase?
Datele groase sunt informații calitative care oferă o perspectivă asupra vieții emoționale de zi cu zi a consumatorilor. Acesta include observații, sentimente și reacții – lucruri care sunt de obicei dificil de cuantificat. Atunci când este combinat cu Big Data, apare o imagine foarte cuprinzătoare cu privire la preferințele și cerințele unui consumator.
Ce este integrarea datelor?
Integrarea datelor este practica ingerării, transformării, combinării și furnizării datelor, unde și când este nevoie. Această integrare are loc în întreprindere și în afara - între parteneri, precum și în surse de date și cazuri de utilizare terțe - pentru a îndeplini cerințele de consum de date ale tuturor aplicațiilor și proceselor de afaceri. Tehnicile includ mișcarea datelor în masă/lot, extragerea, transformarea, încărcarea (ETL), modificarea capturii de date, replicarea datelor, virtualizarea datelor, integrarea datelor de streaming, orchestrarea datelor și multe altele.
Ce este virtualizarea datelor?
Virtualizarea datelor oferă companiilor o imagine unificată a tuturor datelor companiei - în sisteme și formate disparate - într-un nivel de date virtual. În loc de duplicarea datelor, virtualizarea datelor lasă datele în sistemele sale sursă și pur și simplu expune o reprezentare virtuală a acestora utilizatorilor și aplicațiilor în timp real. Virtualizarea datelor este o abordare modernă a integrării datelor care permite utilizatorilor să descopere și să manipuleze datele indiferent de locația fizică, format sau protocol.
Ce este materialul de date?
O țesătură de date este o combinație personalizată de arhitectură și tehnologie. Utilizează integrarea și orchestrarea dinamică a datelor pentru a conecta diferite locații, surse și tipuri de date. Cu structurile și fluxurile potrivite, așa cum sunt definite în cadrul platformei Data Fabric, companiile pot accesa și partaja rapid date indiferent de locul în care sunt sau de modul în care au fost generate.
Ce este mesh de date?
Mesh-ul de date este o abordare a gestionării datelor care utilizează un cadru arhitectural distribuit. Cu alte cuvinte: răspândește proprietatea și responsabilitatea pentru seturi de date specifice la nivelul întregii companii, la acei utilizatori care au expertiza de specialitate pentru a înțelege ce înseamnă aceste date și cum să le utilizeze în mod optim.
Ce este pipeline de date?
Un pipeline de date descrie un set de procese automatizate și repetabile pentru găsirea, curățarea, transformarea și analizarea oricărui tip de date la sursa sa. Deoarece datele sunt analizate aproape de locul în care sunt generate, utilizatorii de întreprindere pot analiza și partaja rapid informațiile de care au nevoie la un cost mai mic pentru organizație. Pipeline-urile de date pot fi, de asemenea, îmbunătățite prin tehnologii precum învățarea automată, pentru a le face mai rapide și mai eficiente.
Ce sunt depozitele de date?
Un siloz de date este un termen de slang pentru o situație în care departamentele individuale sau zonele funcționale din cadrul unei întreprinderi nu partajează date și informații cu alte departamente. Această izolare previne eforturile coordonate pentru atingerea obiectivelor companiei și are ca rezultat performanțe slabe (și servicii slabe pentru clienți), costuri ridicate și o incapacitate generală de a răspunde cerințelor și schimbărilor pieței. Datele duplicate și redundante sunt dificil de reconciliat, împiedicând în continuare orice încercare de coordonare a activităților și de gestionare eficientă a întreprinderii.
Ce este data wrangling?
Dezbaterea datelor este procesul de preluare a datelor brute și de transformare a acestora într-un format care este compatibil cu bazele de date și aplicațiile stabilite. Procesul poate include structurarea, curățarea, îmbogățirea și validarea datelor, după cum este necesar, pentru a face utile datele brute.
Ce este securitatea datelor?
Securitatea datelor este actul de a face datele sigure și sigure – în condiții de siguranță împotriva accesului sau expunerii neautorizate, a dezastrului sau a defectării sistemului și, în același timp, ușor accesibile utilizatorilor și aplicațiilor legitime. Metodele și instrumentele includ criptarea datelor, gestionarea cheilor, redundanța și practicile de backup și controalele de acces. Securitatea datelor este o cerință pentru organizațiile de toate dimensiunile și tipurile pentru a proteja datele clienților și organizațiilor împotriva amenințării tot mai mari a încălcărilor datelor și a riscurilor la adresa confidențialității. Redundanța și backup-urile sunt importante pentru continuitatea afacerii și recuperarea în caz de dezastru.
Ce este confidențialitatea datelor?
Confidențialitatea datelor se referă la politicile și practicile de gestionare a datelor în moduri care îl protejează împotriva accesului sau dezvăluirii neautorizate. Politicile și practicile de confidențialitate a datelor acoperă modul în care informațiile sunt colectate și stocate în funcție de strategia de date a organizației, modul în care acestea pot fi partajate sau nu cu terțe părți și modul de respectare a restricțiilor de reglementare. Confidențialitatea datelor este un imperativ de afaceri care satisface așteptările clienților, protejând în același timp integritatea și siguranța informațiilor stocate.
Ce este calitatea datelor?
Calitatea datelor este un termen nebulos care descrie adecvarea și fiabilitatea datelor. Date bune, de calitate înseamnă pur și simplu că datele sunt exacte (cu adevărat reprezentative pentru ceea ce descrie), fiabile (consecvente, auditabile, gestionate în mod corespunzător și protejate) și complete în măsura în care utilizatorii și aplicațiile necesită acest lucru. Calitatea datelor poate fi asigurată numai printr-o strategie de date concepută și executată în mod corespunzător, realizată cu instrumente și sisteme de putere industrială, împreună cu politici și proceduri de gestionare a datelor urmate cu scrupulozitate.
Ce este validarea datelor?
Validarea datelor este procesul de determinare a calității, acurateței și valabilității datelor înainte de importarea sau utilizarea acestora. Validarea poate consta într-o serie de activități și procese pentru autentificarea datelor și, în general, „curățarea” elementelor de date, inclusiv eliminarea duplicatelor, corectarea erorilor evidente sau a elementelor lipsă și posibile modificări de formatare (curățarea datelor). Validarea datelor asigură acuratețea și încrederea informațiilor de care aveți nevoie pentru luarea deciziilor importante.
Ce este curățarea datelor?
Curățarea datelor este procesul de eliminare sau corectare a erorilor dintr-un set de date, tabel sau bază de date. Aceste erori pot include informații corupte, inexacte, irelevante sau incomplete. Acest proces, numit și spălare de date, găsește date duplicate și alte inconsistențe, cum ar fi greșeli de tipar și seturi numerice care nu se adună. Curățarea datelor poate elimina informațiile incorecte sau poate repara greșelile evidente, cum ar fi câmpurile goale sau codurile lipsă.
Ce este integritatea datelor?
Integritatea datelor se referă la veridicitatea datelor pe termen lung. Odată ce datele sunt introduse sau importate, falsificate, validate, curățate și stocate, integritatea datelor este o declarație că este întreținută calitatea datelor și utilizatorii pot fi siguri că datele care au intrat nu s-au modificat și nu se vor modifica. Datele care sunt regăsite sunt identice cu cele stocate inițial. Uneori utilizat ca sinonim pentru calitatea datelor, integritatea datelor este mai mult despre fiabilitate și fiabilitate.
Ce este controlul datelor?
Controlul datelor este un set de politici și practici pentru asigurarea gestionării adecvate a datelor în cadrul unei organizații. Acesta stabilește infrastructura IT și denumește persoanele (sau pozițiile) care au autoritatea și responsabilitatea pentru gestionarea și protejarea anumitor tipuri de date. Controlul eficient al datelor asigură disponibilitatea, fiabilitatea, securitatea și conformitatea datelor și faptul că nu sunt utilizate în mod greșit.
Ce este administrarea datelor?
Responsabilitatea pentru date este implementarea politicilor și procedurilor de guvernare a datelor pentru stabilirea acurateței, fiabilității, integrității și securității datelor. Persoanele alocate cu responsabilități de responsabilitate pentru date gestionează și supraveghează procedurile și instrumentele utilizate pentru a gestiona, stoca și proteja datele.
Ce este arhitectura datelor?
Arhitectura datelor este designul general al structurii, politicilor și regulilor care definesc datele unei organizații și modul în care vor fi utilizate și gestionate. Arhitectura datelor include detalii despre modul în care strategia de date este implementată în sprijinul nevoilor și obiectivelor de afaceri și servește ca bază pentru dezvoltarea bazelor de date, procedurilor, măsurilor de protecție, securității și guvernării datelor.
Ce este gestiunea datelor de bază?
Gestiunea datelor de bază (MDM) este practica de a crea o singură sursă de referință „de bază” pentru toate datele comerciale importante. Include politici și proceduri pentru definirea, gestionarea și controlul (sau guvernarea) gestionării datelor de bază. Gestiunea centralizată a datelor de bază elimină conflictele și confuzia care rezultă din baze de date dispersate cu informații duplicate și date necoordonate care ar putea fi învechite, corupte sau deplasate la timp – actualizate într-un loc, dar nu în altul. Având o singură versiune pentru a servi întreaga întreprindere înseamnă că toate părțile organizației lucrează cu aceleași definiții, standarde și presupuneri.
Ce sunt analizele?
Termenul „funcții analitice” se referă la analiza sistematică a datelor. Aplicațiile analitice și kiturile de instrumente conțin algoritmi matematici și motoare de calcul care pot manipula seturi de date mari pentru a descoperi modele, tendințe, relații și alte informații care permit utilizatorilor să pună întrebări și să obțină informații utile despre afacerea, operațiunile și piețele lor. Multe seturi de instrumente analitice moderne sunt concepute pentru a fi utilizate de oameni de afaceri non-tehnici, permițându-le să efectueze aceste analize cu asistență minimă din partea oamenilor de știință de date sau a specialiștilor IT.
Ce sunt augmented analytics?
Funcțiile analitice augmentate sunt funcții analitice care sunt „îmbunătățite” cu tehnologii de inteligență artificială, inclusiv învățarea automată și prelucrarea limbajului natural (NLP). Pe lângă faptul că funcțiile analitice îmbunătățite îi pot ajuta pe utilizatori să descopere informații mai profunde, mai rapid – aceștia pot automatiza mulți pași complicați în proces și pot permite chiar și utilizatorilor non-tehnici să interogheze date într-un mod natural, conversațional.
Ce este data mining?
Data mining este actul de extragere a informațiilor utile din seturile de date mari. Exploatarea datelor este adesea efectuată de utilizatorii de întreprindere care utilizează instrumente de funcții analitice pentru a descoperi modele, tendințe, anomalii, relații, dependențe și alte informații utile. Exploatarea datelor are o gamă largă de aplicații, de la detectarea fraudelor și a preocupărilor în materie de securitate cibernetică până la îmbunătățirea previziunilor și găsirea oportunităților de îmbunătățire a performanței.
Ce este profilarea datelor?
Profilarea datelor este practica colectării de statistici și trăsături despre un set de date, cum ar fi acuratețea, completitudinea și validitatea acestuia. Profilarea datelor este una dintre tehnicile utilizate în eforturile de validare și curățare a datelor, deoarece poate ajuta la detectarea problemelor de calitate a datelor, cum ar fi redundanțele, valorile lipsă și inconsistențele.
Produs SAP
Ce este gestiunea datelor?
Aflați cum organizația dvs. își poate transforma datele într-o fișă valoroasă.