flex-height
text-black
Glossário de gestão de dados
Explore uma gama de termos e definições relacionados com dados no nosso glossário de gestão de dados.
O que é uma base de dados?
Uma base de dados é uma instalação para organizar, armazenar, gerir, proteger e controlar o acesso aos dados. As bases de dados são concebidas de acordo com uma série de esquemas diferentes (esquema), muitos dos quais aderem ao modelo relacional para facilitar o acesso por programas e consultas de dados. Os tipos comuns de bases de dados incluem sistemas de gestão de bases de dados relacionais (RDBMS), bases de dados em memória, bases de dados orientadas a objetos (OODBMS), bases de dados NoSQL e bases de dados NewSQL—cada uma com as suas próprias vantagens.
O que é gestão de dados?
Gestão de dados refere-se a todas as funções necessárias para coletar, controlar, proteger, manipular e entregar dados. Os sistemas de gestão de dados incluem bases de dados, armazéns de dados e data marts; ferramentas para recolha, armazenamento e recuperação de dados; e utilitários para auxiliar na validação, qualidade e integração com aplicações e ferramentas analíticas. As empresas precisam de uma estratégia de dados para estabelecer responsabilidade pelos dados que se originam ou são endémicos a áreas específicas de responsabilidade.
O que é gestão de bases de dados?
A gestão de bases de dados refere-se aos processos e procedimentos necessários para armazenar, manusear, manipular e proteger dados. Em muitas organizações, a responsabilidade de estabelecer e supervisionar tais procedimentos é a principal responsabilidade de um Administrador de Base de Dados (DBA) ou posição semelhante. A maioria das organizações depende de um sistema de gestão de bases de dados (DBMS) comercial como a principal ferramenta para gerir a sua base de dados.
O que é um sistema de gestão de bases de dados (DBMS)?
Um sistema de gestão de bases de dados (SGBD) é o conjunto de ferramentas de software que fornece uma estrutura de armazenamento e uma facilidade de gestão de dados para a gestão de bases de dados. O SGBD pode ser uma parte integrante de um sistema de planeamento de recursos empresariais (ERP) licenciado, uma compra separada necessária, uma parte do software do sistema (sistema operativo) ou um produto de software licenciado separadamente. Independentemente da fonte, é essencial que as aplicações sejam construídas em torno e/ou completamente integradas com o SGBD, pois são mutuamente dependentes para a funcionalidade eficaz tanto das aplicações como do SGBD. O SGBD é essencialmente um conjunto de ferramentas para gestão de bases de dados.
O que é uma base de dados SQL?
Um banco de dados SQL é um banco de dados relacional que armazena dados em tabelas e linhas. Os itens de dados (linhas) estão ligados com base em itens de dados comuns para permitir eficiência, evitar redundância e facilitar a recuperação fácil e flexível. O nome SQL deriva de Structured Query Language, o conjunto de ferramentas e protocolo de consulta em linguagem natural que os utilizadores podem aprender e aplicar a qualquer base de dados compatível para armazenamento, manipulação e recuperação de dados.
O que é uma base de dados NoSQL?
As bases de dados NoSQL foram desenvolvidas para lidar com dados não estruturados que o SQL não pode suportar devido à falta de estrutura. NoSQL usa técnicas criativas para superar esta limitação, incluindo esquemas dinâmicos e várias técnicas de pré-processamento. Os tipos mais comuns de bases de dados para dados não estruturados são bases de dados chave-valor, documento, coluna e grafo e frequentemente incluem coisas como vídeo, gráficos, texto livre e saída bruta de sensores.
O que é um sistema de gestão de bases de dados relacionais (RDBMS)?
Um sistema de gestão de bases de dados relacionais é um sistema de gestão de bases de dados (SGBD) que se baseia no modelo de dados relacional. Os conteúdos do RDBMS são armazenados em tabelas, compostas por linhas e colunas, com cada tabela representando um objeto específico, ou entidade, na base de dados que pode estar relacionado a outro. Um SGBDR normalmente contém várias tabelas e inclui funções adicionais que mantêm a precisão, consistência, integridade e segurança dos dados, bem como uma interface SQL para aceder aos dados em relação uns aos outros através de consultas complexas.
O que é um CDBMS?
CDBMS é um termo criado pela Gartner que descreve principalmente um modelo de implementação em nuvem para RDBMS acima.
O que são dados estruturados?
Os dados estruturados são formatados ordenadamente em linhas e colunas e mapeados para campos predefinidos. Normalmente armazenados em folhas de cálculo Excel ou bases de dados relacionais, exemplos incluem transações financeiras, informações demográficas e registos de máquinas. Até recentemente, dados estruturados eram o único tipo de dados utilizável para empresas.
O que são dados não estruturados?
Dados não estruturados não estão organizados em linhas e colunas—tornando mais difícil armazenar, analisar e pesquisar. Exemplos incluem dados brutos da Internet das Coisas (IoT), ficheiros de vídeo e áudio, comentários de redes sociais e transcrições de centros de chamadas. Dados não estruturados são geralmente armazenados em data lakes, bases de dados NoSQL, ou armazéns de dados modernos.
O que são dados semiestruturados?
Dados semi-estruturados têm algumas propriedades organizacionais, como etiquetas semânticas ou metadados, mas não seguem as linhas e colunas de uma folha de cálculo ou base de dados relacional. Um bom exemplo de dados semiestruturados é o e-mail—que inclui alguns dados estruturados, como os endereços do remetente e do destinatário, mas também dados não estruturados, como a própria mensagem.
O que é mapeamento de dados?
Mapeamento de dados é o processo de correspondência de campos entre diferentes estruturas de dados ou bases de dados. Este é um passo necessário se as bases de dados forem combinadas, se os dados estiverem a ser migrados de um sistema ou base de dados para outro, ou se diferentes fontes de dados forem utilizadas dentro de uma única aplicação ou ferramenta analítica—como acontece frequentemente na armazenagem de dados. O mapeamento de dados identificará informações únicas, conflitantes e duplicadas para que um conjunto de regras possa ser desenvolvido para trazer todos os dados para um esquema ou formato coordenado.
O que é modelação de dados?
Ao criar uma nova estrutura de base de dados ou uma estrutura alternativa, o designer começa com um diagrama de como os dados irão fluir para dentro e para fora da base de dados. Diagramar os fluxos de dados é chamado de modelagem de dados. A partir deste diagrama de fluxo, os engenheiros de software podem definir as características dos formatos de dados, estruturas e funções de manipulação de bases de dados para apoiar eficientemente os requisitos de fluxo de dados.
O que é armazenamento de dados?
Um armazém de dados fornece uma única e abrangente instalação de armazenamento para dados de muitas fontes diferentes—tanto internas como externas. O seu principal objetivo é fornecer os dados para inteligência empresarial (BI), relatórios e análises. Os armazéns de dados modernos podem armazenar e gerir todos os tipos de dados, estruturados e não estruturados, e são normalmente implementados na nuvem para maior escalabilidade e facilidade de uso.
O que é um data lake?
Um data lake é um vasto reservatório de dados armazenados no seu formato bruto ou natural. Os data lakes são normalmente usados para armazenar Big Data, incluindo dados estruturados, não estruturados e semi-estruturados.
O que é Big Data?
Big Data é um termo que descreve conjuntos de dados extremamente grandes de dados estruturados, não estruturados e semi-estruturados. Big Data é frequentemente caracterizado pelos cinco Vs: o mero volume de dados coletados, a variedade de tipos de dados, a velocidade com que os dados são gerados, a veracidade dos dados, e o valor deles. Com sistemas de gestão de Big Data e análises, as empresas podem explorar Big Data para obter insights profundos que orientam a tomada de decisões e ações.
O que são dados pequenos?
Ao contrário do Big Data, que é extremamente volumoso e complexo, os dados pequenos são fáceis de entender para os humanos. Conjuntos de dados pequenos podem incluir qualquer coisa, desde pesquisas de marketing até folhas de cálculo do dia a dia—e podem até ser tão “pequenos” quanto uma única publicação em redes sociais ou e-mail. Cada vez mais, as empresas estão a usar pequenos dados, além de Big Data, para treinar os seus algoritmos de IA e aprendizagem automática, para obterem insights ainda mais profundos.
O que são dados densos?
Dados espessos são informações qualitativas que fornecem uma visão sobre as vidas emocionais cotidianas dos consumidores. Inclui observações, sentimentos e reações—coisas que são tipicamente difíceis de quantificar. Quando combinado com Big Data, surge uma imagem muito abrangente sobre as preferências e requisitos de um consumidor.
O que é a integração de dados?
Integração de dados é a prática de ingerir, transformar, combinar e fornecer dados, onde e quando são necessários. Esta integração ocorre na empresa e além—entre parceiros, bem como fontes de dados de terceiros e casos de uso—para atender aos requisitos de consumo de dados de todas as aplicações e processos de negócios. As técnicas incluem movimentação de dados em massa/lote, extração, transformação, carregamento (ETL), captura de alteração de dados, replicação de dados, virtualização de dados, integração de dados em streaming, orquestração de dados e mais.
O que é virtualização de dados?
A virtualização de dados oferece às empresas uma visão unificada de todos os dados empresariais—através de sistemas e formatos díspares—numa camada de dados virtual. Em vez de duplicar dados, a virtualização de dados deixa os dados nos seus sistemas de origem e simplesmente expõe uma representação virtual deles aos utilizadores e aplicações em tempo real. A virtualização de dados é uma abordagem moderna para a integração de dados que permite aos utilizadores descobrir e manipular dados independentemente da sua localização física, formato ou protocolo.
O que é a infraestrutura de dados?
Uma estrutura de dados é uma combinação personalizada de arquitetura e tecnologia. Utiliza integração e orquestração de dados dinâmicos para conectar diferentes locais, fontes e tipos de dados. Com as estruturas e fluxos corretos definidos dentro da plataforma de tecido de dados, as empresas podem aceder e partilhar dados rapidamente, independentemente de onde estejam ou de como foram gerados.
O que é a malha de dados?
Data mesh é uma abordagem de gestão de dados que utiliza uma estrutura arquitetónica distribuída. Em outras palavras: distribui a propriedade e a responsabilidade por conjuntos de dados específicos em toda a empresa, para aqueles utilizadores que têm a especialização necessária para entender o que esses dados significam e como fazer o melhor uso deles.
O que é uma pipeline de dados?
Um pipeline de dados descreve um conjunto de processos automatizados e repetíveis para encontrar, limpar, transformar e analisar qualquer tipo de dados na sua origem. Porque os dados são analisados perto de onde são gerados, os utilizadores empresariais podem rapidamente analisar e partilhar a informação de que necessitam a um custo mais baixo para a organização. Os pipelines de dados também podem ser aprimorados por tecnologias como o aprendizado de máquina para torná-los mais rápidos e eficazes.
O que são silos de dados?
Um silo de dados é um termo informal para uma situação em que departamentos individuais ou áreas funcionais dentro de uma empresa não partilham dados e informações com outros departamentos. Este isolamento impede esforços coordenados em direção aos objetivos da empresa e resulta em baixo desempenho (e mau atendimento ao cliente), altos custos e uma incapacidade geral de responder às demandas e mudanças do mercado. Dados duplicados e redundantes são difíceis de reconciliar, impedindo ainda mais qualquer tentativa de coordenar atividades e gerir eficazmente o negócio.
O que é manipulação de dados?
A manipulação de dados é o processo de pegar dados brutos e transformá-los em um formato compatível com bases de dados e aplicações estabelecidas. O processo pode incluir a estruturação, limpeza, enriquecimento e validação de dados conforme necessário para tornar os dados brutos úteis.
O que é segurança de dados?
A segurança de dados é o ato de tornar os dados seguros e protegidos—seguros contra acesso ou exposição não autorizados, desastres ou falhas de sistema, e, ao mesmo tempo, facilmente acessíveis a utilizadores e aplicações legítimos. Os métodos e ferramentas incluem encriptação de dados, gestão de chaves, práticas de redundância e backup, e controlos de acesso. A segurança de dados é um requisito para organizações de todos os tamanhos e tipos para proteger os dados dos clientes e da organização contra a ameaça crescente de violações de dados e riscos de privacidade. Redundância e backups são importantes para a continuidade do negócio e recuperação de desastres.
O que é a privacidade de dados?
Privacidade de dados refere-se às políticas e práticas para lidar com dados de maneiras que os protejam de acesso ou divulgação não autorizados. As políticas e práticas de privacidade de dados abrangem como a informação é recolhida e armazenada de acordo com a estratégia de dados da organização, como pode ou não ser partilhada com terceiros, e como cumprir com as restrições regulamentares. A privacidade de dados é um imperativo empresarial que satisfaz as expectativas dos clientes enquanto protege a integridade e a segurança das informações armazenadas.
O que é qualidade de dados?
A qualidade dos dados é um termo nebuloso que descreve a adequação e a fiabilidade dos dados. Dados bons e de qualidade simplesmente significam que os dados são precisos (verdadeiramente representativos do que descrevem), confiáveis (consistentes, auditáveis, devidamente geridos e protegidos) e completos na medida em que os utilizadores e aplicações exigem. A qualidade dos dados só pode ser garantida por uma estratégia de dados devidamente concebida e executada, realizada com ferramentas e sistemas de força industrial, juntamente com políticas e procedimentos de gestão de dados seguidos escrupulosamente.
O que é validação de dados?
A validação de dados é o processo de determinar a qualidade, precisão e validade dos dados antes de os importar ou utilizar. A validação pode consistir numa série de atividades e processos para autenticar os dados e, geralmente, “limpar” os itens de dados, incluindo a remoção de duplicados, correção de erros óbvios ou itens em falta, e possíveis alterações de formatação (limpeza de dados). A validação de dados garante que a informação de que necessita para tomar decisões importantes seja precisa e confiável.
O que é limpeza de dados?
A limpeza de dados é o processo de remoção ou correção de erros de um conjunto de dados, tabela ou base de dados. Esses erros podem incluir informações corrompidas, imprecisas, irrelevantes ou incompletas. Este processo, também chamado de limpeza de dados, encontra dados duplicados e outras inconsistências, como erros de digitação e conjuntos numéricos que não somam corretamente. A limpeza de dados pode remover informações incorretas ou corrigir erros óbvios, como campos vazios ou códigos em falta.
O que é integridade de dados?
Integridade de dados refere-se à veracidade dos dados a longo prazo. Depois de os dados serem inseridos ou importados, manipulados, validados, limpos e armazenados, a integridade dos dados é uma afirmação de que a qualidade dos dados é mantida e os utilizadores podem ter a certeza de que os dados que foram inseridos não mudaram e não mudarão. Os dados que são recuperados são os mesmos que foram originalmente armazenados. Por vezes usado como sinónimo de qualidade de dados, a integridade de dados é mais sobre fiabilidade e confiança.
O que é governance de dados?
Governança de dados é um conjunto de políticas e práticas para garantir a gestão adequada de dados em toda a organização. Estabelece a infraestrutura de TI e nomeia os indivíduos (ou cargos) que têm a autoridade e responsabilidade pelo manuseio e proteção de tipos específicos de dados. A governança eficaz de dados garante que os dados estejam disponíveis, sejam confiáveis, seguros e em conformidade—e que não sejam mal utilizados.
O que é gestão de dados?
A gestão de dados é a implementação de políticas e procedimentos de governança de dados para estabelecer a precisão, fiabilidade, integridade e segurança dos dados. Indivíduos designados com responsabilidades de gestão de dados gerem e supervisionam os procedimentos e ferramentas utilizados para manusear, armazenar e proteger dados.
O que é arquitetura de dados?
A arquitetura de dados é o design geral para a estrutura, políticas e regras que definem os dados de uma organização e como serão usados e geridos. A arquitetura de dados inclui os detalhes de como a estratégia de dados é implementada em apoio às necessidades e objetivos empresariais—e serve como a base para o desenvolvimento de bases de dados, procedimentos, salvaguardas, segurança e governança de dados.
O que é a gestão de dados mestre?
Gestão de dados mestre (MDM) é a prática de criar uma única fonte de referência "mestre" para todos os dados empresariais importantes. Inclui políticas e procedimentos para definir, gerir e controlar (ou governar) o tratamento de dados mestres. A gestão centralizada de dados mestres elimina conflitos e confusões que surgem de bases de dados dispersas com informações duplicadas e dados descoordenados que podem estar desatualizados, corrompidos ou deslocados no tempo—atualizados num local mas não noutro. Ter uma versão para servir toda a empresa significa que todas as partes da organização estão a trabalhar com as mesmas definições, normas e suposições.
O que são análises?
O termo analytics refere-se à análise sistemática de dados. As aplicações e kits de ferramentas de análise contêm algoritmos matemáticos e motores computacionais que podem manipular grandes conjuntos de dados para descobrir padrões, tendências, relações e outras informações que permitem aos utilizadores fazer perguntas e obter insights úteis sobre o seu negócio, operações e mercados. Muitos kits de ferramentas de análise modernos são projetados para uso por pessoas de negócios não técnicas, permitindo-lhes realizar essas análises com assistência mínima de cientistas de dados ou especialistas em TI.
O que são análises aumentadas?
Análise aumentada são análises que são “aumentadas” com tecnologias de inteligência artificial, incluindo aprendizagem automática e processamento de linguagem natural (NLP). Não só a análise aumentada pode ajudar os utilizadores a descobrir insights mais profundos, mais rapidamente—ela pode automatizar muitos passos complicados no processo e permitir que até utilizadores não técnicos consultem dados de uma forma natural e conversacional.
O que é extração de dados?
Mineração de dados é o ato de extrair informações úteis de grandes conjuntos de dados. A mineração de dados é frequentemente realizada por utilizadores empresariais que empregam ferramentas de análise para descobrir padrões, tendências, anomalias, relações, dependências e outras informações úteis. A mineração de dados tem uma ampla gama de aplicações, desde a deteção de fraude e preocupações de cibersegurança até à melhoria de previsões e à identificação de oportunidades de melhoria de desempenho.
O que é a análise de dados?
A análise de dados é a prática de coletar estatísticas e características sobre um conjunto de dados, como sua precisão, completude e validade. A criação de perfis de dados é uma das técnicas utilizadas nos esforços de validação e limpeza de dados, pois pode ajudar a detectar problemas de qualidade de dados como redundâncias, valores em falta e inconsistências.
Produto SAP
O que é gestão de dados?
Saiba como a sua organização pode transformar os seus dados num ativo valioso.