Qu'est-ce que la gestion des données ?
Les données sont essentielles au fonctionnement d'une entreprise. Les entreprises doivent donner un sens aux données et trouver une pertinence dans le bruit créé par les divers systèmes et technologies qui soutiennent les économies mondiales hautement connectées d'aujourd'hui. À cet égard, les données occupent une place centrale. Les données en elles-mêmes ne servent à rien : les entreprises ont besoin d'une stratégie, d'une gouvernance et d'un modèle de gestion des données efficaces pour exploiter toutes les formes de données à des fins pratiques et efficaces dans les Supply Chains, les réseaux d'employés, les écosystèmes de clients et de partenaires, et bien plus encore.
Définition et processus de gestion des données
La gestion des données est une pratique consistant à collecter, organiser et accéder aux données pour favoriser la productivité, l'efficacité et la prise de décision. Étant donné le rôle central que jouent aujourd'hui les données dans l'entreprise, une stratégie de gestion des données solide et un système de gestion des données modernes sont essentiels à chaque entreprise, quels que soient sa taille ou son secteur d'activité.
Le processus de gestion des données comprend un large éventail de tâches et de procédures, telles que :
- La collecte, le traitement, la validation et le stockage des données.
- L'intégration de différents types de données provenant de sources disparates, y compris des données structurées et non structurées.
- La garantie d'une haute disponibilité et d'une restauration des données après sinistre.
- La gestion de l'utilisation et de l'accès aux données par les personnes et les applications.
- La protection et la sécurisation des données et la garantie de la confidentialité des données.
Les éléments clés de la gestion des données
Pourquoi la gestion des données est-elle importante ?
Chaque application, solution analytique et algorithme utilisé dans une entreprise (les règles et processus associés qui permettent aux ordinateurs de résoudre les problèmes et d'exécuter des tâches) dépend d'un accès transparent aux données. L'objectif principal d'un système de gestion des données est de garantir la sécurité, la disponibilité et l'exactitude des données. Mais les avantages de la gestion des données ne s'arrêtent pas là.
64,2
zettaoctets
de données digitales ont été créées en 2020
80 à 90
%
des données sont des informations non structurées
Découvrir les avantages de la gestion des données et de l'analytique
Transformer le Big Data en une ressource à forte valeur ajoutée
Une trop grande quantité de données peut se révéler accablante – et inutile – si elle n'est pas gérée correctement. Mais avec les bons outils, le Big Data peut être exploité pour apporter aux entreprises des insights plus profonds que jamais et des prédictions plus précises. Il peut permettre aux entreprises de mieux comprendre ce que souhaitent les clients et les aider à offrir des expériences client exceptionnelles sur la base de l'apprentissage que les données fournissent. Elles peuvent également contribuer à la mise en place de nouveaux modèles économiques pilotés par les données, tels que des offres de services basées sur l'Internet des Objets (IoT) et les données des capteurs en temps réel, qui ne seraient pas nécessairement évidents sans la capacité d'analyser et d'interpréter le Big Data.
Le Big Data désigne des ensembles de données extrêmement volumineux souvent caractérisés par les cinq V : le volume important de données collectées, la variété des types de données, la vitesse à laquelle les données sont générées, la véracité des données et leur valeur.
Tout le monde sait que les entreprises pilotées par les données disposent d'un avantage concurrentiel majeur. Grâce à des outils avancés, les entreprises sont en mesure de gérer un plus grand nombre de données, provenant de sources plus nombreuses que jamais. Elles peuvent également exploiter de nombreux types de données (structurées ou non) en temps réel, tels que les données des appareils IoT, les fichiers vidéo et audio, les données de navigation sur Internet et les commentaires sur les réseaux sociaux, ce qui leur offre davantage de possibilités de monétiser les données et de les utiliser comme un actif.
Poser les fondations pour la transformation numérique en matière de données
On dit souvent que les données sont le moteur de la transformation numérique, et c'est la vérité. L'intelligence artificielle (IA), le Machine Learning, l'Industrie 4.0, l'analytique avancée, l'Internet des Objets et l'automatisation intelligente nécessitent tous de nombreuses données précises et sécurisées, en temps opportun, pour faire ce qu'ils font.
L'importance des données et des technologies pilotées par les données n'a fait que croître depuis l'apparition de la pandémie de COVID-19. Aujourd'hui, de nombreuses entreprises ressentent une très forte pression pour mieux utiliser leurs données et les utiliser pour prévoir les événements futurs, s'adapter rapidement et intégrer la résilience aux plans et aux modèles économiques.
Le Machine Learning, par exemple, nécessite des ensembles de données très vastes et diversifiés pour « apprendre », identifier des modèles complexes, résoudre des problèmes et garder ses modèles et algorithmes à jour et fonctionnels. L'analytique avancée (s'appuyant souvent sur le Machine Learning) dépend également de grandes quantités de données de haute qualité afin de produire des insights pertinents et exploitables sur lesquels il est possible d'agir en toute confiance. De plus, l'IoT et l'Internet industriel des objets (IIoT) fonctionnent sur un flux constant de données de machines et de capteurs, circulant à un million de kilomètres par minute.
Le dénominateur commun à tout projet de transformation numérique est les données. Avant de pouvoir transformer les processus, tirer parti des nouvelles technologies et devenir des entreprises intelligentes, les entreprises ont besoin d'une base de données solide. En bref, ils ont besoin d'un système de gestion des données moderne.
La survie continue de toute entreprise dépend d'une architecture agile, centrée sur les données, capable de s'adapter au rythme des évolutions constantes.
Donald Feinberg, vice-président chez Gartner
Garantir la conformité aux lois sur la confidentialité des données
Une bonne gestion des données est également essentielle pour garantir la conformité aux lois nationales et internationales sur la confidentialité des données, telles que le Règlement général sur la protection des données (RGPD) et le California Consumer Privacy Act aux États-Unis, ainsi qu'aux exigences de confidentialité et de sécurité propres à chaque secteur. Et lorsque ces protections doivent être éprouvées ou auditées, il est essentiel de disposer de solides politiques et procédures de gestion des données.
Systèmes et composants de gestion des données
Les systèmes de gestion des données reposent sur des plateformes de gestion des données et comprennent une gamme de composants et de processus qui fonctionnent ensemble pour vous aider à extraire de la valeur de vos données. Il peut s'agir de systèmes de gestion de bases de données, d'entrepôts et de lacs de données, d'outils d'intégration de données, d'analytique, etc.
Systèmes de gestion de bases de données (SGBD)
Il existe de nombreux types de systèmes de gestion de bases de données. Les plus courants sont les systèmes de gestion de bases de données relationnelles (SGBDR), les systèmes de gestion de bases de données objet (SGBDO), les bases de données en mémoire et les bases de données en colonnes.
Différents systèmes de gestion des données
- Système de gestion de base de données relationnelle (SGBDR) : un SGBDR est un système de gestion de base de données contenant des définitions de données afin que les programmes et les systèmes d'extraction puissent référencer des éléments de données par leur nom, plutôt que de décrire la structure et l'emplacement des données à chaque fois. Basés sur le modèle relationnel, les systèmes SGBDR maintiennent également des relations entre les éléments de données qui améliorent l'accès et évitent la duplication. La définition et les caractéristiques de base d'un article, par exemple, sont stockées une seule fois et liées aux lignes de détail des commandes clients et aux tableaux de tarification.
- Système de gestion de base de données orientée objet (SGBDO) : un SGBDO est une approche différente de la définition et du stockage des données, développée et utilisée par les développeurs de systèmes de programmation orientée objet (SPOO). Les données sont stockées sous forme d'objets, des entités autonomes et auto-décrites, plutôt que dans des tableaux comme dans un SGBDR.
- Base de données en mémoire : une base de données en mémoire (IMDB) permet de stocker les données dans la mémoire vive (RAM) d'un ordinateur, plutôt que sur un disque dur. L'extraction à partir de la mémoire est beaucoup plus rapide que celle effectuée à partir d'un système sur disque, de sorte que les bases de données en mémoire sont couramment utilisées par les applications qui exigent des temps de réponse rapides. Par exemple, ce qui prenait autrefois des jours pour être compilé dans un rapport peut maintenant être consulté et analysé en quelques minutes, voire en quelques secondes.
- Base de données en colonnes : une base de données en colonnes stocke des groupes de données associées (une « colonne » d'informations) pour un accès rapide. Elle est utilisée dans les applications professionnelles modernes en mémoire et dans de nombreuses applications autonomes d'entrepôt de données où la vitesse d'extraction (d'une gamme limitée de données) est importante.
Entrepôts et lacs de données
- Entrepôt de données : un entrepôt de données est un référentiel central de données accumulées à partir de nombreuses sources différentes à des fins de rapport et d'analyse.
- Lac de données : un lac de données est un vaste pool de données stockées dans leur format brut ou naturel. Les lacs de données sont généralement utilisés pour stocker du Big Data, notamment des données structurées, non structurées et semi-structurées.
Gestion des données de référence (MDM)
La gestion des données de base (MDM) est la discipline consistant à créer une référence de base fiable (une version unique de la vérité) pour toutes les données métier importantes, telles que les données produit, les données client, les données des actifs, les données financières, etc. La MDM permet aux entreprises de s'assurer qu'elles n'utilisent pas des versions différentes, potentiellement incohérentes de leurs données dans leurs différents services, processus, opérations, outils analytiques et de reporting. Les trois piliers clés d'un MDM efficace sont : la consolidation des données, la gouvernance des données et la gestion de la qualité des données.
Une discipline basée sur la technologie dans laquelle les entreprises et le service informatique travaillent de concert pour assurer l'uniformité, l'exactitude, la gestion, la cohérence sémantique et la responsabilité des données de base officielles et partagées de l'entreprise.
Définition du MDM par Gartner
Gestion du Big Data
De nouveaux types de bases de données et d'outils ont été développés pour gérer le Big Data, ces énormes volumes de données structurées, non structurées et semi-structurées qui inondent aujourd'hui les entreprises. Outre des techniques de traitement très efficaces et des installations basées dans le cloud pour gérer le volume et la vitesse, de nouvelles approches pour interpréter et gérer la variété des données ont été créées. Pour que les outils de gestion des données soient capables de comprendre et de travailler avec différents types de données non structurées, par exemple, de nouveaux processus de prétraitement sont utilisés pour identifier et classer les éléments de données afin de faciliter le stockage et l'extraction.
Intégration des données
L'intégration des données est la pratique consistant à ingérer, transformer, combiner et fournir des données, où et quand elles sont nécessaires. Cette intégration s'effectue au sein de l'entreprise et au-delà, à travers les partenaires ainsi que les sources de données et les cas d'utilisation tiers, afin de répondre aux exigences de consommation des données de toutes les applications et de tous les processus métier. Les techniques comprennent, entre autres, le déplacement de données en masse/par lots, la technologie Extract-transform-load (ETL), la capture des changements de données, la réplication des données, la virtualisation des données, l'intégration des données en continu, l'orchestration des données.
Gouvernance, sécurité et conformité des données
La gouvernance des données est un ensemble de règles et de responsabilités visant à garantir la disponibilité, la qualité, la conformité et la sécurité des données au sein de l'entreprise. La gouvernance des données établit l'infrastructure et désigne les personnes (ou les postes) au sein d'une entreprise qui ont à la fois l'autorité et la responsabilité du traitement et de la sauvegarde de types et de catégories spécifiques de données. La gouvernance des données est un élément clé de la conformité. Les systèmes s'occupent des mécanismes de stockage, de manipulation et de sécurité : c'est le côté humain, la gouvernance, qui garantit, tout d'abord, que les données sont exactes, puis qu'elles sont traitées et protégées correctement avant d'être saisies dans le système, pendant leur utilisation et lorsqu'elles sont extraites du système pour être utilisées ou stockées ailleurs. La gouvernance précise la manière dont les personnes responsables utilisent les processus et les technologies pour gérer et protéger les données.
Bien entendu, la sécurité des données est une préoccupation majeure dans le monde actuel, où pirates, virus, cyberattaques et violations de données sont monnaie courante. Bien que la sécurité soit intégrée aux systèmes et aux applications, la gouvernance des données a pour rôle de garantir que ces systèmes sont correctement configurés et gérés pour protéger les données, et que des procédures et des responsabilités sont appliquées pour protéger les données en dehors des systèmes et de la base de données.
Business intelligence et analytique
La plupart des systèmes de gestion des données, si ce n'est tous, comprennent des outils de base pour l'extraction des données et le reporting, et beaucoup d'entre eux intègrent ou sont dotés d'applications d'extraction, d'analyse et de reporting puissantes. Des applications de reporting et d'analytique sont également disponibles auprès de développeurs tiers et seront très certainement incluses dans le pack d'applications en tant que fonctionnalité standard ou en tant que module complémentaire optionnel pour des fonctionnalités plus avancées.
La puissance des systèmes de gestion de données actuels réside, en grande partie, dans les outils d'extraction ad hoc qui permettent aux utilisateurs disposant d'un minimum de formation de créer leurs propres extractions de données à l'écran et d'imprimer des rapports avec une flexibilité surprenante dans la mise en forme, les calculs, les tris et les résumés. En outre, les professionnels peuvent utiliser ces mêmes outils ou des ensembles d'outils d'analyse plus sophistiqués pour faire encore plus de calculs, de comparaisons, de mathématiques supérieures et de mise en forme. Les nouvelles applications analytiques sont capables d'établir des passerelles entre les bases de données traditionnelles, les entrepôts de données et les lacs de données pour permettre l'incorporation du Big Data aux données des applications de gestion afin d'améliorer les prévisions, l'analyse et la planification.
Qu'est-ce qu'une stratégie de données d'entreprise et pourquoi en avoir une ?
De nombreuses entreprises ont adopté une approche passive en matière de stratégie de données : elles acceptent tout ce que leur fournisseur d'applications de gestion a intégré à leurs systèmes. Mais maintenant, ce n'est plus suffisant. Avec l'explosion actuelle des données et leur importance pour le fonctionnement de chaque entreprise, il est de plus en plus nécessaire d'adopter une approche plus proactive et plus complète de la gestion des données. D'un point de vue pratique, cela implique une préparation, afin de définir une stratégie de données qui :
- Identifie les types spécifiques de données dont votre entreprise aura besoin et qu'elle utilisera.
- Répartit les responsabilités pour chaque type de données.
- Établit des procédures pour régir l'acquisition, la collecte et le traitement de ces données.
L'un des principaux avantages d'une stratégie et d'une infrastructure de gestion des données métier est qu'elles rassemblent l'entreprise, en coordonnant toutes les activités et décisions en faveur de l'objectif de l'entreprise, à savoir fournir de manière efficace des produits et services de qualité aux clients. Disposer d'une stratégie de données globale et d'une intégration transparente des données élimine les silos d'informations. Cela permet à chaque service, à chaque responsable et à chaque employé de voir et de comprendre sa contribution individuelle à la réussite de l'entreprise, et de veiller à ce que ses décisions et ses actions soient alignées sur ces objectifs.
Développer une stratégie autour des données de votre entreprise
Consultez gratuitement en ligne les modules de notre masterclass sur la stratégie de gestion des données axée sur les résultats.
L'évolution de la gestion de données
Depuis plus de 50 ans, la gestion efficace des données s'est avérée essentielle à la réussite des entreprises. Elle a permis aux entreprises d'améliorer la précision du reporting d'informations, de repérer les tendances et de prendre de meilleures décisions pour dynamiser la transformation numérique et dynamiser les nouvelles technologies et modèles économiques d'aujourd'hui. Les données sont devenues un nouveau type de capital, et les entreprises novatrices sont toujours à l'affût de nouvelles façons d'utiliser les données à leur avantage. Voici les dernières tendances en matière de gestion moderne des données à surveiller et pour lesquelles il est important d'étudier la pertinence pour votre entreprise et votre secteur :
- Structure de données : la plupart des entreprises disposent aujourd'hui de divers types de données déployées sur site et dans le cloud. Elles utilisent plusieurs systèmes de gestion de bases de données, technologies de traitement et outils. Une structure de données, qui est une combinaison personnalisée d'architecture et de technologie, utilise l'intégration et l'orchestration dynamiques des données afin de permettre un accès et un partage fluide des données dans un environnement distribué.
- Gestion des données dans le cloud : de nombreuses entreprises migrent tout ou partie de leur plateforme de gestion des données vers le cloud. La gestion des données dans le cloud tire parti de tous les avantages du cloud, et notamment l'évolutivité, la sécurité avancée des données, l'accès amélioré aux données, les sauvegardes automatisées et la restauration après sinistre, les économies de coûts, etc. Les bases de données cloud et les solutions de base de données en tant que service (DBaaS), les entrepôts de données cloud et les lacs de données cloud gagnent en popularité.
- Gestion des données améliorée : l'une des tendances les plus récentes est appelée « gestion des données améliorée ». Identifiée par Gartner comme ayant un potentiel de disruption important d'ici 2022, la gestion des données améliorée utilise l'IA et le Machine Learning pour rendre les processus de gestion des données auto-configurables et auto-réglables. La gestion des données améliorée automatise tout, de la qualité à l'intégration des données, en passant par la gestion des données de base, permettant ainsi au personnel technique qualifié de se concentrer sur des tâches à plus forte valeur ajoutée.
D'ici 2022, les tâches manuelles de gestion des données seront réduites de 45 % grâce à l'ajout du Machine Learning et de la gestion automatisée des niveaux de service.
- Analytique augmentée : l'analytique augmentée, autre tendance technologique majeure identifiée par Gartner, est déjà bien présente. L'analytique augmentée utilise l'intelligence artificielle, le Machine Learning et le traitement du langage naturel (NLP) non seulement pour trouver automatiquement les insights les plus importants, mais aussi pour démocratiser l'accès à l'analytique avancée afin que tous les utilisateurs, et pas uniquement les experts des données, puissent interroger leurs données et obtenir des réponses de manière naturelle et conversationnelle.
Découvrir d'autres termes et tendances en matière de gestion des données
Résumé
Nous savons que l'information découle des données. Et si l'information est synonyme de pouvoir, alors la gestion et la capitalisation efficaces de vos données pourraient bien être les super-pouvoirs de votre entreprise. À ce titre, les responsabilités en matière de gestion des données et le rôle des analystes de bases de données (DBA) évoluent pour devenir des agents du changement , en favorisant l'adoption du cloud, en tirant parti des nouvelles tendances et technologies et en apportant une valeur stratégique à l'entreprise.
Solutions de gestion de données et de bases de données
SAP peut vous aider à gérer, gouverner et intégrer vos données d'entreprise.
Autres ressources de cette série
Lettre d'information SAP Insights
S'abonner
Obtenez des insights clés en vous abonnant à notre lettre d'information.