flex-height
text-black

Femme analysant des données à son bureau

Qu'est-ce qu'un maillage de données ?

Le maillage de données est une approche de la gestion des données qui utilise une structure architecturale distribuée.

default

{}

default

{}

primary

default

{}

secondary

Présentation du maillage de données

Le maillage de données correspond à une nouvelle façon d'examiner les données. Il est le fruit d'un concept grandissant, celui qui affirme que les données sont en fait elles-mêmes un produit, un outil, un moyen d'atteindre une fin, et pas simplement quelque chose que les entreprises collectent et analysent plus tard dans une tentative rétrospective de comprendre ce qui s'est déjà passé.

Définition du maillage de données

Le maillage de données est une approche de la gestion des données qui utilise une structure architecturale distribuée. En d'autres termes, il étend la propriété et la responsabilité d'ensembles de données spécifiques dans toute l'entreprise, aux utilisateurs possédant l'expertise d'un spécialiste pour comprendre ce que ces données signifient et comment les utiliser au mieux.

Une architecture de maillage de données connecte et extrait les données provenant de diverses sources, telles que les lacs de données et les entrepôts de données. Elle distribue ensuite les ensembles de données pertinents aux experts humains et aux équipes sectorielles appropriés dans toute l'entreprise. En bref, une immense quantité de données résidant dans un lac de données central est triée et distribuée en petites portions gérables à ceux qui sont le mieux à même de les comprendre et de les exploiter.

Origines du maillage des données

Le maillage de données est apparu vers 2009 en réponse aux défis liés à l'évolutivité des architectures de données dans les grandes organisations complexes. L'idée principale du maillage de données est de décentraliser la propriété et l'architecture des données, en traitant les données comme un produit et en attribuant la responsabilité à des équipes orientées domaine. Le maillage de données combine les principes de la conception orientée domaine, de la réflexion produit et de l'infrastructure en libre-service, permettant ainsi aux organisations de mettre à l'échelle leurs systèmes de données sans créer de goulets d'étranglement monolithiques.

Voici les raisons pour lesquelles les modèles de gestion des données centralisés échouent souvent dans les grandes entreprises :

Avantages d'un maillage de données

Les bases de données héritées et les infrastructures limitées de gestion des données ont contribué à donner l'impression que les données devaient être conservées dans un seul coffre-fort et distribuées à la discrétion de quelques gestionnaires de données. Aujourd'hui, les données sont le carburant de votre entreprise, et elles doivent être confiées sans restriction aux spécialistes qui savent le mieux comment les exploiter et générer des bénéfices en temps de concurrence.

Les principaux avantages d'une architecture de maillage de données peuvent être répartis en trois catégories :

Évolutivité et agilité

Amélioration de l'accessibilité des données : le maillage de données garantit que toutes les personnes appropriées au sein de votre organisation peuvent accéder aux données dont elles ont besoin et ainsi donner le meilleur d'elles-mêmes.

Processus et pipelines de données personnalisables : de nombreux projets, parmi les meilleurs et potentiellement les plus rentables, sont mis de côté en raison de l'énorme difficulté à rassembler les ensembles de données uniques et personnalisées nécessaires à leur réussite. Avec un maillage de données, les équipes peuvent rapidement accéder à de nouveaux modèles de projet et les tester sans perte de temps ou de ressources.

Réduction des goulets d'étranglement : c'est une situation gagnant-gagnant pour les équipes IT et les propriétaires de données. En outre, en réduisant une source de frustration et d'énervement, les entreprises peuvent contribuer à briser les silos qui font obstacle à un développement sain.

Qualité et confiance

Amélioration des capacités analytiques : lorsque les entreprises considèrent les données comme un produit à utiliser au quotidien, les équipes peuvent adopter une approche de la planification et de la stratégie fondée sur les données. Cela permet de réduire les erreurs et d'adopter une approche du développement plus objective et moins biaisée.

Collaboration transversale et réutilisation

Moins de pression sur les équipes centrales de gestion des données : non seulement les retards et les frustrations sont réduits, mais en plus vos équipes IT talentueuses peuvent consacrer un nombre d'heures incalculables à des activités plus ciblées, plus intéressantes et plus rentables.

En décentralisant la propriété et en traitant les données comme un produit, le maillage de données permet aux organisations d'agir plus rapidement, de renforcer la confiance dans les informations et de s'adapter en toute fluidité, dans tous les domaines.

Principes fondamentaux du maillage de données

Lorsque nous parlons de lacs de données et de maillage de données, nous parlons essentiellement du Big Data. Le terme « Big » n'est pas seulement lié au volume impressionnant de données. Le Big Data se définit également, entre autres critères, par le fait qu'il est complexe, variable, généré rapidement et non structuré.

Une base de données linéaire ressemble à une feuille de calcul : elle comporte des colonnes et des lignes, ainsi que des catégories immuables dans lesquelles tous les composants des données doivent rentrer. Certaines des données générées par les machines, les capteurs et les sources industrielles sont structurées et s'insèrent parfaitement dans une base de données linéaire. Quel que soit le volume de données que vous devez traiter, du moment où elles sont entièrement structurées, elles ne répondent pas aux critères du Big Data et peuvent être hébergées dans une base de données linéaire, ce qui les rend relativement simples à filtrer et à extraire.

Mais, de plus en plus, le Big Data moderne est non structuré et se compose d'éléments visuels, de textes ouverts, voire de vidéos et de contenus multimédias enrichis. Ces données cruciales peuvent représenter des milliers de téraoctets d'informations pour de nombreuses entreprises, et il est tout simplement impossible de les stocker dans une base de données linéaire standard.

C'est là qu'intervient le lac de données. Lorsque le volume de Big Data a commencé à augmenter, les lacs de données ont été mis au point pour permettre le stockage de données complexes et leur accès à partir d'un référentiel central dans leur format brut. Si les lacs de données représentent une excellente solution au problème du Big Data, ils n'en présentent pas moins quelques faiblesses. Les lacs de données ne disposent pas de toutes les fonctions analytiques, ce qui signifie qu'ils dépendent d'autres services pour les fonctionnalités d'extraction, d'indexation, de transformation, de requête et d'analytique.

Quatre principes du maillage de données permettent de relever les défis posés par les lacs de données :

1. Propriété du domaine

La propriété des données contenues dans les lacs de données est complexe à définir lorsque de nombreux acteurs génèrent des données et y accèdent. En l'absence de rôles et de responsabilités clairement définis, le même ensemble de données peut être géré différemment par différentes parties, ce qui crée des incohérences et complique son utilisation. De même, d'autres données finissent par être négligées lorsqu'elles ne sont pas gérées activement par ceux qui les utiliseront en dernier ressort.

L'architecture de maillage des données résout ce problème en décentralisant la propriété. Elle garantit que la gouvernance des donnéesest clairement distribuée par domaine afin que chaque équipe ou expert du domaine puisse régir les données qu'il produit et utilise. Pour ce faire, les maillages de données utilisent également une structure de gouvernance fédérée qui permet de contrôler de manière centrale la modélisation des données,les politiques de sécurité et la conformité. La propriété du maillage de données favorise la responsabilité et améliore l'utilisabilité des données.

2. Données en tant que produits

Les lacs de données peuvent ne pas garantir la qualité des données lorsque le volume de données devient trop important ou lorsque les principaux gestionnaires de données ne les comprennent pas eux-mêmes. L'architecture du maillage de données traite essentiellement les données comme un produit de valeur, ce qui place la qualité et l'exhaustivité des données au premier plan de la gestion des données. On peut supposer que chaque équipe connaît les critères et les priorités les plus importants qu'elle souhaite extrapoler à partir des données qu'elle collecte. En intégrant ces critères et ces priorités à l'architecture, le maillage de données peut contribuer à garantir la livraison continue et prioritaire de données propres, à jour et complètes, même lorsqu'il s'agit d'ensembles de données plus importants. Et, bien sûr, lorsque des algorithmes de Machine Learning sont appliqués, ces critères et les ensembles de données qui en résultent deviennent de plus en plus précis et utiles au fil du temps.

3. Plateforme de données en libre-service

Les lacs de données peuvent créer des goulets d'étranglement en raison de leur architecture centralisée et de leurs processus et protocoles d'extraction de données traditionnellement complexes. Cela signifie généralement que le contrôle d'une grande quantité de données consolidées est confié à une seule équipe IT ou de gestion des données. Et, à mesure que les volumes de données (et la demande pour les extraire) augmentent, ces équipes IT se retrouvent surchargées.

En outre, les données doivent être révisées et structurées correctement pour garantir la conformité et le respect des principes de gouvernance des données. Lorsque l'on est soumis à une pression excessive, on peut avoir tendance à bâcler ces étapes liées à la conformité, ce qui entraîne des risques potentiels et des pertes pour l'entreprise. Les principes du maillage des données répondent à ces problématiques en mettant à disposition une plateforme de données en libre-service. Les utilisateurs autorisés peuvent contrôler les données dans lesquels ils ont un intérêt direct et y accéder, et ce à l'aide de protocoles de sécurité rigoureux et intégrés. Cela réduit les goulets d'étranglement et accélère la livraison des données.

4. Gouvernance fédérée

Si la décentralisation est essentielle, les organisations ne peuvent toutefois pas abandonner la gouvernance. Le maillage de données utilise un modèle de gouvernance fédéré pour concilier autonomie et cohérence. Cela signifie que les domaines gèrent leurs propres produits de données, mais doivent respecter des normes communes en matière de sécurité, de conformité et d'interopérabilité au sein de l'organisation. Cette approche hybride de la gouvernance du maillage de données garantit l'agilité sans sacrifier la confiance ou le respect de la réglementation.

Bien que le maillage de données présente certains défis, l'architecture décentralisée et démocratisée de gestion des données a rendu les entreprises plus intelligentes, plus agiles et plus précises. Comment ? En garantissant que les bonnes données sont immédiatement disponibles pour les bonnes personnes, partout et à tout moment. Grâce au maillage de données, les données en tant que produit deviennent réalité. Les obstacles sont réduits et la pertinence de l'information est hiérarchisée afin que les équipes puissent accéder plus rapidement et plus facilement aux données essentielles.

Architecture et structures de maillage des données

Nous avons vu que le maillage de données est une forme décentralisée d'architecture des données qui traite les données comme un outil essentiel de gestion d'entreprise. Par ailleurs, des équipes indépendantes sont chargées de traiter les données dans leurs domaines de travail et d'expertise, tout en assurant la conformité avec les pratiques de gestion des données déterminées au niveau central. C'est ce changement d'état d'esprit qui est au cœur du maillage de données.

Vue d'ensemble d'une architecture de maillage de données

Dans un maillage de données, les domaines sont les principaux producteurs et consommateurs de données, chacun possédant ses données en tant que produits pour garantir la qualité et la pertinence. La plateforme en libre-service fournit l'infrastructure pour la publication, la découverte et l'utilisation de ces produits de données, ainsi que des fonctionnalités automatisées de sécurité et de conformité. La gouvernance fonctionne selon un modèle fédéré, qui concilie les normes mondiales en matière d'interopérabilité et de sécurité avec l'autonomie locale, afin que les domaines puissent innover tout en maintenant la confiance et la cohérence au sein de l'organisation.

Pour mieux comprendre comment s'articule l'architecture de maillage de données, examinons ses trois principaux composants.

Sources de données

Celles-ci représentent le référentiel (comme un lac de données) au sein duquel les données brutes primaires sont acheminées. Qu'elles soient collectées à partir de réseaux IIoT dans le cloud, de formulaires de feedback des clients ou de données web récupérées, il s'agit des données brutes entrantes qui seront référencées et traitées en fonction des besoins par les utilisateurs à travers le réseau. Tandis qu'une approche de type « lac de données » permettrait d'acheminer toutes ces données vers un lieu central, la méthodologie de maillage des données répartit la responsabilité de la réception, du stockage, du traitement et de l'extraction de ces données brutes entre plusieurs responsables.

Infrastructure de maillage de données

L'information ne reste pas isolée au sein des différents départements, mais elle peut également être partagée à volonté à travers le réseau opérationnel de l'organisation, tout en restant conforme aux lignes directrices établies en matière de gouvernance des données. C'est le résultat direct de deux des piliers clés du maillage de données : une plateforme de données en libre-service et une gouvernance fédérée. La plateforme de données en libre-service fournit les outils et l'infrastructure nécessaires à chaque domaine pour ingérer, transformer, traiter et servir leurs données de manière universelle. Parallèlement, les principes de gouvernance fédérée garantissent la standardisation à l'échelle de l'organisation, ce qui facilite l'interopérabilité des données entre toutes les équipes de domaine.

Propriétaires de données

Composante finale d'un maillage de données, les propriétaires de données sont responsables de l'application des protocoles de conformité, de gouvernance et de catégorisation pour les données de leurs services. Par exemple, les dossiers RH doivent être conservés selon certains protocoles de sécurité ; ils ne doivent pas être utilisés à telle ou telle fin ; ils ne doivent être communiqués qu'à telle ou telle personne. Bien entendu, chaque service aura des catégories et des types de données propres à son activité ou à ses objectifs. Dans un système de lac de données, les équipes IT doivent gérer tous ces différents protocoles et catégories pour tous les propriétaires de données qui ont déposé des données dans le lac. En revanche, l'architecture de maillage de données confère aux propriétaires de domaine une autorité et un contrôle complets sur ces points car, une fois encore, qui mieux que les experts métier pour gérer leurs propres données et s'assurer qu'elles répondent aux normes de qualité ?

Modèle opérationnel du maillage de données

Le modèle opérationnel du maillage de données rassemble les personnes, les processus et les technologies afin de faciliter une gestion décentralisée des données à grande échelle. Cette collaboration garantit une circulation fluide des données au sein de l'organisation, favorisant ainsi la confiance, l'agilité et la réutilisation sans dépendre d'une seule équipe centralisée. Le maillage de données permet l'interopérabilité et la découverte en appliquant des normes communes et en fournissant une plateforme commune, des formats et des termes de recherche cohérents, ainsi que des règles de gouvernance pour la publication et l'utilisation des produits de données. Les outils de maillage de données, tels que les catalogues et les registres de données, permettent aux équipes de trouver rapidement et d'utiliser en toute sécurité les produits de données dans toute l'organisation.

Considérez un maillage de données comme une ville moderne : chaque quartier (domaine) gère ses propres services et prestations (eau, électricité, déchets, etc.), car il connaît mieux que quiconque ses besoins locaux. La ville fournit des infrastructures communes, telles que les routes et les transports publics (plateforme en libre-service) et des normes de sécurité (gouvernance), afin que les quartiers puissent être reliés, accéder aux ressources de la ville et collaborer en toute simplicité. De cette façon, les ressources circulent librement dans toute la ville, tout le monde suit des règles communes et l'innovation prospère au niveau local tandis que l'ensemble de la ville fonctionne sans heurts.

Le maillage de données en pratique : exemples et cas d'utilisation

Pour que les solutions de gestion des données évoluent et deviennent plus performantes, elles doivent être utilisables et convenir à un large éventail d'applications et d'opérations. Au fur et à mesure que l'architecture de maillage des données et la convivialité s'améliorent, nous constatons que de plus en plus de fonctions métier peuvent être optimisées grâce à une approche sécurisée et distribuée des données en tant que produit et en tant qu'outil.

Penchons-nous sur quelques cas d'utilisation courants du maillage de données.

Ventes

Pour les équipes de vente, tout se résume à l'acquisition, à la maturation et à la finalisation des pistes. Plus les membres de votre équipe de vente passent de temps à effectuer des tâches administratives, moins ils ont le temps de nouer des relations avec de nouveaux clients. Grâce à l'architecture de maillage des données, les utilisateurs de l'équipe de vente n'ont pas besoin d'être des experts en gestion et en extraction de données pour avoir à portée de main les ensembles et les combinaisons de données les plus puissants et les plus pertinents. Lorsque les équipes de vente disposent de toutes les données appropriées à analyser, cela se traduit par des insights et des stratégies plus exploitables.

Exemple de maillage de données pour les ventes : les équipes commerciales régionales ou spécifiques à un produit peuvent gérer leurs propres domaines de données CRM et pipeline, ce qui permet d'établir des prévisions précises et de disposer de tableaux de bord en temps réel sans avoir à attendre l'intervention d'une équipe IT centrale.

Supply Chain et logistique

Les Supply Chains modernes sont vulnérables à un large éventail de perturbations. Les entreprises peuvent acquérir un avantage concurrentiel lorsqu'elles sont capables de s'adapter rapidement et de réagir avec la même agilité aux menaces et aux opportunités qui se présentent à elles. Aujourd'hui, les données issues des Supply Chains mondiales sont abondantes et rapides : retours clients, réseaux IIoT, jumeaux numériques, etc. Lorsque des responsables Supply Chain expérimentés et avisés sont eux-mêmes capables d'analyser et d'approfondir ces ensembles de données en temps réel, les entreprises disposent alors d'une source puissante d'insights et d'expertise.

Exemple de maillage de données pour la Supply Chain : l'optimisation de la Supply Chain nécessite une visibilité en temps réel sur les niveaux de stock, les performances des fournisseurs et les données logistiques. Le maillage des données confère à chaque domaine (achats, entreposage, transport) la propriété de ses produits de données, ce qui permet de prendre des décisions plus rapidement et d'optimiser la rentabilité des opérations.

Production

Dans le cadre de la Supply Chain, les opérations de production d'une entreprise sont tout aussi vulnérables aux changements rapides du marché et à la volatilité des exigences des clients. Par le passé, les équipes de conception et de R&D devaient s'appuyer sur les données historiques des clients, qui leur étaient fournies par d'autres services. Aujourd'hui, le maillage de données offre un accès en temps réel aux données aux travailleurs de bureau, aux équipes de R&D et de test, et même à l'atelier de production. Les commentaires des clients en temps réel peuvent éclairer le développement des produits en un instant, et les informations de dernière minute provenant des réseaux IIoT et des simulations numériques peuvent aider les usines à fonctionner de manière plus sûre, plus rapide et plus efficace.

Exemple de maillage de données pour la production : Les équipes au niveau des usines peuvent détenir des données relatives aux performances des capteurs et des machines, ce qui permet une maintenance prédictive et réduit les temps d'arrêt grâce à une analytique décentralisée.

Marketing

Les demandes et les attentes des clients façonnent l'avenir et évoluent à un rythme sans précédent. Une marque a généralement une multitude de points de contact avec les consommateurs sur les réseaux sociaux, les publicités numériques ciblées et les portails d'achat en ligne et omnicanal. Le marché actuel est caractérisé par un désir croissant de personnalisation rapide, par des cycles de vie des produits plus courts et par des niveaux de choix et de concurrence énormes. Pour comprendre et anticiper ces tendances, les spécialistes marketing modernes doivent avoir un accès simultané et en temps réel à une grande variété d'ensembles de données. Dans le passé, cela signifiait qu'il fallait demander ces données à d'autres services, et attendre. Avec une configuration de maillage de données, cependant, les spécialistes marketing peuvent sélectionner ces données et y accéder en temps réel, selon leurs propres conditions.

Exemple de maillage de données pour le marketing : pour obtenir une vue à 360° du client, il faut intégrer les données provenant de plusieurs canaux, tels que les e-mails, les réseaux sociaux et les publicités payantes. Le maillage de données permet à chaque canal de posséder son propre produit de données, garantissant ainsi des informations précises et en temps réel, pour des campagnes personnalisées et une meilleure expérience client.

Ressources humaines

Les équipes RH doivent gérer de grandes quantités de données extrêmement complexes et sensibles. Et avec la tendance croissante à travailler à distance et de manière hybride, ces données deviennent chaque jour plus compliquées et géographiquement plus diverses. Sans parler de l'évolution constante des questions juridiques et de conformité que les équipes RH doivent impérativement maîtriser. De l'embauche à la retraite, les responsables RH doivent être en mesure de valider, d'évaluer et d'analyser certains des ensembles de données les plus disparates qui existent. L'architecture de maillage des données permet de mettre en place les protocoles de sécurité appropriés et de restreindre étroitement l'accès, tout en permettant aux utilisateurs RH autorisés d'accéder aux données et aux informations rapidement et sans dépendre de protocoles internes complexes et de procédures bureaucratiques multiservices.

Exemple de maillage de données pour les RH : les équipes dédiées au recrutement, à la paie et à la gestion des performances peuvent gérer leurs propres domaines de données, ce qui améliore la conformité et permet une analytique en temps réel du personnel, pour une prise de décision stratégique.

Fonction Finance

Tout comme les RH, les fonctions Finance et de comptabilité sont également responsables de données extrêmement cruciales et sensibles. Les systèmes ERP modernes révolutionnent la finance en utilisant la technologie des bases de données In-Memory pour personnaliser les rapports, les analyses et les projections les plus récents. Pourtant, même lorsque les équipes Finance utilisent les meilleures bases de données et les meilleurs ERP, elles restent souvent en proie à des cultures rigides et anciennes, à des silos lourds et à des processus bureaucratiques obsolètes. L'architecture de maillage de données apporte un changement fondamental dans la façon dont les données financières sont considérées et gérées. Elle peut même bousculer la pensée stagnante pouvant apparaître lorsque les entreprises donnent les moyens à leurs équipes de réviser leurs processus de gestion des données vieillissants.

Exemple de maillage de données pour la fonction Finance : les équipes de planification financière peuvent gérer les domaines de données liés au chiffre d'affaires, aux dépenses et aux investissements, ce qui permet d'établir des prévisions précises et des scénarios agiles sans avoir à attendre l'intervention d'une équipe IT centrale.

Il est évident que le maillage de données n'est pas qu'un mot à la mode et qu'il s'agit d'une tendance de stratégie des données qui doit être prise au sérieux. Les entreprises de toutes tailles et de tous secteurs utilisent le maillage de données afin de trouver des moyens d'utiliser les données pour générer des insights et de la valeur.

Alternatives au maillage des données

Si le maillage de données offre une approche décentralisée de la gestion des données, ce n'est pas la seule option disponible. Les architectures traditionnelles telles que les lacs de données et les entrepôts de données restent largement utilisées pour centraliser et stocker de grands volumes de données, et sont souvent associées à des data lakehouses qui combinent des capacités de traitement des données structurées et non structurées. D'autres modèles, comme la structure de données, misent sur la création d'une couche unifiée pour l'intégration et l'orchestration des données entre différents systèmes. Chaque alternative aborde l'évolutivité, la gouvernance et l'accessibilité de manière différente, ce qui signifie que le choix dépend des besoins et de la maturité de l'organisation.

Examinons les alternatives au maillage de données et leurs différences.

Maillage de données, lac de données ou data lakehouse

Maillage de données
Lac de données/Data lakehouse
Concept central
Architecture décentralisée avec gouvernance fédérée
Référentiel centralisé pour les données brutes ou semi-structurées
Priorité
Propriété, gouvernance et capacité de découverte
Stockage et traitement de données à grande échelle
Idéal pour
Organisations confrontées à des goulets d'étranglement et à des problèmes d'évolutivité
Entreprises ayant besoin d'une source unique pour les charges de travail d'analytique et de Machine Learning
Quand choisir
Lorsque la qualité des données, l'autonomie et la collaboration transversale sont primordiales
Lorsqu'une solution de stockage rentable et l'analytique par lots sont la priorité

Maillage de données ou entrepôt de données

Maillage de données
Entrepôt de données
Concept central
Produits de données distribués gérés par domaines
Référentiel centralisé et structuré pour l'analytique
Priorité
Évolutivité, agilité et gouvernance décentralisée
Requêtes et reporting de BI hautement performants
Idéal pour
Organisations complexes ayant des besoins variés et fluctuants en matière de données
Entreprises avec des données principalement structurées et un reporting standardisé
Quand choisir
Lorsque la flexibilité, la propriété du domaine et l'interopérabilité sont essentielles
Lorsque la conformité et un reporting cohérent et historique sont des priorités absolues

Maillage de données vs structure de données

Maillage de données
Structure de données
Concept central
Propriété des données décentralisée et orientée domaine
Couche d'intégration centralisée pour l'accès aux données
Priorité
Modèle organisationnel pour l'évolutivité et l'autonomie
Connectivité et automatisation pilotées par la technologie
Idéal pour
Grandes entreprises avec des structures de domaine complexes
Entreprises ayant besoin d'un accès unifié à travers les silos
Quand choisir
Lorsque l'agilité, la responsabilité du domaine et les données en tant que produits sont des priorités
Lorsqu'une intégration transparente et l'automatisation dans les environnements hybrides sont l'objectif principal

Mise en œuvre du maillage de données

La mise en œuvre d'un maillage de données nécessite une approche stratégique qui concilie la décentralisation avec des normes partagées. Voici les étapes clés du maillage des données :

  1. Identifier les domaines pilotes : commencez modestement en sélectionnant deux ou trois domaines avec une valeur ajoutée claire et une forte maturité des données. Ces équipes feront office de pionnières, en testant le modèle de maillage de données avant de le déployer dans toute l'organisation.
  2. Établir la plateforme : créez une plateforme de données en libre-service qui fournit des outils communs pour la publication, la découverte et la consommation de produits de données. Cela inclut les catalogues de données, les API et les fonctionnalités de sécurité automatisées afin de réduire les frictions pour les équipes de domaine.
  3. Définir une gouvernance fédérée : élaborez des politiques de gouvernance qui appliquent les normes mondiales en matière de sécurité, de conformité et d'interopérabilité tout en laissant une certaine autonomie aux domaines. La gouvernance doit inclure des rôles clairs, des définitions de produits de données et des attentes en matière de qualité.

Anti-modèles à éviter

Lorsque le maillage de données est mis en œuvre de manière incorrecte, sans respecter les structures organisationnelles naturelles, cela peut entraîner de la confusion et des tensions. Un anti-modèle dans le maillage de données est une approche ou une pratique récurrente qui semble utile, mais qui, en réalité, compromet les principes fondamentaux de l'architecture. Voici certains des anti-modèles à éviter :

Cinq bonnes pratiques pour le maillage de données

  1. Démarrer modestement et itérer : utilisez les domaines pilotes pour affiner les processus avant la mise à l'échelle.
  2. Traiter les données comme un produit : définissez les droits de propriété, les accords sur le niveau de service et les normes d'utilisabilité pour chaque ensemble de données.
  3. Investir dans des outils partagés : facilitez la publication et la découverte pour les équipes du domaine.
  4. Intégrer la gouvernance au plus tôt : conciliez l'autonomie avec la conformité dès le début.
  5. Se focaliser sur les résultats : alignez les produits de données sur une valeur mesurable, et pas seulement sur des objectifs techniques.

En combinant la propriété du domaine, une plateforme robuste et une gouvernance fédérée, les organisations peuvent améliorer leur agilité, la confiance et la collaboration entre les domaines, sans les goulets d'étranglement des modèles centralisés traditionnels.

Mesures et métriques

Pour évaluer le succès, il faut disposer de mesures du maillage de données qui concilient les performances techniques et les résultats stratégiques. Voici certaines de ces mesures :

Ensemble, ces indicateurs fournissent des informations directionnelles permettant de déterminer si le maillage de données offre agilité, confiance et évolutivité sans pour autant adopter des benchmarks uniformes.

FAQ sur le maillage de données

Qu'est-ce que la démocratisation des données ?
Au fond, la démocratisation des données consiste à résoudre les problèmes liés aux données auxquels les travailleurs sont confrontés au quotidien. Le maillage de données soutient cette approche en décentralisant la propriété vers les domaines stratégiques (ainsi, les données sont gérées par ceux qui en comprennent le mieux le contexte) et en fournissant une plateforme en libre-service qui facilite la publication, la découverte et l'utilisation des produits de données. Ce blog contient plus de détails sur la définition et les principes de démocratisation des données, ainsi que sur la manière d'aider les collaborateurs à se sentir à l'aise pour poser des questions relatives aux données et obtenir des réponses.
Qu'est-ce que l'interopérabilité ?

L'interopérabilité est définie comme la capacité d'un système ou d'un produit à fonctionner avec d'autres systèmes ou produits sans effort particulier de la part de l'utilisateur. Selon Techtarget, cela permet aux entreprises de gagner en efficacité et d'obtenir une vue plus globale des informations et des données. Pour des informations plus détaillées, ce cours en ligne ouvert à tous explique les bases de l'interopérabilité des données, ainsi que les différents types et couches d'interopérabilité des données.

Dans le contexte des données, l'interopérabilité va au-delà de la simple connectivité et inclut la capacité de découverte (rendre les produits de données facilement trouvables entre les domaines grâce à des catalogues ou des registres) ; les contrats (des accords clairs et lisibles par machine sur les schémas de données, les API et les accords sur le niveau de service afin d'assurer une consommation cohérente) ; et les normes partagées (une gouvernance, des métadonnées et des pratiques de sécurité communes pour faciliter et fluidifier l'échange de données entre les domaines).

Un exemple d'interopérabilité est lorsque le domaine Client publie un produit de données contenant des profils clients, et que le domaine Ventes les utilise pour enrichir l'analytique du pipeline. Grâce à l'interopérabilité, l'équipe Ventes peut facilement trouver ce produit de données dans un catalogue, s'appuyer sur son contrat pour garantir la qualité et la structure des données, et l'intégrer selon des standards partagés, sans effort manuel.

Quelle est la différence entre un maillage de données et une structure de données ?

Le maillage de données et la structure de données sont des approches architecturales différentes dans le cadre de la stratégie de gestion des données d'une entreprise.

La structure de données est une approche purement technologique qui cherche à trouver des moyens de plus en plus faciles de gérer des métadonnées complexes et des informations non structurées en fusionnant l'IA, le Machine Learning et l'analytique avancée. Le maillage de données, quant à lui, bien que dépendant de tous les développements technologiques inhérents à la structure de données, se concentre davantage sur l'intégration des processus de gestion des données avec les utilisateurs humains qui en dépendent, ainsi que sur la recherche de moyens de rationaliser et de simplifier l'accès aux données et leur utilité d'un point de vue humain.

Entre le maillage de données et la structure de données, c'est un peu comme l'œuf et la poule : pour que les technologies de gestion des données évoluent à la vitesse nécessaire, il faut des technologies de structure de données toujours plus performantes. Cependant, si les processus humains et les stratégies organisationnelles n'évoluent pas en parallèle, les utilisateurs ne seront pas en mesure d'exploiter correctement les technologies de structure de données. Tout comme le DOS et les interfaces complexes ont cédé la place aux systèmes d'exploitation informatiques plus fluides que nous utilisons aujourd'hui, les architectures de maillage et de structure de données sont vouées à devenir de plus en plus fluides au fur et à mesure que ces processus et technologies progressent.

Quelles problématiques le maillage de données peut-il résoudre ?
Le maillage de données résout le problème des goulets d'étranglement créés par les équipes de données centralisées, accélère le délai d'obtention d'informations et favorise la mise à l'échelle. Les modèles traditionnels concentrent la propriété et le traitement des données au sein d'une seule équipe, ce qui entraîne des délais et réduit l'agilité. Le maillage de données répond à ce problème en s'appuyant sur quatre principes : la responsabilité par domaine, les données en tant que produits, une plateforme de données en libre-service et une gouvernance fédérée. Ensemble, les principes de maillage des données décentralisent la responsabilité, améliorent l'accessibilité et accélèrent la prise de décision.
Le maillage de données est-il une technologie ou un modèle opérationnel ?
Le maillage de données est un modèle opérationnel, et non une technologie ou un outil unique. Il s'agit d'une manière d'organiser le travail des équipes autour des données, en décentralisant la propriété vers les domaines métier et en les considérant comme des produits. Ce modèle s'appuie sur des capacités de plateforme partagées, telles que des infrastructures en libre-service, des catalogues de données et des outils de gouvernance, qui permettent aux équipes de publier, partager et gouverner efficacement les données. Plutôt que de remplacer les technologies existantes, le maillage de données fournit un cadre visant à faire évoluer la gestion des données à l'échelle de l'organisation, sans créer de goulets d'étranglement liés à des équipes centralisées.