Qu'est-ce qu'un maillage de données ?
Le maillage de données est une approche de la gestion des données qui utilise une structure architecturale distribuée.
default
{}
default
{}
primary
default
{}
secondary
Présentation du maillage de données
Le maillage de données correspond à une nouvelle façon d'examiner les données. Il est le fruit d'un concept grandissant, celui qui affirme que les données sont en fait elles-mêmes un produit, un outil, un moyen d'atteindre une fin, et pas simplement quelque chose que les entreprises collectent et analysent plus tard dans une tentative rétrospective de comprendre ce qui s'est déjà passé.
Définition du maillage de données
Le maillage de données est une approche de la gestion des données qui utilise une structure architecturale distribuée. En d'autres termes, il étend la propriété et la responsabilité d'ensembles de données spécifiques dans toute l'entreprise, aux utilisateurs possédant l'expertise d'un spécialiste pour comprendre ce que ces données signifient et comment les utiliser au mieux.
Une architecture de maillage de données connecte et extrait les données provenant de diverses sources, telles que les lacs de données et les entrepôts de données. Elle distribue ensuite les ensembles de données pertinents aux experts humains et aux équipes sectorielles appropriés dans toute l'entreprise. En bref, une immense quantité de données résidant dans un lac de données central est triée et distribuée en petites portions gérables à ceux qui sont le mieux à même de les comprendre et de les exploiter.
Origines du maillage des données
Le maillage de données est apparu vers 2009 en réponse aux défis liés à l'évolutivité des architectures de données dans les grandes organisations complexes. L'idée principale du maillage de données est de décentraliser la propriété et l'architecture des données, en traitant les données comme un produit et en attribuant la responsabilité à des équipes orientées domaine. Le maillage de données combine les principes de la conception orientée domaine, de la réflexion produit et de l'infrastructure en libre-service, permettant ainsi aux organisations de mettre à l'échelle leurs systèmes de données sans créer de goulets d'étranglement monolithiques.
Voici les raisons pour lesquelles les modèles de gestion des données centralisés échouent souvent dans les grandes entreprises :
- Goulets d'étranglement dans la livraison : une seule équipe centrale se retrouve surchargée, ce qui ralentit l'accès aux données et leur analytique.
- Incohérences dans la propriété : l'absence de responsabilité claire pour la qualité des données dans tous les domaines entraîne des normes incohérentes et des problèmes de confiance.
- Problèmes d'évolutivité : à mesure que le volume et la complexité des données augmentent, les systèmes centralisés ont du mal à s'adapter sans que cela entraîne des coûts supplémentaires considérables.
- Mauvaise connaissance du domaine : les équipes centrales n'ont pas une compréhension approfondie des domaines d'activité, ce qui entraîne des produits de données de mauvaise qualité ou mal alignés.
- Agilité limitée : les changements nécessitant une coordination au sein d'une seule équipe ralentissent la réactivité face à l'évolution des besoins de l'entreprise.
Avantages d'un maillage de données
Les bases de données héritées et les infrastructures limitées de gestion des données ont contribué à donner l'impression que les données devaient être conservées dans un seul coffre-fort et distribuées à la discrétion de quelques gestionnaires de données. Aujourd'hui, les données sont le carburant de votre entreprise, et elles doivent être confiées sans restriction aux spécialistes qui savent le mieux comment les exploiter et générer des bénéfices en temps de concurrence.
Les principaux avantages d'une architecture de maillage de données peuvent être répartis en trois catégories :
Évolutivité et agilité
Amélioration de l'accessibilité des données : le maillage de données garantit que toutes les personnes appropriées au sein de votre organisation peuvent accéder aux données dont elles ont besoin et ainsi donner le meilleur d'elles-mêmes.
Processus et pipelines de données personnalisables : de nombreux projets, parmi les meilleurs et potentiellement les plus rentables, sont mis de côté en raison de l'énorme difficulté à rassembler les ensembles de données uniques et personnalisées nécessaires à leur réussite. Avec un maillage de données, les équipes peuvent rapidement accéder à de nouveaux modèles de projet et les tester sans perte de temps ou de ressources.
Réduction des goulets d'étranglement : c'est une situation gagnant-gagnant pour les équipes IT et les propriétaires de données. En outre, en réduisant une source de frustration et d'énervement, les entreprises peuvent contribuer à briser les silos qui font obstacle à un développement sain.
Qualité et confiance
Amélioration des capacités analytiques : lorsque les entreprises considèrent les données comme un produit à utiliser au quotidien, les équipes peuvent adopter une approche de la planification et de la stratégie fondée sur les données. Cela permet de réduire les erreurs et d'adopter une approche du développement plus objective et moins biaisée.
Collaboration transversale et réutilisation
Moins de pression sur les équipes centrales de gestion des données : non seulement les retards et les frustrations sont réduits, mais en plus vos équipes IT talentueuses peuvent consacrer un nombre d'heures incalculables à des activités plus ciblées, plus intéressantes et plus rentables.
En décentralisant la propriété et en traitant les données comme un produit, le maillage de données permet aux organisations d'agir plus rapidement, de renforcer la confiance dans les informations et de s'adapter en toute fluidité, dans tous les domaines.
Principes fondamentaux du maillage de données
Lorsque nous parlons de lacs de données et de maillage de données, nous parlons essentiellement du Big Data. Le terme « Big » n'est pas seulement lié au volume impressionnant de données. Le Big Data se définit également, entre autres critères, par le fait qu'il est complexe, variable, généré rapidement et non structuré.
Une base de données linéaire ressemble à une feuille de calcul : elle comporte des colonnes et des lignes, ainsi que des catégories immuables dans lesquelles tous les composants des données doivent rentrer. Certaines des données générées par les machines, les capteurs et les sources industrielles sont structurées et s'insèrent parfaitement dans une base de données linéaire. Quel que soit le volume de données que vous devez traiter, du moment où elles sont entièrement structurées, elles ne répondent pas aux critères du Big Data et peuvent être hébergées dans une base de données linéaire, ce qui les rend relativement simples à filtrer et à extraire.
Mais, de plus en plus, le Big Data moderne est non structuré et se compose d'éléments visuels, de textes ouverts, voire de vidéos et de contenus multimédias enrichis. Ces données cruciales peuvent représenter des milliers de téraoctets d'informations pour de nombreuses entreprises, et il est tout simplement impossible de les stocker dans une base de données linéaire standard.
C'est là qu'intervient le lac de données. Lorsque le volume de Big Data a commencé à augmenter, les lacs de données ont été mis au point pour permettre le stockage de données complexes et leur accès à partir d'un référentiel central dans leur format brut. Si les lacs de données représentent une excellente solution au problème du Big Data, ils n'en présentent pas moins quelques faiblesses. Les lacs de données ne disposent pas de toutes les fonctions analytiques, ce qui signifie qu'ils dépendent d'autres services pour les fonctionnalités d'extraction, d'indexation, de transformation, de requête et d'analytique.
Quatre principes du maillage de données permettent de relever les défis posés par les lacs de données :
1. Propriété du domaine
La propriété des données contenues dans les lacs de données est complexe à définir lorsque de nombreux acteurs génèrent des données et y accèdent. En l'absence de rôles et de responsabilités clairement définis, le même ensemble de données peut être géré différemment par différentes parties, ce qui crée des incohérences et complique son utilisation. De même, d'autres données finissent par être négligées lorsqu'elles ne sont pas gérées activement par ceux qui les utiliseront en dernier ressort.
L'architecture de maillage des données résout ce problème en décentralisant la propriété. Elle garantit que la gouvernance des donnéesest clairement distribuée par domaine afin que chaque équipe ou expert du domaine puisse régir les données qu'il produit et utilise. Pour ce faire, les maillages de données utilisent également une structure de gouvernance fédérée qui permet de contrôler de manière centrale la modélisation des données,les politiques de sécurité et la conformité. La propriété du maillage de données favorise la responsabilité et améliore l'utilisabilité des données.
2. Données en tant que produits
Les lacs de données peuvent ne pas garantir la qualité des données lorsque le volume de données devient trop important ou lorsque les principaux gestionnaires de données ne les comprennent pas eux-mêmes. L'architecture du maillage de données traite essentiellement les données comme un produit de valeur, ce qui place la qualité et l'exhaustivité des données au premier plan de la gestion des données. On peut supposer que chaque équipe connaît les critères et les priorités les plus importants qu'elle souhaite extrapoler à partir des données qu'elle collecte. En intégrant ces critères et ces priorités à l'architecture, le maillage de données peut contribuer à garantir la livraison continue et prioritaire de données propres, à jour et complètes, même lorsqu'il s'agit d'ensembles de données plus importants. Et, bien sûr, lorsque des algorithmes de Machine Learning sont appliqués, ces critères et les ensembles de données qui en résultent deviennent de plus en plus précis et utiles au fil du temps.
3. Plateforme de données en libre-service
Les lacs de données peuvent créer des goulets d'étranglement en raison de leur architecture centralisée et de leurs processus et protocoles d'extraction de données traditionnellement complexes. Cela signifie généralement que le contrôle d'une grande quantité de données consolidées est confié à une seule équipe IT ou de gestion des données. Et, à mesure que les volumes de données (et la demande pour les extraire) augmentent, ces équipes IT se retrouvent surchargées.
En outre, les données doivent être révisées et structurées correctement pour garantir la conformité et le respect des principes de gouvernance des données. Lorsque l'on est soumis à une pression excessive, on peut avoir tendance à bâcler ces étapes liées à la conformité, ce qui entraîne des risques potentiels et des pertes pour l'entreprise. Les principes du maillage des données répondent à ces problématiques en mettant à disposition une plateforme de données en libre-service. Les utilisateurs autorisés peuvent contrôler les données dans lesquels ils ont un intérêt direct et y accéder, et ce à l'aide de protocoles de sécurité rigoureux et intégrés. Cela réduit les goulets d'étranglement et accélère la livraison des données.
4. Gouvernance fédérée
Si la décentralisation est essentielle, les organisations ne peuvent toutefois pas abandonner la gouvernance. Le maillage de données utilise un modèle de gouvernance fédéré pour concilier autonomie et cohérence. Cela signifie que les domaines gèrent leurs propres produits de données, mais doivent respecter des normes communes en matière de sécurité, de conformité et d'interopérabilité au sein de l'organisation. Cette approche hybride de la gouvernance du maillage de données garantit l'agilité sans sacrifier la confiance ou le respect de la réglementation.
Bien que le maillage de données présente certains défis, l'architecture décentralisée et démocratisée de gestion des données a rendu les entreprises plus intelligentes, plus agiles et plus précises. Comment ? En garantissant que les bonnes données sont immédiatement disponibles pour les bonnes personnes, partout et à tout moment. Grâce au maillage de données, les données en tant que produit deviennent réalité. Les obstacles sont réduits et la pertinence de l'information est hiérarchisée afin que les équipes puissent accéder plus rapidement et plus facilement aux données essentielles.
Architecture et structures de maillage des données
Nous avons vu que le maillage de données est une forme décentralisée d'architecture des données qui traite les données comme un outil essentiel de gestion d'entreprise. Par ailleurs, des équipes indépendantes sont chargées de traiter les données dans leurs domaines de travail et d'expertise, tout en assurant la conformité avec les pratiques de gestion des données déterminées au niveau central. C'est ce changement d'état d'esprit qui est au cœur du maillage de données.
Vue d'ensemble d'une architecture de maillage de données
Dans un maillage de données, les domaines sont les principaux producteurs et consommateurs de données, chacun possédant ses données en tant que produits pour garantir la qualité et la pertinence. La plateforme en libre-service fournit l'infrastructure pour la publication, la découverte et l'utilisation de ces produits de données, ainsi que des fonctionnalités automatisées de sécurité et de conformité. La gouvernance fonctionne selon un modèle fédéré, qui concilie les normes mondiales en matière d'interopérabilité et de sécurité avec l'autonomie locale, afin que les domaines puissent innover tout en maintenant la confiance et la cohérence au sein de l'organisation.
Pour mieux comprendre comment s'articule l'architecture de maillage de données, examinons ses trois principaux composants.
Sources de données
Celles-ci représentent le référentiel (comme un lac de données) au sein duquel les données brutes primaires sont acheminées. Qu'elles soient collectées à partir de réseaux IIoT dans le cloud, de formulaires de feedback des clients ou de données web récupérées, il s'agit des données brutes entrantes qui seront référencées et traitées en fonction des besoins par les utilisateurs à travers le réseau. Tandis qu'une approche de type « lac de données » permettrait d'acheminer toutes ces données vers un lieu central, la méthodologie de maillage des données répartit la responsabilité de la réception, du stockage, du traitement et de l'extraction de ces données brutes entre plusieurs responsables.
Infrastructure de maillage de données
L'information ne reste pas isolée au sein des différents départements, mais elle peut également être partagée à volonté à travers le réseau opérationnel de l'organisation, tout en restant conforme aux lignes directrices établies en matière de gouvernance des données. C'est le résultat direct de deux des piliers clés du maillage de données : une plateforme de données en libre-service et une gouvernance fédérée. La plateforme de données en libre-service fournit les outils et l'infrastructure nécessaires à chaque domaine pour ingérer, transformer, traiter et servir leurs données de manière universelle. Parallèlement, les principes de gouvernance fédérée garantissent la standardisation à l'échelle de l'organisation, ce qui facilite l'interopérabilité des données entre toutes les équipes de domaine.
Propriétaires de données
Composante finale d'un maillage de données, les propriétaires de données sont responsables de l'application des protocoles de conformité, de gouvernance et de catégorisation pour les données de leurs services. Par exemple, les dossiers RH doivent être conservés selon certains protocoles de sécurité ; ils ne doivent pas être utilisés à telle ou telle fin ; ils ne doivent être communiqués qu'à telle ou telle personne. Bien entendu, chaque service aura des catégories et des types de données propres à son activité ou à ses objectifs. Dans un système de lac de données, les équipes IT doivent gérer tous ces différents protocoles et catégories pour tous les propriétaires de données qui ont déposé des données dans le lac. En revanche, l'architecture de maillage de données confère aux propriétaires de domaine une autorité et un contrôle complets sur ces points car, une fois encore, qui mieux que les experts métier pour gérer leurs propres données et s'assurer qu'elles répondent aux normes de qualité ?
Modèle opérationnel du maillage de données
Le modèle opérationnel du maillage de données rassemble les personnes, les processus et les technologies afin de faciliter une gestion décentralisée des données à grande échelle. Cette collaboration garantit une circulation fluide des données au sein de l'organisation, favorisant ainsi la confiance, l'agilité et la réutilisation sans dépendre d'une seule équipe centralisée. Le maillage de données permet l'interopérabilité et la découverte en appliquant des normes communes et en fournissant une plateforme commune, des formats et des termes de recherche cohérents, ainsi que des règles de gouvernance pour la publication et l'utilisation des produits de données. Les outils de maillage de données, tels que les catalogues et les registres de données, permettent aux équipes de trouver rapidement et d'utiliser en toute sécurité les produits de données dans toute l'organisation.
Considérez un maillage de données comme une ville moderne : chaque quartier (domaine) gère ses propres services et prestations (eau, électricité, déchets, etc.), car il connaît mieux que quiconque ses besoins locaux. La ville fournit des infrastructures communes, telles que les routes et les transports publics (plateforme en libre-service) et des normes de sécurité (gouvernance), afin que les quartiers puissent être reliés, accéder aux ressources de la ville et collaborer en toute simplicité. De cette façon, les ressources circulent librement dans toute la ville, tout le monde suit des règles communes et l'innovation prospère au niveau local tandis que l'ensemble de la ville fonctionne sans heurts.
Le maillage de données en pratique : exemples et cas d'utilisation
Pour que les solutions de gestion des données évoluent et deviennent plus performantes, elles doivent être utilisables et convenir à un large éventail d'applications et d'opérations. Au fur et à mesure que l'architecture de maillage des données et la convivialité s'améliorent, nous constatons que de plus en plus de fonctions métier peuvent être optimisées grâce à une approche sécurisée et distribuée des données en tant que produit et en tant qu'outil.
Penchons-nous sur quelques cas d'utilisation courants du maillage de données.
Ventes
Pour les équipes de vente, tout se résume à l'acquisition, à la maturation et à la finalisation des pistes. Plus les membres de votre équipe de vente passent de temps à effectuer des tâches administratives, moins ils ont le temps de nouer des relations avec de nouveaux clients. Grâce à l'architecture de maillage des données, les utilisateurs de l'équipe de vente n'ont pas besoin d'être des experts en gestion et en extraction de données pour avoir à portée de main les ensembles et les combinaisons de données les plus puissants et les plus pertinents. Lorsque les équipes de vente disposent de toutes les données appropriées à analyser, cela se traduit par des insights et des stratégies plus exploitables.
Exemple de maillage de données pour les ventes : les équipes commerciales régionales ou spécifiques à un produit peuvent gérer leurs propres domaines de données CRM et pipeline, ce qui permet d'établir des prévisions précises et de disposer de tableaux de bord en temps réel sans avoir à attendre l'intervention d'une équipe IT centrale.
Supply Chain et logistique
Les Supply Chains modernes sont vulnérables à un large éventail de perturbations. Les entreprises peuvent acquérir un avantage concurrentiel lorsqu'elles sont capables de s'adapter rapidement et de réagir avec la même agilité aux menaces et aux opportunités qui se présentent à elles. Aujourd'hui, les données issues des Supply Chains mondiales sont abondantes et rapides : retours clients, réseaux IIoT, jumeaux numériques, etc. Lorsque des responsables Supply Chain expérimentés et avisés sont eux-mêmes capables d'analyser et d'approfondir ces ensembles de données en temps réel, les entreprises disposent alors d'une source puissante d'insights et d'expertise.
Exemple de maillage de données pour la Supply Chain : l'optimisation de la Supply Chain nécessite une visibilité en temps réel sur les niveaux de stock, les performances des fournisseurs et les données logistiques. Le maillage des données confère à chaque domaine (achats, entreposage, transport) la propriété de ses produits de données, ce qui permet de prendre des décisions plus rapidement et d'optimiser la rentabilité des opérations.
Production
Dans le cadre de la Supply Chain, les opérations de production d'une entreprise sont tout aussi vulnérables aux changements rapides du marché et à la volatilité des exigences des clients. Par le passé, les équipes de conception et de R&D devaient s'appuyer sur les données historiques des clients, qui leur étaient fournies par d'autres services. Aujourd'hui, le maillage de données offre un accès en temps réel aux données aux travailleurs de bureau, aux équipes de R&D et de test, et même à l'atelier de production. Les commentaires des clients en temps réel peuvent éclairer le développement des produits en un instant, et les informations de dernière minute provenant des réseaux IIoT et des simulations numériques peuvent aider les usines à fonctionner de manière plus sûre, plus rapide et plus efficace.
Exemple de maillage de données pour la production : Les équipes au niveau des usines peuvent détenir des données relatives aux performances des capteurs et des machines, ce qui permet une maintenance prédictive et réduit les temps d'arrêt grâce à une analytique décentralisée.
Marketing
Les demandes et les attentes des clients façonnent l'avenir et évoluent à un rythme sans précédent. Une marque a généralement une multitude de points de contact avec les consommateurs sur les réseaux sociaux, les publicités numériques ciblées et les portails d'achat en ligne et omnicanal. Le marché actuel est caractérisé par un désir croissant de personnalisation rapide, par des cycles de vie des produits plus courts et par des niveaux de choix et de concurrence énormes. Pour comprendre et anticiper ces tendances, les spécialistes marketing modernes doivent avoir un accès simultané et en temps réel à une grande variété d'ensembles de données. Dans le passé, cela signifiait qu'il fallait demander ces données à d'autres services, et attendre. Avec une configuration de maillage de données, cependant, les spécialistes marketing peuvent sélectionner ces données et y accéder en temps réel, selon leurs propres conditions.
Exemple de maillage de données pour le marketing : pour obtenir une vue à 360° du client, il faut intégrer les données provenant de plusieurs canaux, tels que les e-mails, les réseaux sociaux et les publicités payantes. Le maillage de données permet à chaque canal de posséder son propre produit de données, garantissant ainsi des informations précises et en temps réel, pour des campagnes personnalisées et une meilleure expérience client.
Ressources humaines
Les équipes RH doivent gérer de grandes quantités de données extrêmement complexes et sensibles. Et avec la tendance croissante à travailler à distance et de manière hybride, ces données deviennent chaque jour plus compliquées et géographiquement plus diverses. Sans parler de l'évolution constante des questions juridiques et de conformité que les équipes RH doivent impérativement maîtriser. De l'embauche à la retraite, les responsables RH doivent être en mesure de valider, d'évaluer et d'analyser certains des ensembles de données les plus disparates qui existent. L'architecture de maillage des données permet de mettre en place les protocoles de sécurité appropriés et de restreindre étroitement l'accès, tout en permettant aux utilisateurs RH autorisés d'accéder aux données et aux informations rapidement et sans dépendre de protocoles internes complexes et de procédures bureaucratiques multiservices.
Exemple de maillage de données pour les RH : les équipes dédiées au recrutement, à la paie et à la gestion des performances peuvent gérer leurs propres domaines de données, ce qui améliore la conformité et permet une analytique en temps réel du personnel, pour une prise de décision stratégique.
Fonction Finance
Tout comme les RH, les fonctions Finance et de comptabilité sont également responsables de données extrêmement cruciales et sensibles. Les systèmes ERP modernes révolutionnent la finance en utilisant la technologie des bases de données In-Memory pour personnaliser les rapports, les analyses et les projections les plus récents. Pourtant, même lorsque les équipes Finance utilisent les meilleures bases de données et les meilleurs ERP, elles restent souvent en proie à des cultures rigides et anciennes, à des silos lourds et à des processus bureaucratiques obsolètes. L'architecture de maillage de données apporte un changement fondamental dans la façon dont les données financières sont considérées et gérées. Elle peut même bousculer la pensée stagnante pouvant apparaître lorsque les entreprises donnent les moyens à leurs équipes de réviser leurs processus de gestion des données vieillissants.
Exemple de maillage de données pour la fonction Finance : les équipes de planification financière peuvent gérer les domaines de données liés au chiffre d'affaires, aux dépenses et aux investissements, ce qui permet d'établir des prévisions précises et des scénarios agiles sans avoir à attendre l'intervention d'une équipe IT centrale.
Il est évident que le maillage de données n'est pas qu'un mot à la mode et qu'il s'agit d'une tendance de stratégie des données qui doit être prise au sérieux. Les entreprises de toutes tailles et de tous secteurs utilisent le maillage de données afin de trouver des moyens d'utiliser les données pour générer des insights et de la valeur.
Alternatives au maillage des données
Si le maillage de données offre une approche décentralisée de la gestion des données, ce n'est pas la seule option disponible. Les architectures traditionnelles telles que les lacs de données et les entrepôts de données restent largement utilisées pour centraliser et stocker de grands volumes de données, et sont souvent associées à des data lakehouses qui combinent des capacités de traitement des données structurées et non structurées. D'autres modèles, comme la structure de données, misent sur la création d'une couche unifiée pour l'intégration et l'orchestration des données entre différents systèmes. Chaque alternative aborde l'évolutivité, la gouvernance et l'accessibilité de manière différente, ce qui signifie que le choix dépend des besoins et de la maturité de l'organisation.
Examinons les alternatives au maillage de données et leurs différences.
Maillage de données, lac de données ou data lakehouse
Maillage de données ou entrepôt de données
Maillage de données vs structure de données
Mise en œuvre du maillage de données
La mise en œuvre d'un maillage de données nécessite une approche stratégique qui concilie la décentralisation avec des normes partagées. Voici les étapes clés du maillage des données :
- Identifier les domaines pilotes : commencez modestement en sélectionnant deux ou trois domaines avec une valeur ajoutée claire et une forte maturité des données. Ces équipes feront office de pionnières, en testant le modèle de maillage de données avant de le déployer dans toute l'organisation.
- Établir la plateforme : créez une plateforme de données en libre-service qui fournit des outils communs pour la publication, la découverte et la consommation de produits de données. Cela inclut les catalogues de données, les API et les fonctionnalités de sécurité automatisées afin de réduire les frictions pour les équipes de domaine.
- Définir une gouvernance fédérée : élaborez des politiques de gouvernance qui appliquent les normes mondiales en matière de sécurité, de conformité et d'interopérabilité tout en laissant une certaine autonomie aux domaines. La gouvernance doit inclure des rôles clairs, des définitions de produits de données et des attentes en matière de qualité.
Anti-modèles à éviter
Lorsque le maillage de données est mis en œuvre de manière incorrecte, sans respecter les structures organisationnelles naturelles, cela peut entraîner de la confusion et des tensions. Un anti-modèle dans le maillage de données est une approche ou une pratique récurrente qui semble utile, mais qui, en réalité, compromet les principes fondamentaux de l'architecture. Voici certains des anti-modèles à éviter :
- Traiter le maillage de données comme un autre lac de données centralisé.
- Ignorer le changement culturel ; la technologie seule ne résoudra pas les problèmes de propriété.
- La sur-ingénierie de la plateforme avant validation de la valeur.
- Le manque de responsabilité claire en matière de qualité des données.
- Déploiement trop rapide sans validation du modèle de maillage de données dans les domaines pilotes.
Cinq bonnes pratiques pour le maillage de données
- Démarrer modestement et itérer : utilisez les domaines pilotes pour affiner les processus avant la mise à l'échelle.
- Traiter les données comme un produit : définissez les droits de propriété, les accords sur le niveau de service et les normes d'utilisabilité pour chaque ensemble de données.
- Investir dans des outils partagés : facilitez la publication et la découverte pour les équipes du domaine.
- Intégrer la gouvernance au plus tôt : conciliez l'autonomie avec la conformité dès le début.
- Se focaliser sur les résultats : alignez les produits de données sur une valeur mesurable, et pas seulement sur des objectifs techniques.
En combinant la propriété du domaine, une plateforme robuste et une gouvernance fédérée, les organisations peuvent améliorer leur agilité, la confiance et la collaboration entre les domaines, sans les goulets d'étranglement des modèles centralisés traditionnels.
Mesures et métriques
Pour évaluer le succès, il faut disposer de mesures du maillage de données qui concilient les performances techniques et les résultats stratégiques. Voici certaines de ces mesures :
-
Accords et objectifs sur le niveau de service relatifs à la qualité des produits de données : essentiels, mais doivent être adaptés au contexte de chaque domaine plutôt que d'être appliqués de manière uniforme. Voici quelques exemples d'indicateurs clés de performance relatifs aux produits de données :
- Pertinence des données : pourcentage de produits de données mis à jour dans l'intervalle convenu, par exemple, toutes les heures ou tous les jours
- Exhaustivité : pourcentage de champs obligatoires renseignés dans les ensembles de données
- Disponibilité : temps de disponibilité des produits de données (par exemple 99,9 %)
-
Adoption et réutilisation par les consommateurs : peut être un indicateur fiable de la valeur, mais pour le mesurer avec précision, il faut souvent suivre les habitudes d'utilisation et les commentaires des différentes équipes. Exemples d'indicateurs clés de performance relatifs à l'adoption et à la réutilisation par les consommateurs :
- Nombre de consommateurs uniques par produit de données
- Taux de réutilisation interdomaines : pourcentage de produits de données consommés par plusieurs domaines
- Score de satisfaction des consommateurs obtenu à partir d'enquêtes ou de feedback
-
Rapidité d'obtention des informations et frais de service : mettez en avant les gains d'efficacité par rapport aux modèles centralisés, bien que ces améliorations dépendent de la maturité organisationnelle et des processus fondamentaux. Exemples d'indicateurs clés de performance relatifs à la rapidité d'obtention des informations et aux frais de service :
- Temps moyen entre la demande de données et l'obtention d'informations exploitables
- Réduction des coûts d'exploitation par rapport au modèle centralisé
- Pourcentage de diminution des retards pour les demandes de données
-
Faiblesses courantes des concurrents à exploiter : concentrez-vous sur les domaines dans lesquels vos concurrents rencontrent des difficultés et utilisez les principes du maillage de données pour les surpasser. Exemples d'indicateurs clés de performance liés aux faiblesses des concurrents à exploiter :
- Nombre de faiblesses identifiées chez les concurrents qui ont été traitées grâce aux capacités des produits de données, par exemple une meilleure capacité de découverte, un accès plus rapide aux données
- Avantage en termes de délai de mise sur le marché pour les nouveaux produits de données par rapport à la concurrence
- Augmentation du taux d'adoption en libre-service par rapport aux estimations des concurrents
Ensemble, ces indicateurs fournissent des informations directionnelles permettant de déterminer si le maillage de données offre agilité, confiance et évolutivité sans pour autant adopter des benchmarks uniformes.
FAQ sur le maillage de données
L'interopérabilité est définie comme la capacité d'un système ou d'un produit à fonctionner avec d'autres systèmes ou produits sans effort particulier de la part de l'utilisateur. Selon Techtarget, cela permet aux entreprises de gagner en efficacité et d'obtenir une vue plus globale des informations et des données. Pour des informations plus détaillées, ce cours en ligne ouvert à tous explique les bases de l'interopérabilité des données, ainsi que les différents types et couches d'interopérabilité des données.
Dans le contexte des données, l'interopérabilité va au-delà de la simple connectivité et inclut la capacité de découverte (rendre les produits de données facilement trouvables entre les domaines grâce à des catalogues ou des registres) ; les contrats (des accords clairs et lisibles par machine sur les schémas de données, les API et les accords sur le niveau de service afin d'assurer une consommation cohérente) ; et les normes partagées (une gouvernance, des métadonnées et des pratiques de sécurité communes pour faciliter et fluidifier l'échange de données entre les domaines).
Un exemple d'interopérabilité est lorsque le domaine Client publie un produit de données contenant des profils clients, et que le domaine Ventes les utilise pour enrichir l'analytique du pipeline. Grâce à l'interopérabilité, l'équipe Ventes peut facilement trouver ce produit de données dans un catalogue, s'appuyer sur son contrat pour garantir la qualité et la structure des données, et l'intégrer selon des standards partagés, sans effort manuel.
Le maillage de données et la structure de données sont des approches architecturales différentes dans le cadre de la stratégie de gestion des données d'une entreprise.
La structure de données est une approche purement technologique qui cherche à trouver des moyens de plus en plus faciles de gérer des métadonnées complexes et des informations non structurées en fusionnant l'IA, le Machine Learning et l'analytique avancée. Le maillage de données, quant à lui, bien que dépendant de tous les développements technologiques inhérents à la structure de données, se concentre davantage sur l'intégration des processus de gestion des données avec les utilisateurs humains qui en dépendent, ainsi que sur la recherche de moyens de rationaliser et de simplifier l'accès aux données et leur utilité d'un point de vue humain.
Entre le maillage de données et la structure de données, c'est un peu comme l'œuf et la poule : pour que les technologies de gestion des données évoluent à la vitesse nécessaire, il faut des technologies de structure de données toujours plus performantes. Cependant, si les processus humains et les stratégies organisationnelles n'évoluent pas en parallèle, les utilisateurs ne seront pas en mesure d'exploiter correctement les technologies de structure de données. Tout comme le DOS et les interfaces complexes ont cédé la place aux systèmes d'exploitation informatiques plus fluides que nous utilisons aujourd'hui, les architectures de maillage et de structure de données sont vouées à devenir de plus en plus fluides au fur et à mesure que ces processus et technologies progressent.
PRODUIT SAP
Connecter les données, stimuler l'innovation
Découvrez comment SAP Business Data Cloud accélère les enseignements pilotés par les données dans toute votre entreprise.