Accès rapide au contenu
Câbles informatiques

Qu'est-ce que l'exploration de données ?

 

Cette page Web a été traduite automatiquement pour vous faciliter la tâche. SAP ne fournit aucune garantie concernant l'exactitude ou l'exhaustivité de la traduction automatique. La page web originale en anglais peut être trouvée en utilisant la carte du monde située dans le coin supérieur droit de cette page.

L'exploration de données est le processus d'extraction d'informations utiles à partir d'une accumulation de données, souvent à partir d'un entrepôt de données ou d'une collecte d'ensembles de données liés. Les outils d'exploration de données incluent de puissantes fonctionnalités statistiques, mathématiques et analytiques dont l'objectif principal est de passer au crible de grands ensembles de données afin d'identifier les tendances, les modèles et les relations pour favoriser une prise de décision et une planification informées.

 

Souvent associée aux demandes du service marketing, l'exploration de données est considérée par de nombreux dirigeants comme un moyen de mieux comprendre la demande et de voir l'impact des modifications des produits, des prix ou des promotions sur les ventes. Mais l'exploration de données présente également des avantages considérables pour d'autres domaines d'activité. Les ingénieurs et les concepteurs peuvent analyser l'efficacité des modifications de produit et rechercher les causes possibles de la réussite ou de l'échec du produit en fonction de la manière, du moment et du lieu d'utilisation des produits. Les opérations de service et de réparation peuvent mieux planifier le stock de pièces et l'affectation du personnel. Les entreprises de services professionnels peuvent utiliser l'exploration de données pour identifier de nouvelles opportunités issues de l'évolution des tendances économiques et des changements démographiques.

 

L'exploration de données devient plus utile et précieuse avec des ensembles de données plus volumineux et une expérience utilisateur accrue. Logiquement, plus il y a de données, plus il y a d'informations et d'informations à y enterrer. De plus, plus les utilisateurs se familiarisent avec les outils et comprennent mieux la base de données, plus ils sont créatifs dans leurs explorations et analyses.

Pourquoi utiliser l'exploration de données ?

Le principal avantage de l'exploration de données est sa capacité à identifier des modèles et des relations dans de grands volumes de données provenant de plusieurs sources. Avec de plus en plus de données disponibles, provenant de sources aussi variées que les réseaux sociaux, des capteurs à distance et des rapports de plus en plus détaillés sur le mouvement des produits et l'activité du marché, l'exploration de données offre les outils nécessaires pour exploiter pleinement le Big Data et le transformer en intelligence exploitable. De plus, il peut servir de mécanisme pour « penser en dehors du cadre ».

 

Le processus d'exploration de données peut détecter des relations et des modèles surprenants et intrigants dans des fragments d'informations apparemment non liés. Comme l'information tend à être compartimentée, il a été historiquement difficile ou impossible d'analyser dans son ensemble. Cependant, il peut y avoir une relation entre les facteurs externes (démographiques ou économiques, par exemple) et la performance des produits d'une entreprise. Et si les dirigeants examinent régulièrement les chiffres de vente par territoire, ligne de produits, canal de distribution et région, ils manquent souvent de contexte externe pour ces informations. Leur analyse souligne « ce qui s'est passé », mais ne met guère en évidence « pourquoi cela s'est passé de cette manière ». L'exploration de données peut combler cette lacune.

 

L'exploration de données peut rechercher des corrélations avec des facteurs externes. Bien que la corrélation n'indique pas toujours la causalité, ces tendances peuvent être des indicateurs précieux pour guider les décisions relatives aux produits, aux canaux et à la production. La même analyse bénéficie à d'autres parties de l'entreprise, de la conception du produit à l'efficacité opérationnelle et à la prestation de services.

Historique de l'exploration de données

Des personnes collectent et analysent des données depuis des milliers d'années et, à bien des égards, le processus est resté le même : identifier les informations nécessaires, trouver des sources de données de qualité, collecter et combiner les données, utiliser les outils les plus efficaces disponibles pour analyser les données et tirer parti de ce que vous avez appris. Au fur et à mesure que l'informatique et les systèmes basés sur les données se sont développés, les outils de gestion et d'analyse des données se sont développés. Le véritable point d'inflexion est venu dans les années 1960 avec le développement de la technologie des bases de données relationnelles et des outils de requête en langage naturel orienté utilisateur comme Structured Query Language (SQL). Les données n'étaient plus disponibles uniquement via des programmes codés personnalisés. Grâce à cette avancée, les utilisateurs professionnels pouvaient explorer de manière interactive leurs données et extraire les joyaux cachés de l'intelligence enfouis à l'intérieur.

 

L'exploration de données est traditionnellement un ensemble de compétences spécialisées dans la science des données. Toutefois, chaque nouvelle génération d'outils d'analyse nécessite des compétences techniques avancées, mais évolue rapidement pour devenir accessible aux utilisateurs. L'interactivité – la possibilité de laisser les données vous parler – est la principale avancée. Posez une question ; voir la réponse. En fonction de ce que vous apprenez, posez une autre question. Ce type d'itinérance non structurée à travers les données amène l'utilisateur au-delà des limites de la conception de la base de données spécifique à l'application et permet de découvrir des relations qui dépassent les frontières fonctionnelles et organisationnelles.

 

L'exploration de données est un composant clé de la Business Intelligence. Les outils d'exploration de données sont intégrés aux tableaux de bord exécutifs, qui permettent d'extraire des informations du Big Data, y compris des données provenant des réseaux sociaux, des flux de capteurs de l'Internet des Objets (IdO), des appareils de localisation, du texte non structuré, des vidéos, etc. L'exploration de données moderne repose sur le cloud et l'informatique virtuelle, ainsi que sur les bases de données in-memory, pour gérer les données de nombreuses sources de manière rentable et pour s'adapter à la demande.

Comment fonctionne l'exploration de données ?

Il existe environ autant d'approches de l'exploration de données qu'il y a d'explorateurs de données. L'approche dépend du type de questions posées ainsi que du contenu et de l'organisation de la base de données ou des ensembles de données fournissant la matière première pour la recherche et l'analyse. Cela dit, certaines étapes organisationnelles et préparatoires doivent être accomplies pour préparer les données, les outils et les utilisateurs :
  1. Comprenez le problème, ou du moins le domaine d'enquête. Le décideur d'entreprise, qui devrait être à la tête de cette aventure d'exploration de données hors route, a besoin d'une compréhension générale du domaine dans lequel il travaillera, à savoir les types de données internes et externes qui feront partie de cette exploration. On suppose qu'ils ont une connaissance intime de l'activité et des domaines fonctionnels impliqués.
  2. Collecte de données. Commencez par vos systèmes et bases de données internes. Liez-les via leurs modèles de données et divers outils relationnels ou rassemblez les données dans un entrepôt de données. Cela inclut toutes les données provenant de sources externes qui font partie de vos opérations, telles que les données de force de vente et/ou de service, l'IdO ou les données de médias sociaux. Rechercher et acquérir les droits sur les données externes, notamment les données démographiques, économiques et de marché, telles que les tendances du secteur et les références financières auprès des associations professionnelles et des gouvernements. Intégrez-les au domaine d'application du kit d'outils (intégrez-les à votre entrepôt de données ou reliez-les à l'environnement d'exploration de données).
  3. Préparation et compréhension des données. Utilisez les experts en la matière de votre entreprise pour vous aider à définir, catégoriser et organiser les données. Cette partie du processus est parfois appelée mise en forme des données. Certaines données peuvent nécessiter un nettoyage pour supprimer les doublons, les incohérences, les enregistrements incomplets ou les formats obsolètes. La préparation et le nettoyage des données peuvent être une tâche en cours au fur et à mesure que de nouveaux projets ou des données provenant de nouveaux champs d'enquête deviennent intéressants.
  4. Formation des utilisateurs. Vous ne donneriez pas à votre adolescent les clés de votre Ferrari sans l'avoir fait passer le permis, une formation sur route et une certaine pratique supervisée avec un conducteur agréé. Assurez-vous donc de fournir une formation formelle à vos futurs explorateurs de données ainsi qu'une pratique supervisée pour qu'ils commencent à se familiariser avec ces puissants outils. La formation continue est également une bonne idée une fois qu'ils maîtrisent les bases et peuvent passer à des techniques plus avancées.

Techniques d'exploration de données

Gardez à l'esprit que l'exploration de données est basée sur un kit d'outils plutôt que sur une routine ou un processus fixe. Les techniques d'exploration de données spécifiques citées ici ne sont que des exemples de la manière dont les organisations utilisent les outils pour explorer leurs données à la recherche de tendances, de corrélations, d'intelligence et de visibilité sur l'entreprise.

 

En règle générale, les approches d'exploration de données peuvent être catégorisées comme étant orientées (axées sur un résultat spécifique souhaité) ou non orientées comme un processus de découverte. D'autres explorations peuvent être destinées à trier ou classifier les données, telles que le regroupement des clients potentiels en fonction d'attributs commerciaux tels que le secteur, les produits, la taille et le site. Un objectif similaire, la détection de valeurs aberrantes ou d'anomalies, est une méthode automatisée de reconnaissance des anomalies réelles (plutôt que de la simple variabilité) au sein d'un ensemble de données qui affiche des modèles identifiables.

 

Association

Un autre objectif intéressant est l'association, qui relie deux événements ou activités apparemment sans rapport. Une histoire classique des débuts de l'analyse et de l'exploration de données, peut-être fictive, a une chaîne de magasins de proximité découvrant une corrélation entre les ventes de bière et de couches. En spéculant que les nouveaux pères qui rentrent tard dans la soirée pour acheter des couches peuvent prendre quelques paquets de bière pendant qu'ils sont là. Les magasins placent la bière et les couches à proximité immédiate et augmentent les ventes de bière en conséquence.

 

Regroupement

Cette approche vise à regrouper les données par similitudes plutôt que par hypothèses prédéfinies. Par exemple, lorsque vous explorez vos informations de vente client combinées à des données externes sur le crédit à la consommation et des données démographiques, vous découvrirez peut-être que vos clients les plus rentables proviennent de villes de taille moyenne.

La plupart du temps, l'exploration de données est poursuivie pour prendre en charge les prévisions. Mieux vous comprenez les modèles et les comportements, mieux vous pouvez prévoir les actions futures liées aux causes ou aux corrélations.

 

Régression

L'une des techniques mathématiques proposées dans les kits d'outils d'exploration de données, l'analyse de régression prédit un nombre basé sur des modèles historiques projetés dans le futur. Divers autres algorithmes de détection et de suivi des modèles fournissent des outils flexibles pour aider les utilisateurs à mieux comprendre les données et le comportement qu'elles représentent.

Ce ne sont là que quelques-unes des techniques et outils disponibles dans les kits d'outils d'exploration de données. Le choix de l'outil ou de la technique est quelque peu automatisé dans le sens où les techniques seront appliquées en fonction de la manière dont la question est posée. Auparavant, l'exploration de données était appelée « découpage » de la base de données, mais la pratique est désormais plus sophistiquée et des termes comme association, clustering et régression sont monnaie courante.

Cas d'utilisation et exemples

L'exploration de données est essentielle à l'analyse des sentiments client, à l'optimisation des prix, au marketing des bases de données, à la gestion des risques de crédit, à la formation et au support, à la détection des fraudes, aux diagnostics médicaux et médicaux, à l'évaluation des risques, aux systèmes de recommandation (« les clients qui ont également acheté cela aimait… »), et bien plus encore. Il peut s'agir d'un outil efficace dans n'importe quel secteur, y compris le commerce de détail, le commerce de gros, le secteur des services, la fabrication, les télécommunications, les communications, l'assurance, l'éducation, la fabrication, la santé, la banque, la science, l'ingénierie, le marketing en ligne ou les médias sociaux.

  • Développement produit : les entreprises qui conçoivent, fabriquent ou distribuent des produits physiques peuvent identifier les opportunités de mieux cibler leurs produits en analysant les schémas d'achat associés aux données économiques et démographiques. Leurs concepteurs et ingénieurs peuvent également recouper les commentaires des clients et des utilisateurs, les enregistrements de réparation et d'autres données pour identifier les opportunités d'amélioration des produits.
  • Fabrication : les fabricants peuvent suivre les tendances de qualité, les données de réparation, les taux de production et les données de performance des produits sur le terrain pour identifier les problèmes de production. Ils peuvent également reconnaître d'éventuelles mises à niveau de processus qui amélioreraient la qualité, économiseraient du temps et des coûts, amélioreraient la performance des produits et/ou mettraient en évidence le besoin d'équipements d'usine nouveaux ou de meilleure qualité.
  • Secteur des services : dans le secteur des services, les utilisateurs peuvent trouver des opportunités similaires d'amélioration des produits en recoupant les commentaires des clients (directement ou à partir de réseaux sociaux ou d'autres sources) avec des services, canaux, données de performance des pairs, régions, tarifs, données démographiques, économiques, etc.

Enfin, toutes ces conclusions doivent être intégrées à la prévision et à la planification afin que l'ensemble de l'entreprise soit attentive aux changements anticipés de la demande sur la base d'une connaissance plus approfondie du client, et qu'elle soit mieux placée pour exploiter les opportunités nouvellement identifiées.

Défis liés à l'exploration de données

  • Big Data : les données sont générées à un rythme qui s'accélère rapidement, offrant de plus en plus d'opportunités d'exploration de données. Cependant, des outils modernes d'exploration de données sont nécessaires pour donner du sens au Big Data, compte tenu du volume élevé, de la grande rapidité et de la grande variété des structures de données, ainsi que du volume croissant de données non structurées. De nombreux systèmes existants ont du mal à gérer, stocker et utiliser ce flot d'intrants.
  • Compétence de l'utilisateur : les outils d'exploration et d'analyse de données sont conçus pour aider les utilisateurs et les décideurs à donner du sens et à obtenir des informations à partir de masses de données. Bien que hautement techniques, ces outils puissants sont désormais packagés avec une excellente expérience utilisateur, de sorte que pratiquement n'importe qui peut utiliser ces outils avec un minimum de formation. Cependant, pour bénéficier pleinement des avantages, l'utilisateur doit comprendre les données disponibles et le contexte commercial des informations qu'il recherche. Ils doivent également savoir, du moins de manière générale, comment fonctionnent les outils et ce qu'ils peuvent faire. Cela n'est pas hors de portée du responsable moyen ou du cadre dirigeant, mais il s'agit d'un processus d'apprentissage et les utilisateurs doivent déployer des efforts pour développer ce nouvel ensemble de compétences.
  • Qualité et disponibilité des données : avec de nombreuses données nouvelles, il existe également des masses de données incomplètes, incorrectes, trompeuses, frauduleuses, endommagées ou simplement inutiles. Les outils peuvent aider à régler tout cela, mais les utilisateurs doivent être constamment conscients de la source des données, de leur crédibilité et de leur fiabilité. Les préoccupations de confidentialité sont également importantes, tant en ce qui concerne l'acquisition des données que la prise en charge et le traitement une fois qu'elles sont en votre possession.

Développez votre expertise
en gestion des données

Comprendre le processus de gestion des données et ses avantages.

Plus dans cette série

FAQ sur l'exploration de données

L'exploration de données est le processus d'utilisation d'outils analytiques avancés pour extraire des informations utiles d'une accumulation de données. L'apprentissage automatique est un type d'intelligence artificielle (IA) qui permet aux systèmes d'apprendre par l'expérience. L'exploration de données peut utiliser l'apprentissage automatique lorsque les programmes analytiques ont la possibilité d'adapter leurs fonctionnalités en réponse à l'analyse des données qu'ils effectuent.

L'analyse des données ou l'analyse sont des termes généraux pour l'ensemble des pratiques visant à identifier les informations utiles, à les évaluer et à fournir des réponses spécifiques. L'exploration de données est un type d'analyse de données axé sur l'exploration de grands ensembles de données combinés pour découvrir des modèles, des tendances et des relations susceptibles de générer des informations et des prévisions.

La science des données est un terme qui inclut de nombreuses technologies de l'information, y compris les statistiques, les mathématiques et les techniques de calcul sophistiquées appliquées aux données. L'exploration de données est un cas d'utilisation de la science des données axé sur l'analyse de grands ensembles de données provenant d'un large éventail de sources.

Un entrepôt de données est un ensemble de données, généralement issues de plusieurs sources (ERP, CRM, etc.) qu'une entreprise combinera dans l'entrepôt pour l'archivage et des analyses étendues telles que l'exploration de données.

Lettre d'information SAP Insights

S'abonner

Obtenez des insights clés en vous abonnant à notre lettre d'information.

Poursuite de la lecture

Haut de page