Accès rapide au contenu
Machine Learning identifiant des voitures

Qu'est-ce que le Machine Learning ?

Quel est le rapport entre le Machine Learning et l'IA ?

Le Machine Learning, ainsi que l'apprentissage profond et les réseaux de neurones artificiels qui le composent, constituent des sous-ensembles concentriques de l'IA. L'IA traite les données pour prendre des décisions et émettre des prévisions. Les algorithmes de Machine Learning permettent non seulement à l'IA de traiter ces données, mais aussi de les exploiter pour apprendre et devenir plus intelligente, sans avoir à recourir à une programmation additionnelle. L'intelligence artificielle est la mère du Machine Learning et de tous les sous-ensembles qui le composent. Dans le premier sous-ensemble se trouve le Machine Learning. Dans le Machine Learning se trouve l'apprentissage profond. Et dans l'apprentissage profond se trouvent les réseaux de neurones artificiels.

Diagramme de la relation entre IA et Machine Learning

Diagramme comparant l'IA au Machine Learning

Qu'est-ce qu'un réseau de neurones artificiels ?

 

Un réseau de neurones artificiels est représenté sous la même forme que des neurones dans un cerveau biologique. Les neurones artificiels sont appelés « nœuds » et sont regroupés en plusieurs couches, qui fonctionnent en parallèle. Lorsqu'un neurone artificiel reçoit un signal digital, il le traite et le transmet aux autres neurones auquel il est connecté. Comme dans un cerveau humain, le renforcement neuronal aboutit à une meilleure reconnaissance des schémas, une meilleure expertise et un meilleur apprentissage général.

 

Qu'est-ce que l'apprentissage profond (Deep Learning) ?

 

Ce type de Machine Learning est appelé « apprentissage profond », car il inclut de nombreuses couches du réseau de neurones artificiels et d'énormes volumes de données complexes et disparates. Dans l'apprentissage profond, le système interagit avec plusieurs couches du réseau. Il en extrait des sorties d'un niveau de plus en plus détaillé. Par exemple, un système d'apprentissage profond qui traite des images de la nature et recherche des marguerites jaunes va, dans la première couche, reconnaître une plante. Au fur et à mesure qu'il va avancer dans les couches, il va ensuite identifier une fleur, puis une marguerite, et enfin une marguerite jaune. Parmi les exemples d'applications d'apprentissage profond, citons la reconnaissance de discours, la classification d'images ou encore l'analyse pharmaceutique.

Comment fonctionne le Machine Learning ?

Le Machine Learning se décline sous différents types de modèles, qui emploient chacun des techniques algorithmiques différentes. Selon la nature des données et le résultat souhaité, l'un de ces quatre modèles d'apprentissage peut être utilisé : supervisé, non supervisé, semi-supervisé ou par renforcement. Dans chacun de ces modèles, une ou plusieurs techniques algorithmiques peuvent être appliquées. Tout dépend des ensembles des données qui seront utilisés et de l'objectif visé au niveau des résultats. Par nature, les algorithmes de Machine Learning sont conçus pour classifier des éléments, repérer des patterns, prévoir des résultats et prendre des décisions éclairées. Les algorithmes peuvent être mis en œuvre individuellement ou en groupe dans le but d'atteindre la plus grande précision possible lorsque les données utilisées sont complexes et imprévisibles. 

Comment fonctionne le Machine Learning ?

Diagramme illustrant le processus d'apprentissage machine

Qu'est-ce que l'apprentissage supervisé (Supervised Learning) ?

 

L'apprentissage supervisé est le premier des quatre modèles de Machine Learning. Dans les algorithmes de l'apprentissage supervisé, la machine apprend par l'exemple. Les modèles de l'apprentissage supervisé se composent de paires de données « d'entrée » et « de sortie », dans lesquelles la sortie est étiquetée avec la valeur souhaitée. Supposons que le but de la machine soit de faire la différence entre une marguerite et une pensée. Notre paire de données d'entrée binaire comprendra l'image d'une marguerite et l'image d'une pensée. Nous souhaitons que la machine choisisse la marguerite. L'image de la marguerite sera donc identifiée au préalable comme étant le résultat attendu.

 

Au moyen d'un algorithme, le système compile l'ensemble de ces données d'entraînement au fil du temps et les met en corrélation. Il commence alors à identifier des similarités, des différences et d'autres points de logique, jusqu'à ce qu'il puisse donner par lui-même la réponse à une question. C'est la même démarche que lorsqu'on donne à un enfant un ensemble de problèmes avec une clé de réponse, puis qu'on lui demande de nous montrer son travail et de nous expliquer la logique qu'il a appliquée. Les modèles de l'apprentissage supervisé sont utilisés dans de nombreuses applications avec lesquelles nous interagissons au quotidien, par exemple les moteurs de recommandation de produits ou les applications d'analyse de la circulation comme Waze, qui prévoit l'itinéraire le plus rapide selon le moment de la journée.

 

Qu'est-ce que l'apprentissage non supervisé (Unsupervised Learning) ?

 

L'apprentissage non supervisé est le deuxième des quatre modèles de Machine Learning. Dans les modèles d'apprentissage non supervisé, aucune clé de réponse n'est fournie. La machine étudie les données d'entrée, dont la grande majorité sont non étiquetées et non structurées, et recherche des patterns et des corrélations en se servant de toutes les données pertinentes et accessibles. Sur bien des points, l'apprentissage non supervisé ressemble à la façon dont les humains observent le monde. Nous nous appuyons sur notre intuition et notre expérience pour effectuer des regroupements. Plus nous acquérons de l'expérience sur un élément ou un domaine, plus notre capacité à le catégoriser et à le repérer gagne en précision. En ce qui concerne les machines, « l'expérience » se traduit par le volume de données auxquelles elles ont accès. Parmi les exemples communs d'applications d'apprentissage non supervisé, citons la reconnaissance faciale, l'analyse de séquences génétiques, les études de marché et la cybersécurité.

 

Qu'est-ce que l'apprentissage semi-supervisé (Semi-Supervised Learning) ?

 

L'apprentissage semi-supervisé est le troisième des quatre modèles de Machine Learning. Dans un monde parfait, toutes les données seraient structurées et étiquetées avant d'être placées dans un système. Mais comme ce n'est évidemment pas possible, l'apprentissage semi-supervisé constitue une solution envisageable lorsqu'on utilise de gros volumes de données brutes et non structurées. Ce type de modèle consiste à insérer de petits volumes de données étiquetées pour enrichir des ensembles de données non étiquetés. Ainsi, les données étiquetées permettent au système d'avoir une longueur d'avance, ce qui peut améliorer significativement la vitesse et la précision de l'apprentissage. Un algorithme d'apprentissage semi-supervisé invite la machine à analyser les données étiquetées afin de déterminer des propriétés corrélatives qui pourraient être appliquées aux données non étiquetées.

 

Toutefois, ce modèle comporte des risques, comme le montre cette étude approfondie de MIT Press. Les données étiquetées peuvent contenir des imperfections, qui seraient alors apprises et répliquées par le système. Les entreprises qui exploitent correctement l'apprentissage semi-supervisé veillent à ce qu'il y ait des protocoles bien définis en place. L'apprentissage semi-supervisé peut être utilisé dans l'analyse du discours et de la langue, dans les recherches médicales complexes (par ex. catégorisation des protéines), ou encore dans la détection de fraude à un niveau général.

 

Qu'est-ce que l'apprentissage par renforcement (Reinforcement Learning) ?

 

L'apprentissage par renforcement est le quatrième modèle de Machine Learning. Dans l'apprentissage supervisé, la machine reçoit la clé de réponse et apprend en trouvant des corrélations entre tous les résultats corrects. Le modèle d'apprentissage par renforcement n'inclut pas de clés de réponse, mais fournit à la place des actions admissibles, des règles et des situations finales potentielles. Lorsque le but voulu de l'algorithme est fixe ou binaire, les machines peuvent apprendre par l'exemple. Dans les cas où le résultat souhaité peut varier, le système doit apprendre sur la base de l'expérience et de la récompense. Dans les modèles d'apprentissage par renforcement, la « récompense » est digitale et programmée dans l'algorithme comme un élément que le système cherche à collecter.

 

De bien des façons, ce modèle fonctionne de manière analogue à quelqu'un qui apprendrait à jouer aux échecs. Il serait assurément impossible de montrer à cette personne tous les mouvements potentiels. À la place, vous lui expliquez les règles afin qu'elle puisse ensuite renforcer ses compétences grâce à la pratique. Les récompenses qu'elle obtiendra seront de remporter la partie, mais aussi de prendre les pièces de son adversaire. L'apprentissage par renforcement a de nombreuses applications : offre de prix automatisée pour les acheteurs de publicités en ligne, développement de jeux sur ordinateur ou encore négociations en bourse aux enjeux élevés.

Démo du Machine Learning en entreprise

Les algorithmes de Machine Learning identifient des patterns et des corrélations, ce qui signifie qu'ils sont très bons dans l'analyse de leur propre ROI. Pour les entreprises qui investissent dans les technologies de Machine Learning, cette capacité permet d'avoir une évaluation quasi-immédiate de l'impact opérationnel. Les domaines d'application du Machine Learning sont nombreux. En voici quelques exemples ci-dessous.

Lancez-vous dès maintenant !

Envie de voir une démo des technologies intelligentes SAP s'appuyant sur l'IA et le Machine Learning ?

  • Moteurs de recommandation : de 2009 à 2017, le nombre de foyers aux États-Unis à avoir souscrit des services de streaming vidéo a augmenté de 450 %. Et un article paru en 2020 dans le magazine Forbes rapporte que les chiffres en la matière ont encore augmenté de 70 %. Les moteurs de recommandation ont des applications sur bon nombre de plateformes de vente et de shopping, mais ils fonctionnent particulièrement bien avec les services de streaming de musique et de streaming vidéo­.
  • Marketing dynamique : pour générer des prospects et les faire évoluer dans le canal des ventes, il faut être capable de collecter et d'analyser le plus de données client possible. Les clients modernes produisent un volume énorme de données non structurées diverses et variées, depuis les transcriptions de chat jusqu'au chargement d'images. L'utilisation des applications de Machine Learning aide les spécialistes du marketing à comprendre ces données, ainsi qu'à les exploiter pour proposer un contenu marketing personnalisé et susciter un engagement en temps réel avec les clients et les prospects.
  • ERP et automatisation des processus : les bases de données ERP contiennent des ensembles de données vastes et disparates, pouvant inclure des statistiques sur les performances de ventes, des évaluations client, des rapports sur les tendances du marché, ou encore des enregistrements de gestion de la chaîne logistique. Les algorithmes de Machine Learning peuvent servir à trouver des corrélations et des patterns dans ces données. Ces insights apportent alors un éclairage sur presque chaque domaine d'activités, notamment en optimisant les workflows des dispositifs de l'Internet des Objets (IoT) au sein du réseau ou en déterminant les meilleures méthodes pour automatiser les tâches répétitives ou sources d'erreurs.
  • Maintenance prédictive : les chaînes logistiques modernes et les usines intelligentes s'appuient de plus en plus sur les dispositifs et les machines IoT, ainsi que sur la connectivité cloud pour l'ensemble de leurs flottes et de leurs opérations. Toute panne ou tout ralentissement peut engendrer des coûts énormes et des disruptions majeures. Lorsque les données de maintenance et de réparation sont collectées manuellement, il est presque impossible de prévoir les problèmes potentiels. Alors, de là à automatiser les processus pour les détecter et les prévenir... le pas est énorme. Des capteurs de passerelle IoT peuvent être installés sur des machines analogiques existant depuis des décennies, afin d'avoir une bonne visibilité sur les activités et de gagner en efficacité.

Problématiques du Machine Learning

Dans son livre Spurious Correlations, Tyler Vigan, scientifique des données et diplômé d'Harvard, remarque que « les corrélations ne traduisent pas toutes une connexion de causalité sous-jacente ». Pour illustrer ce point, il inclut un graphique présentant une corrélation qui semble forte entre la consommation de margarine et le taux de divorce dans l'état du Maine. Évidemment, il s'agit là d'un graphique humoristique. Pour revenir aux choses sérieuses, les applications de Machine Learning sont en effet sensibles aux biais et aux erreurs humaines et algorithmiques. Et vu la propension du Machine Learning à apprendre et à s'adapter, ces erreurs et ces fausses corrélations peuvent vite se répandre et polluer les résultats sur le réseau de neurones artificiels.

 

Une autre difficulté vient des modèles de Machine Learning, dans lesquels l'algorithme et son résultat sont si complexes qu'ils ne peuvent être expliqués ou compris par les humains. On appelle ce type de modèle « boîte noire ». Il peut mettre les entreprises en danger lorsque celles-ci sont incapables de déterminer comment et pourquoi un algorithme est arrivé à telle ou telle conclusion ou décision.

 

Heureusement, plus la complexité des ensembles de données et des algorithmes de Machine Learning augmente, plus les outils et les ressources pour gérer les risques associés sont nombreux. Les entreprises les plus prospères s'efforcent d'éliminer les erreurs et les biais en instaurant des directives de gouvernance IA et des bonnes pratiques robustes et adaptées.

L'exploitation optimale du Machine Learning

Marchez dans les pas des « entreprises surdouées » avec ces cinq enseignements.

Machine Learning : Forum Aux Questions (FAQ)

Le Machine Learning est un sous-ensemble de l'IA, qui ne pourrait pas exister sans elle. L'IA s'appuie sur les données pour prendre des décisions et émettre des prévisions : c'est le cerveau d'un système informatisé et c'est « l'intelligence » dont les machines font preuve. Les algorithmes de Machine Learning au sein de l'IA, ainsi que d'autres applications optimisées par l'IA, permettent au système non seulement de traiter ces données, mais aussi de les exploiter pour exécuter des tâches, émettre des prévisions, apprendre et devenir plus intelligent, sans avoir à recourir à une programmation additionnelle. Ils donnent une sorte de but à l'IA qui exploite cette intelligence et ces données.

Oui. Ceci dit, cet ajout doit s'inscrire dans le cadre d'une approche globale au niveau de l'entreprise, pas seulement dans le cadre d'une mise à niveau informatique. Les entreprises qui réussissent le mieux leur transformation digitale sont celles qui procèdent à une évaluation minutieuse de leurs ressources et compétences existantes pour s'assurer qu'elles possèdent des systèmes de base appropriés avant de se lancer.

La science des données est un sous-ensemble du Machine Learning : elle se concentre sur les statistiques et les algorithmes, elle utilise des techniques de régression et de classification, et elle interprète et communique les résultats.  Le Machine Learning, quant à lui, agit au niveau de la programmation, de l'automatisation, de l'évolutivité, de l'intégration et du stockage des résultats.

Le Machine Learning étudie les patterns et les corrélations. Il en tire des enseignements et s'adapte au fil du temps. L'exploration des données sert de source d'informations au Machine Learning. Les techniques d'exploration des données s'appuient elles-mêmes sur des algorithmes complexes. Elles peuvent fournir des ensembles de données mieux organisés qui serviront dans le cadre d'une application de Machine Learning.

Les neurones artificiels d'un réseau s'appellent des « nœuds », qui sont connectés et regroupés en couches. Lorsqu'un nœud reçoit un signal digital, il le transmet alors à d'autres neurones appropriés, qui fonctionnent en parallèle. L'apprentissage profond s'appuie sur le réseau de neurones artificiels. On dit qu'il est profond (« deep »), car il utilise d'énormes volumes de données et il interagit simultanément avec plusieurs couches du réseau de neurones artificiels. 

Le Machine Learning est la combinaison de plusieurs modèles, techniques et technologies d'apprentissage, dont les statistiques peuvent faire partie. Les statistiques en tant que telles utilisent les données pour émettre des prévisions et créer des modèles aux fins d'analyse.

Lettre d'information SAP Insights

S'abonner

Obtenez des insights clés en vous abonnant à notre newsletter.

Autres ressources

Haut de page