Naar inhoud gaan
Machine learning identificeert auto's

Wat is machine learning?

Hoe zijn machine learning en AI met elkaar verbonden?

Machine learning – en deep learning en neurale netwerken – zijn allemaal subsets van AI. AI verwerkt data om beslissingen te nemen en voorspellingen te doen. Algoritmen voor machine learning zorgen ervoor dat AI die data niet alleen verwerkt, maar er ook van leert en er slimmer door wordt, zonder dat er extra programmeerwerk nodig is. Artificial intelligence is de moeder van alle machinelearningsubsets. Machine learning bevindt zich in de eerste subset; daarbinnen zit deep learning en daarbinnen bevinden zich weer de neurale netwerken.

Diagram van de relatie tussen AI en machine learning

Diagram van AI vs. machine learning

Wat is een neuraal netwerk?

 

Een kunstmatig neuraal netwerk (artificial neural network - ANN) is gemodelleerd naar de neuronen in een biologisch brein. Kunstmatige neuronen worden knooppunten genoemd en zijn gegroepeerd in meerdere lagen, die parallel werken. Als een kunstmatig neuron een numeriek signaal ontvangt, verwerkt het dit signaal en geeft het een seintje aan de andere neuronen die ermee verbonden zijn. Net als in een menselijk brein leidt neurale versterking tot een verbeterde patroonherkenning, meer expertise en betere algemene leervaardigheden.

 

Wat is deep learning?

 

Dit type machine learning wordt "diep" genoemd, omdat er veel verschillende lagen van het neurale netwerk en enorme hoeveelheden complexe en versnipperde data bij betrokken zijn. Deep learning kan worden bereikt doordat het systeem met meerdere lagen in het netwerk werkt en steeds geavanceerdere output gebruikt. Neem bijvoorbeeld een systeem voor deep learning dat natuurbeelden verwerkt en zoekt naar Gloriosa-madeliefjes. In de eerste laag herkent het een plant. Maar als het systeem verder door de neurale lagen beweegt, identificeert het een bloem, dan een madelief en ten slotte een Gloriosa-madelief. Voorbeelden van applicaties op het gebied van deep learning zijn spraakherkenning, beeldclassificatie en farmaceutische analyse.

Hoe werkt machine learning?

Machine learning bestaat uit verschillende soorten modellen voor machine learning, waarbij verschillende algoritmische technieken worden gebruikt. Afhankelijk van de aard van de data en het gewenste resultaat kan een van de vier leermodellen worden gebruikt: supervised learning, unsupervised learning, semi-supervised learning of reinforcement learning. Binnen elk van deze modellen kunnen een of meer algoritmische technieken worden toegepast, afhankelijk van de gebruikte datasets en de beoogde resultaten. Algoritmen voor machine learning zijn in principe ontworpen om zaken te classificeren, patronen te vinden, resultaten te voorspellen en weloverwogen beslissingen te nemen. Algoritmen kunnen zowel één voor één als gecombineerd worden gebruikt voor een zo groot mogelijke nauwkeurigheid wanneer er sprake is van complexere en onvoorspelbare data. 

Hoe het proces van machine learning werkt

Schematische weergave van hoe machine learning werkt

Wat is supervised learning?

 

Supervised learning (gecontroleerd leren) is het eerste van vier modellen voor machine learning. In algoritmen voor supervised learning leert de machine op basis van voorbeelden. Modellen voor supervised learning bestaan uit "input"- en "output"-dataparen, waarbij de output wordt gelabeld met de gewenste waarde. Het doel van de computer is bijvoorbeeld om te vertellen wat het verschil is tussen madeliefjes en viooltjes. Eén binair inputdatapaar bevat zowel een afbeelding van een madeliefje als een afbeelding van een viooltje. Het gewenste resultaat voor dat specifieke paar is het kiezen van het madeliefje, dus dat wordt vooraf geïdentificeerd als het juiste resultaat.

 

Door middel van een algoritme verzamelt het systeem al deze trainingsdata gedurende een periode en begint het overeenkomsten, verschillen en andere punten van logica te bepalen, totdat het de antwoorden op madeliefje-of-viooltje-vragen zelf kan voorspellen. Het is vergelijkbaar met een kind aan wie een reeks problemen wordt voorgelegd met een antwoordsleutel en aan wie vervolgens wordt gevraagd zijn werk te tonen en de logica erbij toe te lichten. Modellen voor supervised learning worden ingezet in veel applicaties die we elke dag gebruiken, zoals aanbevelingsengines voor producten en verkeersanalyseapps zoals Waze, die de snelste route op verschillende tijdstippen voorspellen.

 

Wat is unsupervised learning?

 

Unsupervised learning (ongecontroleerd leren) is het tweede van vier modellen voor machine learning. Modellen voor unsupervised learning hebben geen antwoordsleutel. De computer bestudeert de inputdata, waarvan een groot deel ongelabeld en ongestructureerd is, en begint patronen en overeenkomsten te identificeren met behulp van alle relevante, toegankelijke data. Unsupervised learning wordt eigenlijk gemodelleerd naar hoe mensen de wereld waarnemen. We gebruiken intuïtie en ervaring om dingen te groeperen. Naarmate we steeds meer voorbeelden van iets ervaren, wordt ons vermogen om iets te categoriseren en te identificeren steeds nauwkeuriger. Voor computers wordt "ervaring" gedefinieerd op basis van de hoeveelheid data die wordt ingevoerd en beschikbaar wordt gesteld. Voorbeelden van applicaties voor unsupervised learning zijn gezichtsherkenning, gensequentieanalyses, marktonderzoek en cybersecurity.

 

Wat is semi-supervised learning?

 

Semi-supervised learning is het derde van vier modellen voor machine learning. In een perfecte wereld zouden alle data worden gestructureerd en gelabeld voordat ze in een systeem worden ingevoerd. Maar aangezien dat natuurlijk niet haalbaar is, wordt semi-supervised learning een werkbare oplossing wanneer er sprake is van enorme hoeveelheden ruwe, ongestructureerde data. Dit model bestaat uit het invoeren van kleine hoeveelheden gelabelde data om ongelabelde datasets uit te breiden. In wezen zorgen de gelabelde data voor een goede start en ze kunnen de leersnelheid en nauwkeurigheid aanzienlijk verbeteren. Een algoritme voor semi-supervised learning instrueert de computer om de gelabelde data te analyseren op overeenkomsten die kunnen worden toegepast op ongelabelde data.

 

Zoals in dit onderzoeksrapport van MIT Press uitvoerig werd onderzocht, zijn er echter risico's verbonden aan dit model. De gelabelde data kunnen namelijk fouten bevatten, die vervolgens door het systeem worden geleerd en gerepliceerd. Bedrijven die het meest succesvol zijn in het gebruik van semi-supervised learning hanteren protocollen voor best practices. Semi-supervised learning wordt gebruikt in spraak- en taalanalyses, complex medisch onderzoek zoals eiwitclassificatie en hoogwaardige fraudedetectie.

 

Wat is reinforcement learning?

 

Reinforcement learning is het vierde model voor machine learning. In supervised learning ontvangt de computer een antwoordsleutel. Vervolgens leert hij door overeenkomsten te vinden tussen alle juiste resultaten. Het model voor reinforcement learning heeft geen antwoordsleutel, maar voert een reeks toegestane acties, regels en potentiële eindstatussen in. Wanneer het gewenste doel van het algoritme vast of binair is, kunnen computers leren op basis van voorbeelden. Maar in gevallen waarin het gewenste resultaat veranderlijk is, moet het systeem leren door middel van ervaring en beloning. In modellen voor reinforcement learning is de "beloning" numeriek en deze wordt in het algoritme geprogrammeerd als iets wat het systeem wil verzamelen.

 

Dit model is in veel opzichten vergelijkbaar met iemand leren schaken. Het is onmogelijk om alle potentiële zetten te laten zien. In plaats daarvan legt u de regels uit en leert de ander het spel door de regels toe te passen in de praktijk. De beloning is niet alleen het winnen van het spel, maar ook het verkrijgen van de stukken van de tegenstander. Toepassingen van reinforcement learning zijn bijvoorbeeld automatische prijsbiedingen voor kopers van online reclame, ontwikkeling van computergames en beurshandel met hoge inzet.

Begin vandaag nog

Zie intelligente technologieën van SAP - met AI en machine learning - in actie.

Enterprise machine learning in actie

Algoritmen voor machine learning herkennen patronen en overeenkomsten. Dat wil zeggen dat ze ook erg goed hun eigen rendement kunnen analyseren. Voor bedrijven die investeren in technologieën voor machine learning, betekent dit dat de operationele impact bijna direct kan worden beoordeeld. Hieronder vindt u een kleine greep uit de groeiende gebieden van applicaties voor enterprise machine learning.

  • Aanbevelingsengines: tussen 2009 en 2017 is het aantal Amerikaanse huishoudens dat is geabonneerd op videostreamingdiensten gestegen met 450%. En een artikel uit 2020 in het tijdschrift Forbes meldt een verdere piek in videostreaminggebruik tot wel 70%. Aanbevelingsengines hebben toepassingen in diverse retail- en winkelplatforms, maar ze komen vooral tot hun recht bij streamingdiensten voor muziek en ­video.
  • Dynamische marketing: om leads te genereren en ze door de salestrechter te leiden, moeten er zo veel mogelijk klantdata worden verzameld en geanalyseerd. Moderne klanten genereren een enorme hoeveelheid gevarieerde en ongestructureerde data, van chatverslagen tot uploads van afbeeldingen. Het gebruik van machine learning helpt marketeers deze data te begrijpen en te gebruiken om gepersonaliseerde marketingcontent en realtime interacties met klanten en leads te leveren.
  • ERP en procesautomatisering: ERP-databases bevatten uitgebreide en versnipperde datasets, waaronder salesprestatiestatistieken, consumentenbeoordelingen, markttrendrapporten en records over supply chain management. Algoritmen voor machine learning kunnen worden gebruikt om overeenkomsten en patronen in dergelijke data te vinden. Met deze inzichten kan vervolgens vrijwel elk bedrijfsonderdeel worden geïnformeerd, waaronder het optimaliseren van workflows voor IoT-apparaten (Internet of Things) binnen het netwerk of de beste manieren om herhalende of foutgevoelige taken te automatiseren.
  • Voorspellend onderhoud: moderne supply chains en slimme fabrieken maken steeds vaker gebruik van IoT-apparaten en -machines, evenals cloudconnectiviteit in al hun wagenparken, vloten en activiteiten. Defecten en inefficiënties kunnen resulteren in hoge kosten en verstoringen. Als onderhouds- en reparatiedata handmatig worden verzameld, is het bijna onmogelijk om potentiële problemen te voorspellen; laat staan om processen te automatiseren om de problemen te voorspellen en te voorkomen. IoT-gatewaysensoren kunnen zelfs op analoge machines van tientallen jaren oud worden toegepast, met als resultaat meer zichtbaarheid en efficiëntie in het hele bedrijf.

De uitdagingen van machine learning

In zijn boek Spurious Correlations schrijft Tyler Vigan, datawetenschapper en afgestudeerd aan Harvard, dat "niet alle correlaties wijzen op een onderliggende causale relatie". Om dit te illustreren, laat hij een diagram zien met een schijnbaar sterke samenhang tussen de consumptie van margarine en het aantal echtscheidingen in de staat Maine. Dit is natuurlijk humoristisch bedoeld. Maar de waarheid is wel dat applicaties voor machine learning kwetsbaar zijn voor zowel menselijke als algoritmische vooroordelen en fouten. En door de neiging om te leren en zich aan te passen, kunnen fouten en valse correlaties snel resultaten verspreiden en het neurale netwerk daarmee vervuilen.

 

Een extra uitdaging komt van modellen voor machine learning, waarvan het algoritme en de output zo complex zijn dat ze niet door mensen kunnen worden uitgelegd of begrepen. Dit wordt een "zwarte doos"-model genoemd. Het brengt risico's met zich mee voor bedrijven als ze niet kunnen bepalen hoe en waarom een algoritme tot een bepaalde conclusie of beslissing is gekomen.

 

Maar naarmate de complexiteit van datasets en algoritmen voor machine learning toeneemt, worden gelukkig ook de beschikbare tools en resources voor risicobeheer steeds geavanceerder. De beste bedrijven werken aan het elimineren van fouten en vooroordelen door krachtige, up-to-date richtlijnen voor AI-beheer en protocollen voor best practices op te stellen.

Het maximale uit machine learning halen

Treed in de voetsporen van "snelle leerlingen" met deze vijf lessen.

Veelgestelde vragen over machine learning

Machine learning is een subset van AI en kan niet bestaan zonder AI. AI gebruikt en verwerkt data om beslissingen te nemen en voorspellingen te doen. Het is het brein van een computergebaseerd systeem en de "intelligentie" die door machines wordt tentoongesteld. Algoritmen voor machine learning binnen AI, evenals andere door AI aangedreven apps, zorgen ervoor dat het systeem die data niet alleen kan verwerken, maar er ook door in staat is taken uit te voeren, voorspellingen te doen, te leren en slimmer te worden, zonder extra programmeerwerk. Ze geven AI een doel voor die intelligentie en data.

Ja, maar het moet worden gezien als iets dat impact heeft op de hele onderneming, niet alleen als een IT-upgrade. De bedrijven die de beste resultaten hebben geboekt met digitale transformatie, beoordelen hun bestaande resources en vaardigheden en zorgen ervoor dat ze de juiste basissystemen hebben voordat ze van start gaan.

Data science is een subset van machine learning; het richt zich op statistieken en algoritmen, gebruikt regressie- en classificatietechnieken en interpreteert en communiceert resultaten.   Machine learning is gericht op het programmeren, automatiseren, schalen en integreren en opslaan van resultaten.

Machine learning kijkt naar patronen en samenhang, leert ervan en optimaliseert zichzelf gedurende het proces. Datamining wordt gebruikt als informatiebron voor machine learning. Dataminingtechnieken gebruiken zelf complexe algoritmen en kunnen helpen om beter georganiseerde datasets te leveren voor de machinelearningapplicatie.

De verbonden neuronen met een kunstmatig neuraal netwerk worden knooppunten genoemd. Deze zijn verbonden en gegroepeerd in lagen. Als een knooppunt een numeriek signaal ontvangt, geeft het andere relevante neuronen, die parallel werken, een seintje. Deep learning maakt gebruik van het neurale netwerk en is "diep" omdat het zeer grote hoeveelheden data gebruikt en tegelijkertijd met meerdere lagen in het neurale netwerk werkt. 

Machine learning is een combinatie van verschillende leermodellen, -technieken en -technologieën, waaronder statistiek. Statistiek zelf richt zich op het gebruik van data om voorspellingen te doen en analysemodellen te ontwikkelen.

SAP Insights nieuwsbrief

Nu aanmelden

Meld u aan voor onze nieuwsbrief en krijg belangrijke inzichten.

Meer lezen

Terug naar boven