Wat is supervised learning?
Supervised learning (gecontroleerd leren) is het eerste van vier modellen voor machine learning. In algoritmen voor supervised learning leert de machine op basis van voorbeelden. Modellen voor supervised learning bestaan uit "input"- en "output"-dataparen, waarbij de output wordt gelabeld met de gewenste waarde. Het doel van de computer is bijvoorbeeld om te vertellen wat het verschil is tussen madeliefjes en viooltjes. Eén binair inputdatapaar bevat zowel een afbeelding van een madeliefje als een afbeelding van een viooltje. Het gewenste resultaat voor dat specifieke paar is het kiezen van het madeliefje, dus dat wordt vooraf geïdentificeerd als het juiste resultaat.
Door middel van een algoritme verzamelt het systeem al deze trainingsdata gedurende een periode en begint het overeenkomsten, verschillen en andere punten van logica te bepalen, totdat het de antwoorden op madeliefje-of-viooltje-vragen zelf kan voorspellen. Het is vergelijkbaar met een kind aan wie een reeks problemen wordt voorgelegd met een antwoordsleutel en aan wie vervolgens wordt gevraagd zijn werk te tonen en de logica erbij toe te lichten. Modellen voor supervised learning worden ingezet in veel applicaties die we elke dag gebruiken, zoals aanbevelingsengines voor producten en verkeersanalyseapps zoals Waze, die de snelste route op verschillende tijdstippen voorspellen.
Wat is unsupervised learning?
Unsupervised learning (ongecontroleerd leren) is het tweede van vier modellen voor machine learning. Modellen voor unsupervised learning hebben geen antwoordsleutel. De computer bestudeert de inputdata, waarvan een groot deel ongelabeld en ongestructureerd is, en begint patronen en overeenkomsten te identificeren met behulp van alle relevante, toegankelijke data. Unsupervised learning wordt eigenlijk gemodelleerd naar hoe mensen de wereld waarnemen. We gebruiken intuïtie en ervaring om dingen te groeperen. Naarmate we steeds meer voorbeelden van iets ervaren, wordt ons vermogen om iets te categoriseren en te identificeren steeds nauwkeuriger. Voor computers wordt "ervaring" gedefinieerd op basis van de hoeveelheid data die wordt ingevoerd en beschikbaar wordt gesteld. Voorbeelden van applicaties voor unsupervised learning zijn gezichtsherkenning, gensequentieanalyses, marktonderzoek en cybersecurity.
Wat is semi-supervised learning?
Semi-supervised learning is het derde van vier modellen voor machine learning. In een perfecte wereld zouden alle data worden gestructureerd en gelabeld voordat ze in een systeem worden ingevoerd. Maar aangezien dat natuurlijk niet haalbaar is, wordt semi-supervised learning een werkbare oplossing wanneer er sprake is van enorme hoeveelheden ruwe, ongestructureerde data. Dit model bestaat uit het invoeren van kleine hoeveelheden gelabelde data om ongelabelde datasets uit te breiden. In wezen zorgen de gelabelde data voor een goede start en ze kunnen de leersnelheid en nauwkeurigheid aanzienlijk verbeteren. Een algoritme voor semi-supervised learning instrueert de computer om de gelabelde data te analyseren op overeenkomsten die kunnen worden toegepast op ongelabelde data.
Zoals in dit onderzoeksrapport van MIT Press uitvoerig werd onderzocht, zijn er echter risico's verbonden aan dit model. De gelabelde data kunnen namelijk fouten bevatten, die vervolgens door het systeem worden geleerd en gerepliceerd. Bedrijven die het meest succesvol zijn in het gebruik van semi-supervised learning hanteren protocollen voor best practices. Semi-supervised learning wordt gebruikt in spraak- en taalanalyses, complex medisch onderzoek zoals eiwitclassificatie en hoogwaardige fraudedetectie.
Wat is reinforcement learning?
Reinforcement learning is het vierde model voor machine learning. In supervised learning ontvangt de computer een antwoordsleutel. Vervolgens leert hij door overeenkomsten te vinden tussen alle juiste resultaten. Het model voor reinforcement learning heeft geen antwoordsleutel, maar voert een reeks toegestane acties, regels en potentiële eindstatussen in. Wanneer het gewenste doel van het algoritme vast of binair is, kunnen computers leren op basis van voorbeelden. Maar in gevallen waarin het gewenste resultaat veranderlijk is, moet het systeem leren door middel van ervaring en beloning. In modellen voor reinforcement learning is de "beloning" numeriek en deze wordt in het algoritme geprogrammeerd als iets wat het systeem wil verzamelen.
Dit model is in veel opzichten vergelijkbaar met iemand leren schaken. Het is onmogelijk om alle potentiële zetten te laten zien. In plaats daarvan legt u de regels uit en leert de ander het spel door de regels toe te passen in de praktijk. De beloning is niet alleen het winnen van het spel, maar ook het verkrijgen van de stukken van de tegenstander. Toepassingen van reinforcement learning zijn bijvoorbeeld automatische prijsbiedingen voor kopers van online reclame, ontwikkeling van computergames en beurshandel met hoge inzet.