Was ist überwachtes Lernen?
Überwachtes Lernen ist das erste von vier Modellen für maschinelles Lernen. In überwachten Lernalgorithmen lernt die Maschine anhand von Beispielen. Überwachte Lernmodelle bestehen aus „Input“- und „Output“-Datenpaaren. Dabei wird der Output, also die Ausgabe, mit dem gewünschten Wert bezeichnet. Angenommen, das Ziel besteht darin, dass die Maschine den Unterschied zwischen Gänseblümchen und Stiefmütterchen erkennt. Ein binäres Input-Datenpaar enthält sowohl ein Bild eines Gänseblümchens als auch ein Bild eines Stiefmütterchens. Das gewünschte Ergebnis für dieses bestimmte Paar ist das Gänseblümchen, sodass es bereits als das richtige Ergebnis identifiziert wird.
Über einen Algorithmus sammelt das System im Laufe der Zeit all diese Trainingsdaten und beginnt mit der Ermittlung korrelativer Ähnlichkeiten, Unterschiede und anderer Logikpunkte – bis es die Antworten auf Fragen zu Gänseblümchen und Stiefmütterchen selbst ermitteln kann. Das funktioniert in etwa so, als würde man einem Kind verschiedene Probleme mit einem zugehörigen Antwortschlüssel schildern und es dann bitten, seine Lösung der Probleme inklusive der zugrunde liegenden Logik zu erklären. Überwachte Lernmodelle werden in vielen Anwendungen verwendet, mit denen wir jeden Tag interagieren, beispielsweise Empfehlungsdienste für Produkte und Verkehrsanalyse-Apps wie Waze, die den schnellsten Weg zu verschiedenen Tageszeiten vorhersagen.
Was ist unüberwachtes Lernen?
Unüberwachtes Lernen ist das zweite der vier Modelle für maschinelles Lernen. In diesen Lernmodellen gibt es keinen Antwortschlüssel. Die Maschine untersucht die Eingabedaten – von denen viele unbeschriftet und unstrukturiert sind – und beginnt unter Verwendung aller relevanten, zugänglichen Daten mit der Erkennung von Mustern und Korrelationen. Unüberwachtes Lernen ist in vielerlei Hinsicht davon geprägt, wie Menschen die Welt betrachten. Wir nutzen Intuition und Erfahrung, um Dinge zusammenzufassen. Je mehr Beispiele wir von etwas erleben, desto genauer wird unsere Fähigkeit, es zu kategorisieren und zu identifizieren. Für Maschinen wird „Erfahrung“ durch die Menge an Daten definiert, die eingegeben und zur Verfügung gestellt werden. Gängige Beispiele für Anwendungen des unüberwachten Lernens sind Gesichtserkennung, Gensequenzanalyse, Marktforschung und Cybersicherheit.
Was ist teilüberwachtes Lernen?
Teilüberwachtes Lernen ist das dritte von vier Modellen für maschinelles Lernen. In einer perfekten Welt wären alle Daten strukturiert und beschriftet, bevor sie in ein System eingegeben werden. Da das natürlich nicht möglich ist, wird das teilüberwachte Lernen zu einer praktikablen Lösung, wenn riesige Mengen an Rohdaten und unstrukturierten Daten vorhanden sind. Dieses Modell besteht aus der Eingabe kleiner Mengen von beschrifteten Daten, um Datensets ohne Bezeichnung „aufzuwerten“. Im Wesentlichen dienen die beschrifteten Daten als Starthilfe für das System und können die Lerngeschwindigkeit und Genauigkeit erheblich verbessern. Ein teilüberwachter Lernalgorithmus weist die Maschine an, die beschrifteten Daten nach korrelativen Eigenschaften zu analysieren, die auf die unbeschrifteten Daten angewendet werden können.
Wie in diesem MIT Press Research Paper ausführlich untersucht wird, birgt dieses Modell jedoch Risiken, wenn Fehler in den beschrifteten Daten vom System erlernt und repliziert werden. Unternehmen, die teilüberwachtes Lernen am erfolgreichsten einsetzen, stellen sicher, dass Best-Practice-Protokolle implementiert sind. Teilüberwachtes Lernen wird verstärkt in Sprach- und linguistischen Analysen, in der komplexen medizinischen Forschung wie bei der Kategorisierung von Proteinen sowie bei der Betrugserkennung eingesetzt.
Was ist bestärkendes Lernen?
Bestärkendes Lernen ist das vierte der vier Modelle für maschinelles Lernen. Beim überwachten Lernen erhält die Maschine den Antwortschlüssel und lernt, indem sie Korrelationen zwischen allen richtigen Ergebnissen findet. Das Modell für bestärkendes Lernen enthält keinen Antwortschlüssel, sondern gibt eine Reihe von zulässigen Aktionen, Regeln und potenziellen Endzuständen vor. Wenn das gewünschte Ziel des Algorithmus fest oder binär ist, können Maschinen anhand von Beispielen lernen. In Fällen, in denen das gewünschte Ergebnis veränderbar ist, muss das System jedoch durch Erfahrung und Belohnung lernen. Bei den Modellen für bestärkendes Lernen ist die „Belohnung“ numerisch und in den Algorithmus als etwas programmiert, das das System „erfassen“ möchte.
In vielerlei Hinsicht ist dieses Modell vergleichbar damit, jemandem das Schachspielen beizubringen. Sicherlich wäre es unmöglich, jeden möglichen Schritt zu zeigen. Stattdessen erklären Sie die Regeln, und die Lernenden verbessern ihre Fähigkeiten durch Übung. Die Belohnung besteht nicht nur darin, das Spiel zu gewinnen, sondern auch die Figuren des Gegners zu erobern. Zu den Anwendungen für bestärkendes Lernen gehören automatisierte Preisangebote für Käufer von Online-Werbung, die Entwicklung von Computerspielen und der Börsenhandel mit hohen Einsätzen.