Zum Inhalt
Anwendung für maschinelles Lernen identifiziert Autos

Was ist maschinelles Lernen?

Maschinelles Lernen ist ein Teilbereich der künstlichen Intelligenz (KI). Der Schwerpunkt liegt auf dem Trainieren von Computern, damit diese aus Daten und Erfahrungen lernen und sich stetig verbessern – anstatt explizit dafür programmiert zu werden. Beim maschinellen Lernen werden Algorithmen darauf trainiert, Muster und Korrelationen in großen Datensätzen zu finden und auf Basis dieser Analyse die besten Entscheidungen und Vorhersagen zu treffen. Anwendungen für maschinelles Lernen verbessern sich mit ihrer Nutzung und werden umso genauer, je mehr Daten sie zur Verfügung haben. Sie befinden sich überall um uns herum – in unseren Haushalten, Warenkörben und Unterhaltungsmedien sowie in unserem Gesundheitswesen.

Maschinelles Lernen – und seine Deep-Learning-Komponenten sowie die neuronalen Netze – sind alles konzentrische Teilmengen von KI. KI verarbeitet Daten, um Entscheidungen und Prognosen zu treffen. Algorithmen für maschinelles Lernen ermöglichen der KI, diese Daten nicht nur zu verarbeiten. Sie verwenden sie, lernen dadurch dazu und werden intelligenter, ohne dass eine zusätzliche Programmierung erforderlich ist. Künstliche Intelligenz ist das übergeordnete Element aller darunterliegenden Teilmengen des maschinellen Lernens. Die erste Teilmenge umfasst maschinelles Lernen; darin enthalten ist Deep Learning und darin wiederum befinden sich die neuronalen Netze.

Was ist ein neuronales Netz?

 

Ein künstliches neuronales Netz ist den Neuronen in einem biologischen Gehirn nachempfunden. Künstliche Neuronen werden Knoten genannt und sind in mehreren Schichten gruppiert, die parallel arbeiten. Wenn ein künstliches Neuron ein numerisches Signal empfängt, verarbeitet es dieses und sendet Signale an die anderen mit ihm verbundenen Neuronen. Wie im menschlichen Gehirn führt die neuronale Verstärkung zu verbesserter Mustererkennung, Kompetenz und allgemeinem Lernen.

 

Was ist Deep Learning?

 

Diese Art von maschinellem Lernen wird als „Deep“ (tief) bezeichnet, da sie viele Schichten des neuronalen Netzes und riesige Mengen komplexer und unterschiedlicher Daten umfasst. Um Deep Learning zu ermöglichen, arbeitet das System mit mehreren Schichten im Netz zusammen und extrahiert zunehmend höherwertige Ausgaben. Beispielsweise wird ein Deep-Learning-System, das Naturbilder verarbeitet und nach rauhaarigen Rudbeckien sucht, in der ersten Schicht eine Pflanze erkennen. Während es sich durch die neuronalen Schichten bewegt, identifiziert es zunächst eine Blume, dann ein Gänseblümchen und schließlich eine rauhaarige Rudbeckie. Beispiele für Deep-Learning-Anwendungen sind Spracherkennung, Bildklassifizierung und pharmazeutische Analysen.

Maschinelles Lernen besteht aus verschiedenen Arten von maschinellen Lernmodellen, die verschiedene algorithmische Techniken verwenden. Abhängig von der Art der Daten und dem gewünschten Ergebnis kann eines von vier Lernmodellen genutzt werden: überwacht, unüberwacht, teilüberwacht oder bestärkend. Innerhalb jedes dieser Modelle können eine oder mehrere algorithmische Techniken angewendet werden – je nach den genutzten Datensätzen und den beabsichtigten Ergebnissen. Algorithmen des maschinellen Lernens sind grundsätzlich dafür ausgelegt, Dinge zu klassifizieren, Muster zu finden, Ergebnisse vorherzusagen und fundierte Entscheidungen zu treffen. Die Algorithmen können einzeln oder kombiniert eingesetzt werden, um bei komplexen und unvorhersehbaren Daten die bestmögliche Genauigkeit zu erzielen. 

Was ist überwachtes Lernen?

 

Überwachtes Lernen ist das erste von vier Modellen für maschinelles Lernen. In überwachten Lernalgorithmen lernt die Maschine anhand von Beispielen. Überwachte Lernmodelle bestehen aus „Input“- und „Output“-Datenpaaren. Dabei wird der Output, also die Ausgabe, mit dem gewünschten Wert bezeichnet. Angenommen, das Ziel besteht darin, dass die Maschine den Unterschied zwischen Gänseblümchen und Stiefmütterchen erkennt. Ein binäres Input-Datenpaar enthält sowohl ein Bild eines Gänseblümchens als auch ein Bild eines Stiefmütterchens. Das gewünschte Ergebnis für dieses bestimmte Paar ist das Gänseblümchen, sodass es bereits als das richtige Ergebnis identifiziert wird.

 

Über einen Algorithmus sammelt das System im Laufe der Zeit all diese Trainingsdaten und beginnt mit der Ermittlung korrelativer Ähnlichkeiten, Unterschiede und anderer Logikpunkte – bis es die Antworten auf Fragen zu Gänseblümchen und Stiefmütterchen selbst ermitteln kann. Das funktioniert in etwa so, als würde man einem Kind verschiedene Probleme mit einem zugehörigen Antwortschlüssel schildern und es dann bitten, seine Lösung der Probleme inklusive der zugrunde liegenden Logik zu erklären. Überwachte Lernmodelle werden in vielen Anwendungen verwendet, mit denen wir jeden Tag interagieren, beispielsweise Empfehlungsdienste für Produkte und Verkehrsanalyse-Apps wie Waze, die den schnellsten Weg zu verschiedenen Tageszeiten vorhersagen.

 

Was ist unüberwachtes Lernen?

 

Unüberwachtes Lernen ist das zweite der vier Modelle für maschinelles Lernen. In diesen Lernmodellen gibt es keinen Antwortschlüssel. Die Maschine untersucht die Eingabedaten – von denen viele unbeschriftet und unstrukturiert sind – und beginnt unter Verwendung aller relevanten, zugänglichen Daten mit der Erkennung von Mustern und Korrelationen. Unüberwachtes Lernen ist in vielerlei Hinsicht davon geprägt, wie Menschen die Welt betrachten. Wir nutzen Intuition und Erfahrung, um Dinge zusammenzufassen. Je mehr Beispiele wir von etwas erleben, desto genauer wird unsere Fähigkeit, es zu kategorisieren und zu identifizieren. Für Maschinen wird „Erfahrung“ durch die Menge an Daten definiert, die eingegeben und zur Verfügung gestellt werden. Gängige Beispiele für Anwendungen des unüberwachten Lernens sind Gesichtserkennung, Gensequenzanalyse, Marktforschung und Cybersicherheit.

 

Was ist teilüberwachtes Lernen?

 

Teilüberwachtes Lernen ist das dritte von vier Modellen für maschinelles Lernen. In einer perfekten Welt wären alle Daten strukturiert und beschriftet, bevor sie in ein System eingegeben werden. Da das natürlich nicht möglich ist, wird das teilüberwachte Lernen zu einer praktikablen Lösung, wenn riesige Mengen an Rohdaten und unstrukturierten Daten vorhanden sind. Dieses Modell besteht aus der Eingabe kleiner Mengen von beschrifteten Daten, um Datensets ohne Bezeichnung „aufzuwerten“. Im Wesentlichen dienen die beschrifteten Daten als Starthilfe für das System und können die Lerngeschwindigkeit und Genauigkeit erheblich verbessern. Ein teilüberwachter Lernalgorithmus weist die Maschine an, die beschrifteten Daten nach korrelativen Eigenschaften zu analysieren, die auf die unbeschrifteten Daten angewendet werden können.

 

Wie in diesem MIT Press Research Paper ausführlich untersucht wird, birgt dieses Modell jedoch Risiken, wenn Fehler in den beschrifteten Daten vom System erlernt und repliziert werden. Unternehmen, die teilüberwachtes Lernen am erfolgreichsten einsetzen, stellen sicher, dass Best-Practice-Protokolle implementiert sind. Teilüberwachtes Lernen wird verstärkt in Sprach- und linguistischen Analysen, in der komplexen medizinischen Forschung wie bei der Kategorisierung von Proteinen sowie bei der Betrugserkennung eingesetzt.

 

Was ist bestärkendes Lernen?

 

Bestärkendes Lernen ist das vierte der vier Modelle für maschinelles Lernen. Beim überwachten Lernen erhält die Maschine den Antwortschlüssel und lernt, indem sie Korrelationen zwischen allen richtigen Ergebnissen findet. Das Modell für bestärkendes Lernen enthält keinen Antwortschlüssel, sondern gibt eine Reihe von zulässigen Aktionen, Regeln und potenziellen Endzuständen vor. Wenn das gewünschte Ziel des Algorithmus fest oder binär ist, können Maschinen anhand von Beispielen lernen. In Fällen, in denen das gewünschte Ergebnis veränderbar ist, muss das System jedoch durch Erfahrung und Belohnung lernen. Bei den Modellen für bestärkendes Lernen ist die „Belohnung“ numerisch und in den Algorithmus als etwas programmiert, das das System „erfassen“ möchte.

 

In vielerlei Hinsicht ist dieses Modell vergleichbar damit, jemandem das Schachspielen beizubringen. Sicherlich wäre es unmöglich, jeden möglichen Schritt zu zeigen. Stattdessen erklären Sie die Regeln, und die Lernenden verbessern ihre Fähigkeiten durch Übung. Die Belohnung besteht nicht nur darin, das Spiel zu gewinnen, sondern auch die Figuren des Gegners zu erobern. Zu den Anwendungen für bestärkendes Lernen gehören automatisierte Preisangebote für Käufer von Online-Werbung, die Entwicklung von Computerspielen und der Börsenhandel mit hohen Einsätzen.

Algorithmen für maschinelles Lernen erkennen Muster und Korrelationen. Das bedeutet, dass sie bei der Analyse ihres eigenen ROI sehr gut sind. Unternehmen, die in Technologien für maschinelles Lernen investieren, können mit dieser Funktion die operativen Auswirkungen nahezu sofort bewerten. Nachfolgend finden Sie einen kleinen Ausschnitt aus den wachsenden Anwendungsbereichen von maschinellem Lernen in Unternehmen.

  • Empfehlungsdienste: Von 2009 bis 2017 ist die Zahl der US-Haushalte, die Video-Streaming-Dienste abonnierten, um 450 % gestiegen. Ein Artikel aus dem Jahr 2020 im Forbes Magazine berichtet von einem weiteren Anstieg der Video-Streaming-Nutzung von bis zu 70 %. Empfehlungs-Engines werden in Anwendungen auf vielen Einzelhandels- und Einkaufsplattformen eingesetzt, aber vorrangig kommen sie bei Streaming-Musik- und Video-Diensten ­zum Einsatz.
  • Dynamisches Marketing: Um Leads zu generieren und sie im gesamten Vertriebskanal zu nutzen, müssen so viele Kundendaten wie möglich gesammelt und analysiert werden. Moderne Konsumenten erzeugen riesige Mengen an vielfältigen und unstrukturierten Daten – von Chat-Transkripten bis hin zu hochgeladenen Bildern. Indem sie Anwendungen für maschinelles Lernen einsetzen, können Marketingexperten diese Daten verstehen und sie für personalisierte Marketinginhalte und Echtzeitinteraktionen mit Kunden und Leads nutzen.
  • ERP und Prozessautomatisierung: ERP-Datenbanken enthalten umfassende und verschiedenartige Datensätze, darunter Verkaufsleistungsstatistiken, Konsumentenbewertungen, Markttrendberichte und Datensätze zum Supply Chain Management. Mithilfe von Algorithmen für maschinelles Lernen können in solchen Daten Korrelationen und Muster erkannt werden. Diese Erkenntnisse können dann für praktisch jeden Bereich des Unternehmens genutzt werden, einschließlich der Workflow-Optimierung von IoT-Geräten (Internet of Things) im Netzwerk oder das Ermitteln der besten Möglichkeiten, sich wiederholende oder fehleranfällige Aufgaben zu automatisieren.
  • Vorausschauende Instandhaltung: Moderne Lieferketten und intelligente Fabriken nutzen zunehmend IoT-Geräte und ‑Maschinen sowie Cloud-Konnektivität in allen Bereichen und Abläufen. Ausfälle und Ineffizienzen können zu enormen Kosten und Unterbrechungen führen. Wenn Instandhaltungs- und Reparaturdaten manuell erfasst werden, ist es fast unmöglich, potenzielle Probleme vorherzusagen oder gar Prozesse zu automatisieren, um sie vorherzusagen und dann zu verhindern. IoT-Gateway-Sensoren können sogar an jahrzehntealte analoge Maschinen angeschlossen werden und sorgen für mehr Transparenz und Effizienz im gesamten Unternehmen.

„Nicht alle Korrelationen weisen auf einen zugrunde liegenden kausalen Zusammenhang hin“, so der Informatiker und Harvard-Absolvent Tyler Vigen in seinem Buch Spurious Correlations. Dies veranschaulicht eine Grafik in dem Buch, die einen scheinbar starken Zusammenhang zwischen dem Margarinekonsum und der Scheidungsrate im Bundesstaat Maine zeigt. Natürlich ist dieses Diagramm humorvoll gemeint. Ernster zu nehmen ist jedoch, dass Anwendungen des maschinellen Lernens sowohl für menschliche als auch für algorithmische Verzerrungen und Fehler anfällig sind. Aufgrund ihrer Lern- und Anpassungsfähigkeit können sich Fehler und falsche Korrelationen auch schnell ausbreiten und die Ergebnisse im gesamten neuronalen Netz verunreinigen.

 

Eine weitere Herausforderung stellen Modelle für maschinelles Lernen dar, bei denen der Algorithmus und sein Output so komplex sind, dass sie vom Menschen weder erklärt noch verstanden werden können. Dies wird als „Blackbox“-Modell bezeichnet. Es stellt für Unternehmen ein Risiko dar, wenn sie nicht feststellen können, wie und warum ein Algorithmus zu einem bestimmten Ergebnis oder einer bestimmten Schlussfolgerung oder Entscheidung gelangt ist.

 

Glücklicherweise nehmen mit der zunehmenden Komplexität von Datensätzen und Algorithmen für maschinelles Lernen auch die verfügbaren Werkzeuge und Ressourcen für das Risikomanagement zu. Die besten Unternehmen arbeiten daran, Fehler und Verzerrungen zu beseitigen, indem sie robuste und aktuelle KI-Governance-Richtlinien und Best-Practice-Protokolle erstellen.

FAQs zu maschinellem Lernen

Maschinelles Lernen ist eine Teilmenge von KI und kann ohne sie nicht existieren.  KI nutzt und verarbeitet Daten, um Entscheidungen und Vorhersagen zu treffen – es ist das Gehirn eines computerbasierten Systems und die „Intelligenz“, die von Maschinen genutzt wird. Mit den Algorithmen für maschinelles Lernen innerhalb der KI sowie anderen KI-gestützten Anwendungen kann das System diese Daten nicht nur verarbeiten, sondern auch verwenden, um Aufgaben auszuführen, Vorhersagen zu treffen, zu lernen und intelligenter zu werden, ohne dass zusätzliche Programmierung erforderlich ist. Sie vermitteln der KI ein Ziel, das mithilfe all dieser Intelligenz und Daten erreicht werden soll.

Ja, aber es sollte als unternehmensweites Projekt betrachtet werden, nicht nur als IT-Upgrade. Die Unternehmen, die mit Projekten zur digitalen Transformation die besten Ergebnisse erzielen, führen eine umfassende Bewertung ihrer vorhandenen Ressourcen und Fähigkeiten durch und gewährleisten, dass sie die richtigen zugrunde liegenden Systeme besitzen, bevor sie mit dem Projekt beginnen.

Bezogen auf das maschinelle Lernen ist Data Science eine Teilmenge. Sie konzentriert sich auf Statistiken und Algorithmen, verwendet Regressions- und Klassifizierungstechniken und interpretiert und kommuniziert Ergebnisse.  Der Schwerpunkt des maschinelles Lernens liegt auf Programmierung, Automatisierung, Skalierung sowie Implementierung und Aufbewahrung der Ergebnisse.

Maschinelles Lernen betrachtet Muster und Zusammenhänge, lernt von ihnen und optimiert sich selbst. Data-Mining dient als Informationsquelle für maschinelles Lernen. Data-Mining-Verfahren verwenden selbst komplexe Algorithmen. Sie können helfen, der Anwendung für maschinelles Lernen besser organisierte Datensätze bereitzustellen.

Die angeschlossenen Neuronen bei einem künstlichen neuronalen Netz werden als Knoten bezeichnet, die miteinander verbunden und in Schichten gruppiert sind. Empfängt ein Knoten ein numerisches Signal, sendet er Signale an andere relevante Neuronen, die parallel arbeiten. Deep Learning nutzt das neuronale Netz und ist „tief“, weil es sehr große Datenmengen verwendet und mit mehreren Schichten im neuronalen Netz gleichzeitig interagiert. 

Maschinelles Lernen ist die Verschmelzung mehrerer Lernmodelle, ‑techniken und ‑technologien, die auch Statistiken beinhalten können. Die Statistik selbst konzentriert sich auf die Verwendung von Daten, um Vorhersagen zu treffen und Modelle für die Analyse zu erstellen.

Zum Seitenanfang