Wie funktioniert Maschinelles Lernen?
Math, science, history, unraveling the mysteries – That all start with the big ba… ehm data! Big Data!
Big Data ist DER Trend der letzten Jahre und eine Erfolgsstory jagt die andere und einfach jeder will dabei sein. Über die Technologie des Machine Learnings, ohne das der Hype nicht machbar wäre, ist allerdings überraschend wenig bekannt. Wie wird aus Daten Wissen und welche Methoden kommen hier zum Einsatz? Werfen wir einen Blick hinter das Szenario und schauen uns die Vorgänge im Hintergrund mal genauer an.
Laienhaft formuliert ist Big Data eigentlich nichts Anderes als das Anwenden maschineller Lernverfahren. Und dieses maschinelle Lernverfahren, also das Machine Learning, benötigt Daten, um daraus neues Wissen ableiten zu können – und zwar viele Daten, sehr große Mengen an Daten.
Wenn aus Daten Wissen wird
Der ganze Vorgang der Wissensgewinnung und -erweiterung ist als mehrstufiger Prozess zu verstehen, der einerseits die Transition oder andererseits den kognitiven Hintergrund wiedergibt.
Schön und gut; aber was soll das jetzt bedeuten?
1. Vom Symbol zum Inhalt
Alles beginnt mit einem Symbol. Dabei kann es sich um eine Zahl, einen Buchstaben, ein Bild oder Ähnliches handeln.
Nehmen wir das Symbol »4«.
Was soll Ihnen das jetzt bringen? Als reines Symbol betrachtet, bringt Ihnen die 4 gar nichts. Deshalb ist der erste Prozess im kognitiven Hintergrund dem Symbol, also der 4, einen Inhalt zuzuweisen. Wir sehen 4 und wissen, dass dieses Symbol den Wert 4 hat. Wir haben eine innere Ordnung hergestellt.
2. Vom Individuum zur Gruppe
Doch ein Symbol kommt selten allein, sondern tauchen zwischen etlichen weiteren auf. So z.B. unsere »4« aus dem ersten Schritt; diese 4 ist ein einzelnes Symbol in der Kombination mit 3 weiteren:
Die Symbole als Ganzes betrachtet scheinen nun eine Zahl anzugeben. Doch ist es ein eine Längenangabe, ein Rechenergebnis, ein Preis, ein Sitzplatz? Was bringen uns nun die Kombinationen aus einzelnen Symbolen? Um das herauszufinden müssen wir weitere Schritte gehen und die Kombination abstrahieren.
3. Von Daten zu Informationen
Um die Symbolkombination also verstehen zu können, geht man im nächsten Schritt nun auf die Bedeutungsebene. Hier betrachtet man den Kontext, in dem die Kombination auftritt.
Stellen wir uns vor, dass vor den Zahlen das Eurozeichen angegeben ist. Dann erschließen bzw. wissen wir, dass die Kombination als Preis zu definieren ist.
Aus der Symbolkombination ist eine Information geworden.
4. Von der Information zum Wissen
Aber auch jetzt können wir damit nicht wirklich was anfangen; denn auch die eine isolierte Information ist von nur geringem Nutzen. Die Nützlichkeit der Information kann erst verstanden werden, wenn man sie in Relation zu anderen Informationen setzt.
Liegt der Preis beispielsweise für gewöhnlich bei 50,00€, können wir also sagen, dass die 45,91€ aktuell günstig sind.
5. Vom Wissen zur Aktion
Einzelne Informationen werden erst dann zu Wissen, wenn man Sie mit weiteren Daten in diesem Zusammenhang verknüpft, verbindet und verarbeitet. So kann dieses neu gewonnene Wissen gewinnbringend angewendet werden. Ein regelbasiertes System könnte beispielsweise auf Basis des aktuell günstigen Preises und weiterer passender Rahmenbedingungen einen Kauf veranlassen.
Und in der Praxis?
In der täglichen Praxis ist die Syntax der zu analysierenden Symbole meistens schon bekannt. Der Wissensgewinnungsprozess startet daher bereits auf der Ebene der Daten. Das Ziel maschineller Lernverfahren ist also, aus Daten den maximalen Anteil an Informationen zu gewinnen und diese weiter zu Wissen zu verarbeiten. Auf diese Weise werden riesige Mengen an Rohdaten zu kompaktem, wettbewerbsvorteilhaftem Wissen bereitgestellt.
Auf diese Weise erhalten Unternehmen durch den Einsatz von Maschinellem Lernen Einblick in bisher unbekannte Zusammenhänge und Muster in ihren Daten.
Im Kern geht es beim maschinellen Lernen also um Wissensgewinnung und die verschiedenen Aufgaben, die daraus erwachsen. Werden beispielsweise die Zustände eines Prozesses über einen längeren Zeitraum erfasst, können die gewonnenen Muster genutzt werden, um den Prozess zu optimieren und Wettbewerbsvorteile zu erzielen. Da die Methoden des maschinellen Lernens per se generisch sind, ist ihre Anwendung in einem sehr weiten Kontext möglich – vorausgesetzt eine entsprechende Datenbasis liegt bereits vor oder kann erfasst werden.