Die Geheimnisse einer KI
Welche Voraussetzungen benötigt ein Unternehmen, um eine KI in die eigene Wertschöpfungskette zu integrieren?
Künstliche Intelligenz: Ein Begriff, bei dem heute sofort jeder ein Bild von einer futuristischen Welt im Kopf hat. Ebenso sind medienwirksame Buzzwords wie Data Driven Marketing, Blockchain, Big Data und Data Science derzeit absolut im Trend. Unternehmen können Big Data-Methoden anwenden, um sich einen Wettbewerbsvorteil zu sichern. Dieser Artikel gibt einen groben Überblick.
Die drei Komponenten einer KI
KI besteht aus drei Bereichen: Einmal aus der klassischen Statistik. Die kennen wir noch aus der Schule, beispielsweise der Mittelwertsberechnung. Hinter allen Methoden der Künstlichen Intelligenz stecken viele mathematischen Modelle, welche dazu genutzt werden, Beziehungen zwischen den vorhandenen Datenpunkten zu ermitteln.
Der zweite große Bereich ist das Machine Learning. Es meint, dass einem IT-System beigebracht wird, bestimmte Muster in Datensätzen zu erkennen. Dahinter verstecken sich verschiedene Verfahren; ein Beispiel ist hier das sog. Clustering, also das Bilden von Gruppen innerhalb des gesamten Datensatzes, was auch als datengetriebene Segmentierung bezeichnet wird. Grob wird unterschieden zwischen dem supervised Learning und dem unsupervised Learning.
- Bei ersterem wird der Datensatz aufgeteilt, sodass ein Anteil (etwa 70 %) zum Anlernen des IT-Systems verwendet wird. Zum Anlernen muss der Datensatz mit Label vorliegen, sodass das System die Information hat: „auf diesem Bild ist ein Haus abgebildet“ oder „diese Ziffer ist eine 3“. Durch das Einspeisen dieses Trainings-Datensatzes wird das sog. Modell entwickelt, welches dann am verbleibenden Anteil (die restlichen 30 %[1]) getestet wird.
- Das unsupervised Learning funktioniert völlig anders. Dabei erhält die KI keinerlei Informationen über die Datenpunkte und muss sich die Beziehungen zwischen ihnen selbst herstellen. Das geschieht durch mathematische Modelle wie das k-nearest-neighbor Hat man beispielsweise Dutzende Punkte in einem Koordinatensystem, so berechnet das Modell zu einem Punkt den Abstand zu jedem anderen Punkt im Koordinatensystem – über den Satz des Pythagoras. Diese Berechnung wird für jeden Punkt durchgeführt. Somit weiß das IT-System am Ende, welche Punkte am nächsten beisammen liegen und kann Cluster bilden. Eine Anwendung solcher Cluster ist beispielsweise das Ermitteln von typischen Kundensegmenten aus einem gesamten Datensatz von Kundendaten (Auftrag, Umsatz, Projektdauer, Produktkategorie, etc.) heraus.
Ein dritter Themenbereich ist das Deep Learning. Deep Learning kennen wir aus der Praxis z.B. für Bilderkennung oder Übersetzungsdienste wie Google Translate (Hyperlink: https://translate.google.com/?hl=de). Deutlich komplizierter ist dann bereits das Thema des autonomen Fahrens von Kraftfahrzeugen. Auch dieses wird durch die Anwendung von Deep Learning ermöglicht.
Es ergeben sich also durch KI und deren Algorithmen neue Anwendungsmöglichkeiten. Jedes Unternehmen in jedem Unternehmensbereich kann heute diese Anwendungsfälle („Use Cases“) nutzen, um einen Wettbewerbsvorteil draußen am Markt zu gewinnen.
Welche Ressourcen werden zur Nutzung einer KI benötigt?
Selbstverständlich sind solche mathematischen Operationen rechenintensiv. Ein stabiles IT-System, welches die notwendige Rechenleistung zur Verfügung stellen kann, ist unabdingbar; ebenso die IT-Fachkräfte, um den sicheren Betrieb zu gewährleisten. Auch die Hardware ist nicht zu unterschätzen, denn ein ordentliches Hadoop-Cluster auf Basis einer in-Memory-Datenbank ist nicht einfach mal an einem lauen Sommertag aufgesetzt.
Viel zu schnell wird heutzutage der Begriff Künstliche Intelligenz verwendet. Oftmals ist es einfach nur eine Aneinanderreihung von cleveren Algorithmen, die bestimmte Mustererkennungen vornehmen können. Dazu braucht es einmal einen Data Scientist, der die Algorithmen beherrscht und die notwendigen Modelle trainiert und optimiert. Außerdem wird der Fachbereich benötigt.
Die KI für die Wertschöpfungskette trainieren
Ohne den Input aus der Fachebene, welche Informationen benötigt werden, kann die KI nicht auf das optimale Ergebnis trainiert werden. Beide Seiten, also die Spezialisten aus dem Fachbereich und die Data Scientists sollten zusammen evaluieren, wie sie im Unternehmen den nächsten Schritt mithilfe von KI durchführen können, um im Rahmen der Digitalisierung das Geschäftsmodell längerfristig abzusichern.
[1] Dieser Test-Datensatz kann auch nochmals separiert werden, um Validierungs-Datensatz zu erzeugen. Dabei ist ein übliches Verhältnis: 20 % Test-Datensatz, 10 % Validierungs-Datensatz.
Mehr Infos gewünscht? Meldet euch bei:
NeoDesign // Marketing & Sales Solutions
Prof. Dr. rer. nat. Alexander Lutz (MWM-Profil)
Web: neodesign.tv
Phone: 089-21 53 88 9-0
Mail: info@neodesign.de