Wel­che Vor­aus­set­zun­gen benö­tigt ein Unter­neh­men, um eine KI in die eige­ne Wert­schöp­fungs­ket­te zu integrieren?

Künst­li­che Intel­li­genz: Ein Begriff, bei dem heu­te sofort jeder ein Bild von einer futu­ris­ti­schen Welt im Kopf hat. Eben­so sind medi­en­wirk­sa­me Buz­zwords wie Data Dri­ven Mar­ke­ting, Block­chain, Big Data und Data Sci­ence der­zeit abso­lut im Trend. Unter­neh­men kön­nen Big Data-Metho­den anwen­den, um sich einen Wett­be­werbs­vor­teil zu sichern. Die­ser Arti­kel gibt einen gro­ben Überblick.

Die drei Kom­po­nen­ten einer KI

KI besteht aus drei Berei­chen: Ein­mal aus der klas­si­schen Sta­tis­tik. Die ken­nen wir noch aus der Schu­le, bei­spiels­wei­se der Mit­tel­werts­be­rech­nung. Hin­ter allen Metho­den der Künst­li­chen Intel­li­genz ste­cken vie­le mathe­ma­ti­schen Model­le, wel­che dazu genutzt wer­den, Bezie­hun­gen zwi­schen den vor­han­de­nen Daten­punk­ten zu ermitteln.

Der zwei­te gro­ße Bereich ist das Machi­ne Lear­ning. Es meint, dass einem IT-Sys­tem bei­gebracht wird, bestimm­te Mus­ter in Daten­sät­zen zu erken­nen. Dahin­ter ver­ste­cken sich ver­schie­de­ne Ver­fah­ren; ein Bei­spiel ist hier das sog. Clus­te­ring, also das Bil­den von Grup­pen inner­halb des gesam­ten Daten­sat­zes, was auch als daten­ge­trie­be­ne Seg­men­tie­rung bezeich­net wird. Grob wird unter­schie­den zwi­schen dem super­vi­sed Lear­ning und dem unsu­per­vi­sed Lear­ning.

  1. Bei ers­te­rem wird der Daten­satz auf­ge­teilt, sodass ein Anteil (etwa 70 %) zum Anler­nen des IT-Sys­tems ver­wen­det wird. Zum Anler­nen muss der Daten­satz mit Label vor­lie­gen, sodass das Sys­tem die Infor­ma­ti­on hat: „auf die­sem Bild ist ein Haus abge­bil­det“ oder „die­se Zif­fer ist eine 3“. Durch das Ein­spei­sen die­ses Trai­nings-Daten­sat­zes wird das sog. Modell ent­wi­ckelt, wel­ches dann am ver­blei­ben­den Anteil (die rest­li­chen 30 %[1]) getes­tet wird.
  2. Das unsu­per­vi­sed Lear­ning funk­tio­niert völ­lig anders. Dabei erhält die KI kei­ner­lei Infor­ma­tio­nen über die Daten­punk­te und muss sich die Bezie­hun­gen zwi­schen ihnen selbst her­stel­len. Das geschieht durch mathe­ma­ti­sche Model­le wie das k‑nea­rest-neigh­bor Hat man bei­spiels­wei­se Dut­zen­de Punk­te in einem Koor­di­na­ten­sys­tem, so berech­net das Modell zu einem Punkt den Abstand zu jedem ande­ren Punkt im Koor­di­na­ten­sys­tem – über den Satz des Pytha­go­ras. Die­se Berech­nung wird für jeden Punkt durch­ge­führt. Somit weiß das IT-Sys­tem am Ende, wel­che Punk­te am nächs­ten bei­sam­men lie­gen und kann Clus­ter bil­den. Eine Anwen­dung sol­cher Clus­ter ist bei­spiels­wei­se das Ermit­teln von typi­schen Kun­den­seg­men­ten aus einem gesam­ten Daten­satz von Kun­den­da­ten (Auf­trag, Umsatz, Pro­jekt­dau­er, Pro­dukt­ka­te­go­rie, etc.) heraus.

Ein drit­ter The­men­be­reich ist das Deep Lear­ning. Deep Lear­ning ken­nen wir aus der Pra­xis z.B. für Bil­der­ken­nung oder Über­set­zungs­diens­te wie Goog­le Trans­la­te (Hyper­link: https://​trans​la​te​.goog​le​.com/​?​h​l​=de). Deut­lich kom­pli­zier­ter ist dann bereits das The­ma des auto­no­men Fah­rens von Kraft­fahr­zeu­gen. Auch die­ses wird durch die Anwen­dung von Deep Lear­ning ermöglicht.

Es erge­ben sich also durch KI und deren Algo­rith­men neue Anwen­dungs­mög­lich­kei­ten. Jedes Unter­neh­men in jedem Unter­neh­mens­be­reich kann heu­te die­se Anwen­dungs­fäl­le („Use Cases“) nut­zen, um einen Wett­be­werbs­vor­teil drau­ßen am Markt zu gewinnen.

Wel­che Res­sour­cen wer­den zur Nut­zung einer KI benötigt?

Selbst­ver­ständ­lich sind sol­che mathe­ma­ti­schen Ope­ra­tio­nen rechen­in­ten­siv. Ein sta­bi­les IT-Sys­tem, wel­ches die not­wen­di­ge Rechen­leis­tung zur Ver­fü­gung stel­len kann, ist unab­ding­bar; eben­so die IT-Fach­kräf­te, um den siche­ren Betrieb zu gewähr­leis­ten. Auch die Hard­ware ist nicht zu unter­schät­zen, denn ein ordent­li­ches Hadoop-Clus­ter auf Basis einer in-Memo­ry-Daten­bank ist nicht ein­fach mal an einem lau­en Som­mer­tag aufgesetzt.

Viel zu schnell wird heut­zu­ta­ge der Begriff Künst­li­che Intel­li­genz ver­wen­det. Oft­mals ist es ein­fach nur eine Anein­an­der­rei­hung von cle­ve­ren Algo­rith­men, die bestimm­te Mus­ter­er­ken­nun­gen vor­neh­men kön­nen. Dazu braucht es ein­mal einen Data Sci­en­tist, der die Algo­rith­men beherrscht und die not­wen­di­gen Model­le trai­niert und opti­miert. Außer­dem wird der Fach­be­reich benötigt.

Die KI für die Wert­schöp­fungs­ket­te trainieren

Ohne den Input aus der Fach­ebe­ne, wel­che Infor­ma­tio­nen benö­tigt wer­den, kann die KI nicht auf das opti­ma­le Ergeb­nis trai­niert wer­den. Bei­de Sei­ten, also die Spe­zia­lis­ten aus dem Fach­be­reich und die Data Sci­en­tists soll­ten zusam­men eva­lu­ie­ren, wie sie im Unter­neh­men den nächs­ten Schritt mit­hil­fe von KI durch­füh­ren kön­nen, um im Rah­men der Digi­ta­li­sie­rung das Geschäfts­mo­dell län­ger­fris­tig abzusichern.

[1] Die­ser Test-Daten­satz kann auch noch­mals sepa­riert wer­den, um Vali­die­rungs-Daten­satz zu erzeu­gen. Dabei ist ein übli­ches Ver­hält­nis: 20 % Test-Daten­satz, 10 % Vali­die­rungs-Daten­satz.

Alex_1

Ein Beitrag von:

Prof. Dr. rer. nat. Alexander Lutz | SEO & Onlinemarketing

NEOs Onlinemarketing
Jägerstraße 48
82008 Unterhaching

Telefon: +49 (0)89 21 53 88 9-0
info@die-neos.de
https://die-neos.de/

Logo-quadratisch-transparent-weiss-300x200-1