Spielart der Künstlichen Intelligenz: Das maschinelle Lernen ermöglicht völlig neue Geschäftsmodelle.
Die Künstliche Intelligenz (KI) macht gewaltige Fortschritte und wird zunehmend zum Treiber der Digitalisierung in Wirtschaft und Gesellschaft. Die Bundesregierung hat zum Digital-Gipfel am 3. und 4. Dezember 2018 in Nürnberg eine KI-Strategie verabschiedet, mit der Deutschland in den kommenden Jahren zu einem weltweit führenden Standort entwickelt werden soll. So will der Bund diese Zukunftstechnologie bis Ende 2025 mit drei Mrd. Euro fördern. Die EU-Kommission hat ebenfalls im Dezember 2018 einen koordinierten Plan für die Entwicklung und Nutzung von Künstlicher Intelligenz „Made in Europe“ vorgelegt. Hierin wird KI als wichtigster Motor für Wirtschaftswachstum identifiziert, der zudem maßgeblich zur Nachhaltigkeit und Tragfähigkeit der industriellen Basis in Europa beiträgt.
Insbesondere das maschinelle Lernen besitzt enormes Potenzial: Bereits heute entstehen durch diese datenbasierende Technologie in einzelnen Branchen völlig neue Geschäftsmodelle, die die traditionellen Wertschöpfungsketten drastisch verändern.
Das maschinelle Lernen verfolgt einen grundlegend anderen Ansatz als die klassische Software-Entwicklung. Wissen wird nicht von Experten in Form von programmierten Regeln vorgegeben, sondern aus Daten gewonnen, mit denen die Maschine „trainiert“ wird und dadurch ständig dazu lernt. Mit Hilfe des erlernten Wissens lassen sich Vorhersagen treffen, die mit einer gewissen Wahrscheinlichkeit eintreten. Maschinelles Lernen hat damit Vorteile gegenüber den klassischen handgeschriebenen Algorithmen bei Problemen, die nur schwer durch eine genaue Anleitung gelöst werden können. Dies ist beispielsweise bei der Sprach- und Gesichtserkennung oder auch beim Autofahren der Fall. Häufig handelt es sich um Probleme, die der Mensch intuitiv relativ schnell lösen, aber im Detail nicht nachvollziehen kann.
Grundsätzlich lassen sich drei verschiedene Arten des maschinellen Lernens unterscheiden, die wiederum durch eine Vielzahl von Algorithmen realisiert werden können.
Überwachtes Lernen: Beim sogenannten überwachten Lernen (Supervised Learning) lernt die Maschine eine Aufgabe anhand von vielen Beispielen. Die Beispiele sind in einem Trainingsdatensatz gebündelt und bestehen aus Paaren von Eingaben (Inputs) und Zielwerten (Outputs bzw. „Labels“). Ein Beispiel: Als Trainingsdaten können mehrere tausend Hunde- und Katzenbilder dienen, die alle mit der Information der abgebildeten Tierart als Zielwert beschriftet sind. Auf Basis der Trainingsdaten lernt die Maschine ein Modell, das auch auf noch nicht gesehene Bilder von Hunden und Katzen generalisieren kann und diesen die korrekte Tierart zuordnet.
Das Vorhandensein von Zielwerten vereinfacht das Lernproblem, da es eine klare Möglichkeit gibt, die Leistung während des Trainings zu bestimmen bzw. zu „überwachen“. Der Lern-Algorithmus gleicht seine Vorhersage mit den Zielwerten ab und verwendet die Fehlerinformationen, die sich daraus ergeben, um seine Leistung schrittweise zu verbessern. Aus diesem Grund ist das überwachte Lernen deutlich ausgereifter als die anderen Verfahren und hat mit Abstand die größte praktische Bedeutung. Einsatzfelder sind beispielsweise die Gesichtserkennung, die Bilderkennung in unterschiedlichen Bereichen wie Industrie und Medizin, das Erkennen von Spam-Mails, aber auch die Vorhersage von Aktienkursen, von Energiepreisen oder des Einkaufsverhaltens von Kunden. Allerdings besitzt das überwachte Lernen auch einen Nachteil: Die hierfür notwendigen Datensätze sind teuer, da sie eine sorgfältige Kommentierung mit Zielwerten erfordern, die von Menschen geleistet werden muss.
Unüberwachtes Lernen: Beim unüberwachten Lernen (Unsupervised Learning) stellt der Mensch dem Lernalgorithmus lediglich einen Rohdatensatz zur Verfügung, der nur Eingaben, aber keine Zielwerte enthält. Im erwähnten Beispiel der Tierbilder wird der Maschine daher nicht mitgeteilt, bei welchem Bild es sich um welches Tier handelt. Stattdessen muss der Lernalgorithmus selbst Muster in den Eingabedaten entdecken. Auf der einen Seite hat der Lernalgorithmus hierdurch eine größere Entscheidungsfreiheit. Auf der anderen Seite ist jedoch nicht gewährleistet, dass die gefundenen Muster aussagekräftig oder für den jeweiligen Zweck nützlich sind.
So müssen die Tierfotos nicht unbedingt nach Tierarten (Hund oder Katze) kategorisiert werden, sondern es könnten alternativ je nach Datenlage auch Gruppierungen nach Farben (schwarze, braune oder weiße Tiere) oder auch nach Körpergröße herauskommen. Da die einzelnen Gruppen nicht benannt sind, spricht man hier von Clustern. Bekannte Beispiele für das Clustering sind die Einteilung von Kunden nach Kaufverhalten sowie von Dokumenten nach inhaltlichen Ähnlichkeiten. So können beispielsweise Nachrichten in solche unterteilt werden, die sich auf Politik, Sport, Mode, Kunst usw. beziehen. Unüberwachte Lernverfahren können auch Ereignisse gruppieren, die häufig zusammen auftreten. Ein klassisches Beispiel sind Analysen von Warenkörben, bei denen Händler solche Waren identifizieren, die von den Kunden meist zusammen gekauft werden. Im angloamerikanischen Raum ist beispielsweise die Auswahl von Zwiebeln und Tomaten ein deutlicher Hinweis darauf, dass die Kunden gleichzeitig häufig auch Fleisch für Hamburger kaufen. Deshalb können Werbung und Marketing auf diesen Zusammenhang abgestimmt werden.
Da die meisten Daten heute nur als nicht aufbereitete Rohdaten zur Verfügung stehen, sind unüberwachte Lernalgorithmen ein notwendiges Hilfsmittel. Sie stecken – anders als das überwachte Lernen – allerdings noch in den Kinderschuhen. Das Potenzial ist bis heute schwer abschätzbar, aber die Erwartungen sind groß.
Bestärkendes Lernen: Bei den bisher erläuterten Verfahren wird die Maschine vorher vom Menschen mit Daten gefüttert, die die Basis für das Lernen bilden. Völlig andere Lernstrategien sind notwendig, wenn die Maschine die Daten und die Lernsignale aktiv aus der Umwelt gewinnen muss. Hier kommt die dritte Art des maschinellen Lernens ins Spiel, das sogenannte Bestärkende Lernen (Reinforcement Learning). Als Lernsignal dient ein Belohnungswert, der durch eine Folge von Handlungen und Entscheidungen optimiert werden muss. Die notwendigen Trainingsdaten erhält die Maschine, indem sie Handlungen in einem realen oder virtuellen Umfeld nach der „Trial und Error“-Methode durchführt (Versuch und Irrtum). Da die Maschine aktiv auf das Umfeld einwirkt, kann sie nicht einfach die Handlung mit der höchsten unmittelbaren Belohnung wählen, sondern muss die Veränderung der Umwelt berücksichtigen. Aus diesem Grund eignet sich Reinforcement Learning insbesondere für Aufgaben, bei denen Planungen in einem flexiblen Umfeld erfolgen. Dies wird am Beispiel der Dialogsysteme im Kundenmanagement deutlich: Im Rahmen des überwachten Lernens werden diese Systeme mit Paaren von Fragen und richtigen Antworten trainiert, während das Reinforcement Learning auf die richtige Reihenfolge der Antworten fokussiert, um eine möglichst hohe „Belohnung“ zu erreichen. Der Belohnungswert kann beispielsweise ein bestimmtes Maß für die Kundenzufriedenheit sein.
Reinforcement Learning kann seine Stärken dann ausspielen, wenn das Training in einer simulierten Umgebung stattfindet. Anders als in realen Umgebungen können die Trainingszeiten in Computer-Simulationen durch höhere Rechenleistungen stark reduziert werden. Dies hat auch den Erfolg des KI-Programms AlphaGo ermöglicht, das im Jahr 2016 den weltweit besten Spieler des hoch-intuitiven Go-Spiels geschlagen hat. Das verbesserte Nachfolgeprogramm AlphaZero kommt ganz ohne menschliche Trainingsbeispiele aus und trifft Entscheidungen auf Basis von Millionen Partien, die das KI-System gegen sich selbst spielt. Das Spielergebnis dient hierbei als Belohnungssignal. Allerdings lassen sich die Deep-Reinforcement-Lernalgorithmen von AlphaZero nur schwer auf die reale Welt mit all ihren Unsicherheiten übertragen. Viel versprechende Ansätze in den Bereichen Robotik und automatisiertes Fahren befinden sich noch im Forschungsstadium. Insgesamt ist Reinforcement Learning ein großer Hoffnungsträger im Bereich der KI-Forschung, der stark durch Entwicklungen in der Psychologie und den Neurowissenschaften geprägt ist.
Die beschriebenen Lernarten können mit Hilfe von unterschiedlichen Algorithmen und Datenstrukturen bzw. „Repräsentationen“ umgesetzt werden. Eine besonders leistungsfähige Variante ist das Deep Learning, das in den letzten Jahren den weltweiten Boom der KI getragen hat. Deep Learning repräsentiert die Daten in künstlichen Neuronalen Netzen (NN) mit mehr als drei Netzwerkebenen. Mit Hilfe der verschiedenen Schichten kann das NN Daten hierarchisch analysieren und somit komplexe Konzepte lernen, die auf simplen Strukturen beruhen.
Im Falle der erwähnten Tierbilder lernt die erste Schicht primitive geometrische Merkmale wie Punkte, Linien oder Kurven. Die nächsten Schichten lernen anschließend geometrische Grundfiguren wie Kreise und Quadrate. Weiter tiefer liegende Schichten lernen dann Merkmale, die spezifischer für die Tiere sind, wie Ohren, Nasen und Augen. Die letzte Schicht in diesem NN dient dann dazu, die verschiedenen Tiere zu klassifizieren. Der große Vorteil hierbei: Das NN lernt eine hierarchische Präsentation von Merkmalen, die für das Problem charakteristisch sind. Noch vor wenigen Jahren mussten diese aufwendig und fehleranfällig programmiert werden.
Allerdings hat die komplexe Architektur von tiefen Netzen auch ihre Tücken: So sind für das Training hohe Rechenleistungen und eine große Menge an Daten notwendig. Außerdem sind die Ergebnisse weder im Hinblick auf Qualität garantiert noch in einer für den Menschen sinnvollen Art nachvollziehbar.
Aktivitäten der IHK
Bisher wird das maschinelle Lernen fast ausschließlich von größeren Unternehmen und Start-ups eingesetzt. Die IHK Nürnberg für Mittelfranken engagiert sich dafür, auch den Mittelstand stärker einzubinden und Potenziale des maschinellen Lernens für die Wirtschaftsregion flächendeckend zu nutzen. Einen Beitrag hierfür leistet der neue IHK-Unternehmenszirkel „Künstliche Intelligenz | Maschinelles Lernen“, der im Februar 2019 erstmals mit 15 Entscheidungsträgern aus zehn regionalen Unternehmen durchgeführt wurde. Im Rahmen einer Workshop-Reihe wurde aufgezeigt, wie Konzepte des maschinellen Lernens erstellt und im Unternehmen umgesetzt werden können. Die Themen des Unternehmenszirkels sind ausgerichtet am Crisp-DM-Standard (Cross-Industry Standard Process for Data Mining) und umfassen die Schritte „Festlegung der Ziele“, „Gewinnung der Daten“, „Aufbereitung der Daten“, „Training des Modells“, „Evaluierung sowie „Aufbereitung und Präsentation der Ergebnisse“. Die IHK plant eine Fortsetzung des Unternehmenszirkels und wird hierüber rechtzeitig informieren. Dr. Ronald Künneth ist Experte für Automatisierungstechnik und Künstliche Intelligenz bei der IHK Nürnberg für Mittelfranken.