Maschinelles und Tiefes Lernen: Der Motor für „KI made in Germany“

bei

 / 21. February. 2020

Künstliche Intelligenz[1] (KI) erlebt aktuell einen wahren Boom. Aus einer Fachdisziplin der Informatik, deren Anfänge auf die 1950er Jahre zurück gehen, wurde in den vergangenen Jahren ein viel diskutiertes und öffentlichkeitswirksames Thema. Grund dafür sind KI-basierte Anwendungen, die noch vor wenigen Jahren als Science Fiction galten: Intelligente sprachgesteuerte Assistenzsysteme unterstützen uns heute bei der Navigation, Bilderkennungssyteme interpretieren mit hoher Zuverlässigkeit Röntgenaufnahmen und automatisiertes Fahren wird zunehmend Realität. Die künftigen Auswirkungen von KI auf wirtschaftliche Prozesse wie auch unseren Alltag lassen sich längst nicht absehen – und kaum überschätzen. Die technologische Entwicklung darf daher nicht sich selbst überlassen werden, sondern muss begleitet werden. Wozu wollen wir KI nutzen? Wie kann ihr Einsatz dem Wohl der Gesellschaft dienen und den Wirtschaftsstandort Deutschland stärken? Diese Fragen gilt es in einem breiten öffentlichen Dialog zu klären. Damit verbunden sind zentrale Fragen für Forschung und Wissenschaft: Welche KI-Kompetenzen müssen wir in Deutschland aufbauen, um die gute Ausgangsposition in der internationalen KI-Forschung zu stärken? In welche Forschungsthemen sollte im Sinne einer zukunftsfähigen Ausrichtung künftig verstärkt investiert werden?

Technologischer Treiber der aktuellen KI-Entwicklung sind das Maschinelle Lernen[2] und das Tiefe Lernen. Verbunden mit der Verfügbarkeit von Massendaten sowie Fortschritten beim schnellen, parallelen Rechnen waren sie für die spektakulären KI-Durchbrüche der vergangenen Jahre verantwortlich – angefangen von DeepMinds AlphaZero, welches durch intensives Spielen gegen sich selbst erlernt, mehrere Brettspiele  auf übermenschlichem Niveau zu spielen, bis hin zu modernen Übersetzungs- und Bilderkennungssystemen. Gegenüber dem umfassenden Begriff der Künstlichen Intelligenz grenzen sich Maschinelles und Tiefes Lernen wiefolgt ab:

  • Künstliche Intelligenz definiert Herausforderungen, die es zu lösen gilt und entwickelt Lösungsansätze.
  • Maschinelles Lernen ist eine grundlegende Methode der Künstlichen Intelligenz. Sie zielt darauf, dass Maschinen ohne explizite Programmierung eines konkreten Lösungswegs automatisiert sinnvolle Ergebnisse liefern. Spezielle Algorithmen lernen dabei aus den vorliegenden Beispieldaten Modelle, die dann auch auf neue, zuvor noch nicht gesehene Daten angewendet werden können.
  • Maschinelles Lernen mit großen neuronalen Netzen wird als Tiefes Lernen (Deep Learning) bezeichnet. Es stellt derzeit einige der leistungsfähigsten Ansätze des Maschinellen Lernens bereit.
Zusammenhang zwischen Künstlicher Intelligenz, Maschinellem Lernen und Tiefem Lernen

Heute werden smarte Lösungen noch vornehmlich manuell programmiert. So beinhaltet ein Smartphone etwa mehr als zehn Millionen Codezeilen. Die aktuellen Entwicklungen auf dem Gebiet der Künstlichen Intelligenz markieren jedoch einen Paradigmenwechsel: Statt Verarbeitungsschritte manuell zu kodieren, wird KI-basierten Systemen die Fähigkeit zu lernen programmiert. Mithilfe des Maschinellen Lernens können Agenten aus sehr vielen Beispielsituationen Muster erlernen und auf neue, ähnliche Situationen übertragen. Auch beim Maschinellen Lernen programmiert weiterhin der Mensch – allerdings nicht mehr fertige Lösungen. Stattdessen entwickelt er Programme, die aufgrund von Trainingsdaten die Lösung erlernen.

Die größten KI-Erfolge basieren derzeit auf tiefen neuronalen Netzen (Tiefes Lernen bzw. Deep Learning). Hierbei verarbeiten eine große Zahl an künstlichen Neuronen Eingangsinformation in mehreren Schichten und stellen am Ausgang das Ergebnis bereit. So sind beispielsweise moderne Übersetzungs- und Bilderkennungssysteme ohne Tiefes Lernen nicht denkbar. Neuronale Netzwerke besitzen eine hohe Expressivität, oder vereinfacht gesprochen: die Fähigkeit, jede kontinuierliche Funktion beliebig genau zu approximieren. Dadurch gestaltet sich ihr Training oftmals sehr daten- und zeitintensiv. Gleichzeitig ist es aber in der Regel möglich, ein für eine spezielle Aufgabe aufwendig trainiertes Netz über Transferlernen mit wenig Aufwand auf eine neue Aufgabenstellung anzupassen.

Expertise in Maschinellem und Tiefem Lernen ausbauen

Für eine zukunftsorientierte und erfolgreiche „KI made in Germany“ ist es unabdingbar, die Expertise für Maschinelles Lernen und Tiefes Lernen in Deutschland zu stärken – sowohl an Hochschulen, als auch in Forschungsgrammen und Kompetenzzentren. Denn unabhängig davon, ob Daten als das „Öl des 21. Jahrhunderts“ in großem oder kleinem Umfang gesammelt werden: Ohne hochleistungsfähige „Raffinerien“ – also Methoden wie Maschinelles oder Tiefes Lernen – bleiben sie, was sie sind: Rohöl, das keinen (Wirtschafts-)Motor antreiben kann. Um sie in intelligente und nutzbringende Anwendungen zu überführen, benötigen wir Expertinnen und Experten mit exzellenter Kenntnis der Grundlagen und Verfahren des Maschinellen Lernens. Zu nennen sind hierbei beispielsweise das (un)überwachte Lernen, das Lernen durch Verstärkung (Reinforcement Learning), die Dichteschätzung, das Boosting und Ensemble-Methoden, Max-Margin-Modelle, Online- und Datenstrom-Lernverfahren, das relationale Lernen, Aufmerksamkeitsmodellierung, Memory Netze und andere Verfahren. Zu den Grundlagen gehören auch umfangreiche Kenntnisse in der Modellauswahl, der Datenbereinigung, der Merkmalsauswahl, der mathematischen Optimierung, der Statistik, der Interpretation von Modellen und ihren Ergebnissen und der Durchführung einer empirischen Evaluierung im Allgemeinen.

Stärken müssen wir auch die vorhandene Expertise im Bereich des Tiefen Lernens, insbesondere in den Teilgebieten wie neuronale Netzwerke, Convolutional Neural Networks oder rekurrente neuronale Netze sowie die Visualisierung bzw. Erklärbarkeit von tiefen Modellen. Für eine zukunftsorientierte KI-Forschung muss zudem die KI-Infrastruktur in Deutschland weiter auf- und ausgebaut werden – insbesondere durch Cluster, die Maschinelles und Tiefes Lernen mittels speziellen KI-Beschleunigern (z.B. GPU-/CPU-Cluster) unterstützen. Wichtig ist dabei vor allem, dass die Infrastruktur für alle Stakeholder mit ausgewiesener Expertise zur Verfügung steht und die Leistungsanforderungen verschiedenster Anwendungen erfüllen kann. Darüber hinaus müssen verschiedene Konzepte – etwa für Sicherheits- und Vertraulichkeitsanforderungen – erprobt werden können. Zu beachten ist: In Zukunft werden sich KI-Infrastrukturen voraussichtlich stark von den heutigen unterscheiden. Deutschland sollte daher nicht nur auf ausgereifte Technologien setzen, sondern gezielt auch neue Rechenplattformen erforschen. Dies könnte zu einem Wettbewerbsvorteil werden.

Anforderungen an KI von morgen

Moderne KI-Anwendungen sind beeindruckend. Allerdings sind sie in der Entwicklung auch sehr kostenintensiv. Darüber hinaus erfordern viele KI-Ansätze – wie das Tiefe Lernen – meist gelabelte Trainingsdaten, deren Beschaffung schwierig, wenn nicht gar unmöglich ist. Ein wichtiges Ziel der Forschung ist es daher, diese Entwicklungsprozesse zu vereinfachen. Für viele Anwendungen ist es zudem essentiell, dass KI-basierte Vorhersagen und Entscheidungen zuverlässig und nachvollziehbar sind. Letzteres ist nicht in allen Fällen erforderlich. Tiefe Netzwerke sollen ja gerade in großen, hochdimensionalen Datenmengen Muster finden, die kein Mensch jemals entdecken könnte. Aus ethischen, juristischen und sozialen Gründen ist in bestimmten Domänen (z.B. in der Medizin) und bei bestimmten Aufgaben (z.B. bei Therapieempfehlungen) nachvollziehbares und zuverlässiges Verhalten jedoch unabdingbar.

Der Aufbau in vertrauenswürdige KI-Systeme erfordert neben einem fundierten KI-Fachwissen auch umfangreiche Programmierkenntnisse, Anwendungswissen sowie ein fundiertes Wissen im Umgang mit Unsicherheiten. Zusätzliche Professuren in den Bereichen Künstliche Intelligenz, Maschinelles Lernen und Tiefes Lernen können dazu beitragen, die benötigten Multiplikatoren auszubilden, auf dass sie ihre KI-Expertise weitervermitteln sowie in die Anwendung und Praxis tragen – auch zusammen mit anderen Disziplinen.

Der technologische Fortschritt im Bereich Künstliche Intelligenz ist so rasant, dass einzelne Technologien schnell veralten. Daher gilt es nicht nur die Algorithmen weiterzuentwickeln, sondern insbesondere den Transfer durch die „Köpfe“ in den Unternehmen zu stärken und auf diese Weise die Innovationskraft zu sichern. Firmen können nur innovativ sein, wenn ihre KI-Expertise auf dem neuesten Stand der Technik ist und ihre Fachleute mit den neuesten Technologien umgehen können. Neben der klassischen Fort- und Weiterbildung braucht es dazu unter anderem den Transfer über KI-Köpfe – also den personellen Austausch zwischen Wissenschaft und Wirtschaft. Neue duale Programme für Doktorandinnen und Doktoranden und insbesondere die Förderung von Gründungen und Start-ups sind hierfür vielversprechende Instrumente.

Viele Entscheidungsträgerinnen und -träger in Wissenschaft, Wirtschaft und Gesellschaft haben das große Potential der Künstlichen Intelligenz erkannt. Oft bestehen jedoch noch Vorbehalte. Um das Potential von KI-Methoden zu heben, sollten bestehende Verbindungen zwischen verschiedenen Fachdisziplinen, Studiengängen (z.B. in der Data Science, Maschinellen Lernen und/oder Künstliche Intelligenz) und Firmen in Deutschland gefestigt und neue Brücken geschlagen werden. Die geplanten KI-Kompetenzzentren und die KI-Hubs sollten daher neben der Grundlagenforschung auch Kooperationsprojekte und -strategien entwickeln, beratend tätig sein und die Verbreitung von Forschungsergebnissen verstärken. Öffentliche Veranstaltungen und Beiträge in verschiedenen Medien tragen dazu bei, eine informierte Debatte in Gang zu setzen und ein realistisches Bild von Künstlicher Intelligenz in der Gesellschaft zu vermitteln.

Maschinelles Lernen wird auch in Zukunft ein Schlüssel zur Künstlichen Intelligenz sein – jedoch nicht der einzige. Zu erwarten sind zunehmend synergetische Lösungen, die unterschiedliche Paradigmen der KI-Forschung verknüpfen. Unterschiedliche Bausteine einer heute oft noch segmentierten KI-Forschung – wie etwa Computer Vision, natürliche Sprachverarbeitung, Robotik und Kognition – werden zusammenwachsen und neue Themen erschließen.

Quellen und Referenzen:

[1] Nach J. McCarthy ist Künstliche Intelligenz „the science and engineering of making intelligent machines, especially intelligent computer programs. It is related to the similar task of using computers to understand human intelligence, but AI does not have to confine itself to methods that are biologically observable” (McCarthy 2007).

[2] T. Mitchell definiert Maschinelles Lernen als die Wissenschaft, „that is concerned with the question of how to construct computer programs that automatically improve with experience” (Mitchell 1997: 15).

Bundesregierung (2018): Strategie Künstliche Intelligenz der Bundesregierung.
www.bmbf.de/files/Nationale_KI-Strategie.pdf (abgerufen am 12. Juni 2019).

Marcus & Davis 2018: A.I. Is Harder Than You Think, in New York Times. https://www.nytimes.com/2018/05/18/opinion/artificial-intelligence-challenges.html (abgerufen am 28. Mai 2019).

McCarthy 2007: What is artificial intelligence?
http://jmc.stanford.edu/artificial-intelligence/what-is-ai/index.html (abgerufen am 01. März 2019).

Mitchell 1997: Machine Learning, New York City: McGraw-Hill.

Schoenick et al. 2017: Moving beyond the Turing Test with the Allen AI Science Challenge, in: Communications of the ACM, Bd. 60, Nr. 9, S. 60 – 64.

Silver et al. 2016: Mastering the game of Go with deep neural networks and tree search, in Nature, Nr. 529, S. 484-489.

Silver et al. 2018: A general reinforcement learning algorithm that masters chess, shogi and Go through self-playing, in Science, Bd. 362, Nr. 6419, S. 1140-1144.

Kristian Kersting ist Professor für Maschinelles Lernen am Fachbereich Informatik der TU Darmstadt, Deutschland. Dort leitet er das Fachgebiet für Maschinelles Lernen und ist Mitglied des Zentrums für Kognitionswissenschaften. Nach seiner Promotion an der Universität Freiburg im Jahr 2006 war er am MIT, Fraunhofer IAIS, der Universität Bonn und der TU Dortmund tätig. Seine Forschungsschwerpunkte sind statistische, relationale Künstliche Intelligenz (KI) und tiefe, probabilistische Modelle.

Volker Tresp received his Ph.D. degree from Yale University in 1989 and joined Siemens the same year. Since then he has been the head of various research teams in machine learning, data analytics and knowledge representation. He filed more than 80 patent applications and was inventor of the year of Siemens in 1996. He teaches an annual course on Machine Learning at the Ludwig Maximilian University of Munich, where he was appointed to the position of a Professor for Machine Learning in 2011.