Wie Transfer Learning den KI-Einsatz demokratisiert

bei

 / 1. March. 2021

Zu wenig Trainingsdaten, keine maßgeschneiderten Modelle, fehlendes Know-how: Es gibt viele Gründe dafür, warum der Einsatz von Künstlicher Intelligenz in der Unternehmenswelt stockt. Transfer Learning kann Abhilfe schaffen. Damit lassen sich vortrainierte neuronale Netze für neue Aufgaben weitertrainieren.

Die Spracherkennung im Handy; die Foto-App, die erkennt, dass eine Person fotografiert wird und automatisch die Einstellungen der Kameras anpasst; der Übersetzungsdienst im Internet: Die Menschen nutzen heute in ihrem Privatleben an vielen Stellen ganz selbstverständlich Künstliche Intelligenz. An ihrem Arbeitsplatz sieht es dagegen meist noch anders aus. KI ist noch längst nicht in dem Maße in der Arbeitswelt angekommen wie das im Privatleben der Fall ist. Die meisten Aufgaben in Büros und die dazugehörigen Prozesse werden bisher kaum durch Künstliche Intelligenz vereinfacht. Dafür gibt es mehrere Gründe.

Die Nutzer liefern den Anbietern umfassende Trainingsdaten

Die im Privatleben verbreiteten KI-Anwendungen werden mit Machine-Learning-Verfahren trainiert, wobei große und vor allem verfügbare Datenmengen zum Einsatz kommen. Diese umfassenden Trainingsdaten werden den Anbietern der Anwendungen meist von ihren Nutzern geliefert. Durch Unmengen an Nutzerdaten kann zum Beispiel DeepL einen guten Übersetzungsdienst bieten oder die Bildersuche von Google Chihuahuas von anderen Hunden unterscheiden. An solchen Massendaten fehlt es bei den allermeisten Bürotätigkeiten.

Außerdem kommen bei den genannten Anwendungen maßgeschneiderte KI-Modelle zum Einsatz, die jeweils eng definierte Aufgaben lösen. Sie werden gezielt auf ihre Zwecke zugeschnitten und für sie optimiert. Ein ähnliches Vorgehen ist bei Bürotätigkeiten in aller Regel nicht möglich. Da sie sehr vielfältig sind und sich von Unternehmen zu Unternehmen stark unterscheiden, ist es praktisch ausgeschlossen, für jede einzelne Tätigkeit ein Modell maßzuschneidern.

Nicht zuletzt mangelt es oft auch am notwendigen Know-how. In Machine-Learning-Projekten müssen Probleme formal spezifiziert werden, anschließend sind die erforderlichen Daten dafür zu gewinnen und zu bereinigen, und am Ende gilt es, die Ergebnisse zu evaluieren. Zudem ist die Integration einer Machine-Learning-Komponente in vorhandene Workflows äußerst komplex. Es braucht erfahrene Experten, die wissen, wie man diese Technologie anwendet, um aus den verfügbaren Daten das Optimum herauszuholen.

Vortrainierte neuronale Netze als Ausgangspunkt für neue Projekte

Einen vielversprechenden Ansatz zur Lösung dieser Herausforderungen liefert das so genannte Transfer Learning. Dabei handelt es sich um eine Methode des Machine Learning, bei der neuronale Netze, die bereits für einen bestimmten Zweck vortrainiert sind, als Ausgangspunkt für eine andere beziehungsweise spezifischere Aufgabe verwendet werden. Das bereits Gelernte eines neuronalen Netzes wird dadurch für ein neues Projekt nutzbar. Damit entfallen nicht nur rechenintensive und zeitaufwändige Tätigkeiten für das Trainieren eines neuen neuronalen Netzes. Mit Transfer Learning können auch „Big Data“-Modelle zur Lösung von „Small Data“-Herausforderungen eingesetzt werden. Vortrainiert mit großen Datenmengen lassen sich die Modelle mit kleineren Datenmengen für die neue Aufgabe weitertrainieren.

Diese Methode konnte bereits im Bereich der Bildverarbeitung große Erfolge erzielen und wird nun auch verstärkt für Sprachmodelle genutzt. Dabei werden mit der Technik des Transfer Learning auf Basis eines umfassenden Sprachverständnisses vortrainierte Sprachmodelle mit relativ wenigen Trainingsdaten für andere Aufgaben angepasst. Sprachmodelle wie BERT (Bidirectional Encoder Representations from Transformers), ULMFiT (Universal Language Model Fine-Tuning), GPT und die Weiterentwicklungen GPT-2 und -3 (Generative Pretrained Transformer) haben bereits bewiesen, dass die aus einem Datensatz gelernten Informationen relativ einfach auch für Aufgaben in anderen Datensätzen genutzt werden können.

Bei der Erkennung von Fachthemen nicht bei Null anfangen

Ein konkretes Einsatzgebiet ist dabei etwa die Analyse von Dokumenten und Informationen. Durch die Nutzung der Transfer-Learning-Methode müssen Unternehmen bei der Erkennung von Fachthemen nicht bei Null anfangen. Stattdessen wird ein allgemeines Sprachmodell verwendet und trainiert beziehungsweise auf ein spezielles Fachgebiet justiert. Ein Vorwissen in Form allgemeiner Sprachkenntnisse ist bereits codiert, so dass das Modell etwa Sätze oder die Grundformen von Wörtern erkennen kann. Um es für die Klassifizierung der eigenen Dokumente weiter zu trainieren, braucht es deshalb deutlich weniger Daten. Unternehmen und Behörden haben dadurch etwa die Möglichkeit, Systeme zu realisieren, die eingehende E-Mails automatisiert analysieren und inhaltsbezogen zur Beantwortung weiter routen.

Ein weiteres Anwendungsgebiet sind etwa Systeme für KI-basierte Vertragsanalysen. Mit Hilfe einer solchen Software lassen sich Klauseln und wichtige Datenpunkte in Verträgen oder Ausschreibungen erkennen und zur gezielten Prüfung, Risikoanalyse, Kommentierung und Bearbeitung extrahieren. Fachanwälte beispielsweise sparen sich durch diese intelligente Lesehilfe viel Zeit und enorme Ressourcen, da sie Verträge nicht mehr einzeln lesen und ihre relevanten Stellen manuell markieren müssen. Das zahlt sich insbesondere dann aus, wenn bei Gesetzesänderungen oder Firmenübernahmen große Vertragsbestände geprüft werden müssen. Die Grundlage für solch ein System kann eine KI-Software bilden, die bereits für die gängigsten Vertragsarten und Klauseln vortrainiert ist. Nutzer haben dann die Möglichkeit, die Software für ihre individuellen Kontexte und Domänen weiter zu trainieren.

Transfer Learning kann flächendeckenden KI-Einsatz in der Unternehmenswelt voranbringen

Die Methode des Transfer Learning kann einen wichtigen Beitrag zur Demokratisierung von Künstlicher Intelligenz leisten. Zwar müssen dabei Abstriche hinsichtlich maßgeschneiderter Modelle und vollständiger Automatisierung gemacht werden, da sich Optimierungen nicht a priori einbauen lassen. So können damit beispielsweise nicht ohne Weiteres Systeme realisiert werden, die Formulare automatisch ausfüllen. Es können damit aber sehr wohl relativ schnell und unkompliziert Systeme implementiert werden, die die Anwender beim Ausfüllen von Formularen unterstützen, indem sie die dafür erforderlichen Informationen in den entsprechenden Dokumenten finden und hervorheben – und die Anwender damit durchaus entscheidend entlasten. Deshalb hat das Transfer Learning definitiv das Zeug dazu, den flächendeckenden Einsatz von KI in der Unternehmenswelt voranzubringen.

 

Über den Autor / die Autorin:


Franz Kögl studierte Elektrotechnik mit einem anschließenden Aufbaustudium zum Wirtschaftsingenieur an der Fachhochschule München. Im Jahr 2000 gründete er die IntraFind Software AG. Seitdem vertreibt der etablierte Softwareanbieter erfolgreich Enterprise Search und AI-basierte Anwendungen.