Wie Automatisierung Data Science verändert … und Data Scientists

bei

 / 12. September. 2018

Sorry, this entry is only available in German. For the sake of viewer convenience, the content is shown below in the alternative language. You may click the link to switch the active language.

Die jüngste Entwicklung der Rechenleistung und Speicherkapazitäten von Computern hat die Erzeugung großer Datenmengen, den Zugriff darauf und die Automatisierung der Datenverarbeitung ermöglicht. In den letzten Jahren haben viele Branchen, darunter auch die Versicherungswirtschaft, ihr Know-how in Data Science aufgebaut, um den riesigen Informationspool zur Verbesserung der Entscheidungsfindung und zur Erschließung neuer Geschäftsmöglichkeiten zu nutzen. In der Versicherungsbranche umfasst dies die Verbesserung des Kundenerlebnisses entlang der gesamten Wertschöpfungskette, vom personalisierten On-Boarding bis hin zur Beschleunigung des Schadenprozesses.

Aber was ist Data Science?

Data Science ist die Wissenschaft – und “Kunst” – der Extraktion von nützlichem Wissen aus Daten mit Hilfe intelligenter Algorithmen, auch bekannt als Maschinen, die in der Lage sind, selbstständig Muster und Informationen in sehr großen und komplexen Datensätzen zu erkennen. Data Scientists sind verantwortlich für die Entwicklung und Pflege solcher Algorithmen und deren Interpretation auf Grundlage ihrer wissenschaftlichen und interdisziplinären Expertise, beispielsweise in den Bereichen Statistik, Mathematik, Programmierung und Informatik, und hier insbesondere künstliche Intelligenz (KI) und maschinelles Lernen (ML).

Und was steht hinter künstlicher Intelligenz und maschinellem Lernen?

Künstliche Intelligenz ist die Wissenschaft, Maschinen zu bauen, die in der Lage sind, fortgeschrittenes, menschliches Verhalten nachzuahmen. Maschinelles Lernen ist eine Unterkategorie der KI, die darauf ausgerichtet ist, Maschinen zu befähigen, selbständig aus Mustern und Beziehungen in Daten zu lernen.

Diese benötigte technische Kompetenz ist nur ein Teil der Ansprüche an Data Scientists. Zusätzlich benötigen sie ein tiefes Verständnis für den Geschäftskontext und die Produktionssysteme großer Unternehmen, um umfassende Lösungen zu entwickeln, die in Betriebsmodelle von Unternehmen eingebettet werden können und einen messbaren und skalierbaren Business Impact liefern können.

Der sexieste Job?

Das Momentum rund um Data Scientists wurde 2012 in einem Artikel in der Harvard Business Review festgehalten, in dem „Data Scientist“ als „der sexieste Job des 21. Jahrhundert“ bezeichnet wurde und Fähigkeiten mitbringen müssen, die „für jede Organisation notwendig sind, die von großen Daten profitieren will“.

Seitdem haben sich Data Science Abteilungen in vielen großen Unternehmen etabliert und sind stark gewachsen. Heute, sechs Jahre nach der Veröffentlichung des oben genannten Artikels, werden Anwendungen von KI und ML mehr und mehr real. Sogar Nicht-Technologie-Unternehmen beginnen, KI im großen Maße zu nutzen.

Im Versicherungsgeschäft transformiert Data Science allmählich alle Komponenten der Wertschöpfungskette, bringt Automatisierung und verwertbares Wissen mit sich und eröffnet neue faszinierende Möglichkeiten. Beispielsweise wird es möglich sein, der Versicherung ein Bild eines beschädigten Autos zu schicken, um den Schaden von einer Maschine beurteilen zu lassen. Jedoch muss ein Mensch noch die finale Abnahme durchführen. Bald wird dieser Prozess vollständig automatisiert und nahezu in Echtzeit abgewickelt werden können. Beim Underwriting reichen in Zukunft dank KI und ML minimale Informationen, z.B. das Nummernschild eines Autos, aus, damit der Versicherer die meisten Informationen sehr schnell und einfach rekonstruieren kann, die für die Risikobewertung und die Angebotserstellung nötig sind. Dies wird in Zukunft durch personalisierte Services für ein besseres Kundenerlebnis ergänzt.

Im Wesentlichen entwickelt Data Science neue, datengetriebene Lösungen, die eine intelligente Automatisierung von Prozessen und Entscheidungen durch den Einsatz von Maschinen, die aus Daten lernen, ermöglichen. Es bleibt oft unbemerkt, dass diese intelligenten Algorithmen zwar zum Aufbau solcher innovativer Lösungen eingesetzt werden, aber auch zur Automatisierung der vielen täglichen Aufgaben der Data Scientists selbst genutzt werden können, was Zeit und Aufwand spart. Deshalb kann man sagen, dass Data Science sich allmählich selbst automatisiert, was die typische Arbeit der Data Scientists in den nächsten Jahren verändern wird – wenn dies jetzt schon nicht passiert.
Doch wie verändert sich das tägliche Leben der Data Scientists?

Um dies zu beantworten, lassen Sie uns einen Schritt zurücktreten und versuchen, die wichtigsten Fragen zu verstehen, mit denen sich ein Data Scientist typischerweise bei der Anwendung von ML auseinandersetzen muss.

Damit eine Maschine lernen kann, muss sie angewiesen werden, “woher” sie lernen soll (von welchen Daten), “wie” sie lernen soll (der spezifische Algorithmus und Ansatz) und natürlich “was” sie lernen soll (das sogenannte “Ziel”).

Das „Woher“

Bevor maschinelles Lernen oder andere KI-Techniken angewendet werden können, ist in der Regel eine Datenbereinigung und -vorbereitung erforderlich. In der Tat ist die Qualität der Datensätze oft mangelhaft: einige Datenwerte können fehlen, das Format oder die Informationen können falsch sein, etc. Zudem kann es bei der Datenerhebung zunächst unklar sein, welche genauen Informationen (sog. “Feature”) für die Analyse benötigt werden.

Der Prozess der Bereinigung der Daten und der Suche nach neuen Datenaufbereitungen/Features wird als “Datenvorverarbeitung” bezeichnet und kann einen sehr großen Teil der Zeit eines Data Scientist in Anspruch nehmen (manchmal sogar bis zu ~60-70%).

Wie wirkt sich die Selbst-Automatisierung der Data Science auf diese Aufgabe aus? Das Interessante hierbei ist, dass viele Anwendungen ähnliche Features benötigen, deren Erstellung leicht standardisiert und automatisiert werden kann. Darüber hinaus ermöglicht die jüngste Entwicklung eines Zweigs von ML, das sogenannte “Deep Learning”, es den Maschinen, Daten autonom in Features einzubauen und zu verarbeiten, was die Lernaufgabe erleichtert und in einigen Fällen die Datenvorverarbeitung fast vollständig auf Maschinen auslagert.

Das “Wie”

Eine weitere wichtige Rolle spielt die Festlegung des Algorithmus und des zugehörigen Lernverfahrens. Algorithmen sind sehr zweckspezifisch und Data Scientists müssen von Fall zu Fall entscheiden, mit welchem Verfahren sie ihre Ziele erreichen wollen. Diese Entscheidung beinhaltet nicht nur die Wahl der Art des Algorithmus, sondern auch die Festlegung aller Parameter, die die Funktionsweise dieser Algorithmen modulieren können.
Diese Auswahl basiert typischerweise auf einer Mischung aus Erfahrung und Heuristik. Das bedeutet, dass eine erste Auswahl von Algorithmen und potenziell geeigneten Parametern auf fundierten Vermutungen, Erfahrungen und Annahmen beruht.
Die erhöhte Rechenleistung erlaubt es der Maschine heute jedoch, viele verschiedene Lernansätze, z.B. verschiedene Algorithmen/Parameter, auszuprobieren und die beste Wahl für den zugrunde liegenden Fall automatisch zu treffen.

Das “Was”

Data Scientists konzentrieren sich daher mehr und mehr auf das “Was”, wo sich die eigentliche “Kunst” und Unersetzbarkeit der Data Scientists befindet. Hier können weder goldene Regeln noch Automatisierung zum Tragen kommen: Es geht um Kreativität und Erfahrung. Die Wahl des “Was” bedeutet, das Unternehmensziel in eine messbare Größe umzuwandeln, die durch ML-Algorithmen verarbeitet werden kann und die Data Science eng mit dem eigentlichen Unternehmensproblem verknüpft.
Daher befinden sich Data Scientists in einem Wandel: von Data Science Praktikern, die Zeit damit verbringen, Daten zu transformieren und den besten Algorithmus in einer explorativen Weise auszuwählen, hin zu Designern und Entwicklern von datengesteuerten Lösungen, um sehr spezifische Geschäftsziele zu erreichen und einen Mehrwert zu liefern. Die Kontrolle des “Was” macht Data Scientists zur Brücke zwischen dem realen Geschäft und dem abstrakten Datenmeer.

Ist dies die letzte Entwicklung der Data Science und Data Scientists?

Höchstwahrscheinlich nicht. Der nächste Schritt ist vermutlich die Standardisierung und Demokratisierung der Data Science durch Tools, Frameworks und Plattformen, die die Eintrittsbarrieren in diese Disziplin reduzieren. Infolgedessen könnte die Beteiligung nicht-technischer Wirtschaftsexperten an der Entwicklung der oben genannten datengesteuerten Lösungen zunehmen. In diesem Szenario wäre eine weitere Transformation der Data Scientists denkbar. Sie könnten sich zu Schöpfern solcher standardisierter datenwissenschaftlicher Tools und Frameworks weiterentwickeln, die es den weniger technischen “Daten-Abenteurern” ermöglichen, ihre Projekte mit KI und ML zu realisieren, indem Data Scientists ihre Disziplin für jeden zugänglich machen und somit das Ziel verfolgen, jeden zum Data Scientist zu machen.

Der Autor: Dr. Marco Beria arbeitet in der Allianz Group als Data Scientist seit der Etablierung des zentralen Advanced Business Analytics Team vor 5 Jahren. Seine Schwerpunkte in den letzten Jahren lagen hierbei auf Skalierbarkeit, Automatisierung und Standardisierung von strategischen Assets im Bereich der Data Science. Er hält einen Doktortitel der Statistischen Physik und hat im Laufe seiner Promotion wissenschaftliche Artikel in den Gebieten der konformen Feldtheorie und Statistischen Physik verfasst.

Previous articleAutomatische Textanalyse durch Methoden der künstlichen Intelligenz
Next articleWem gehören die Daten im Connected Car?