Wie man in Data Science weiterkommt: Was sind die fünf wichtigsten Fähigkeiten?

Der Arbeitsmarkt für Data Scientists ist wettbewerbsintensiver denn je. Mit bestimmten Fähigkeiten heben Sie sich von Ihren Mitbewerbern ab.
Von   Master of Science in Informatik Brooke Wenig   |  Director, Machine Learning Practice   |  Databricks
26. Mai 2022

Personalisierte Empfehlungen und Werbung, Suchanfragen oder Betrugs- und Bilderkennung – maschinelles Lernen (ML) ist heute untrennbar mit unserem täglichen Leben verbunden, auch wenn es nicht immer offensichtlich ist. Laut einem Bericht des ISG-Anbieters Lens Analytics aus dem Jahr 2020 ist die Nachfrage nach Data Scientists in Deutschland in den letzten Jahren aufgrund der zunehmenden Verbreitung von ML in unserem täglichen Leben explodiert.

Die Anforderungen an Data Scientists sind hoch. Es wird mehr erwartet als ein bisschen Rechnen und Programmieren. Soft Skills, soziale Kompetenz und eine Vision sind für diesen Job sehr wichtig. Was sind also die fünf wichtigsten Fähigkeiten, die jemand braucht, um im Bereich Data Science erfolgreich zu sein?

 

1. Verständliche Kommunikation

 

Um als Data Scientist erfolgreich zu sein, ist die Fähigkeit zu kommunizieren mindestens so wichtig wie das technische Know-how. Man muss in der Lage sein, technische Details sowohl einem fachkundigen als auch einem nicht fachkundigen Publikum zu erklären und Vertrauen in das Programm zu schaffen, indem man zwischen diesen Zielgruppen Brücken baut.

Hilfreich ist es zum Beispiel, Brücken zum Alltag zu schlagen, also zu Dingen, mit denen jeder etwas anfangen kann, unabhängig von seinen technischen Kenntnissen. Abstrakte oder allzu technische Vergleiche sind für die meisten Menschen nicht sehr einprägsam und verfehlen daher ihr Ziel.

Jeder im Unternehmen sollte den Mehrwert verstehen, den ein Data Scientist bringt. Dabei geht es nicht in erster Linie darum, wie zum Beispiel Apache Spark im Detail funktioniert. Vielmehr geht es darum, ein Bewusstsein für Data Science und deren Anwendung zu schaffen. Man muss in der Lage sein, einen Business Case zu erstellen, damit auch Laien den Wert von Daten verstehen können.

 

2. Die Trends im Auge behalten

 

Die Zahl der zu besetzenden Stellen hat zugenommen und wird weiter zunehmen. Das Problem mit der Situation auf dem Arbeitsmarkt ist vielmehr, dass sich die Ausbildungsprogramme nicht ausreichend an der Praxis in der Branche orientieren und somit nicht alle Fähigkeiten erlernt werden, die für den Job erforderlich sind.

Zu den Schlüsselkompetenzen gehören Kenntnisse über das Sammeln und Beschriften von Daten, den Umgang mit Einsatzbedingungen, die Modellinfrastruktur, die Überwachung und die Modellumschulungspipelines. Hidden Technical Debt in ML Systems, ein Bericht von Google, beschreibt dieses Phänomen. Darin heißt es, dass etwa 5 Prozent der realen ML-Systeme aus ML-Code bestehen, während der Rest Glue-Code zur Unterstützung dieser ML-Systeme ist.

Daher sollte jeder, der im Bereich Data Science arbeitet, stets die aktuellen Trends und Entwicklungen in Forschung, Industrie und Politik verfolgen und lernwillig bleiben. In anderen Bereichen ist das einmal Gelernte für eine lange Zeit nützlich und kann immer wieder angewendet werden. In der Informatik, und noch schlimmer in der Data Science, sind die meisten Technologien nach etwa sieben Jahren veraltet. Und diese rasante Entwicklung wird sich in den kommenden Jahren noch weiter beschleunigen. Deshalb ist es hier viel wichtiger, sich an Trends und Entwicklungen anpassen zu können. Flexibilität im Kopf und bei den eingesetzten Fähigkeiten ist der Schlüssel.

 

3. Konzentrieren Sie sich zu Beginn auf das Wesentliche

 

Die rasanten Fortschritte im Bereich des maschinellen Lernens treiben die Datenwissenschaftler zu immer ausgefeilteren Tools mit unendlich vielen Funktionsmöglichkeiten. Für den Anfang sollte man jedoch zunächst eine stabile Basis mit entsprechenden Metriken bereithalten. Einfache Strukturen wie die Vorhersage des Mittelwerts bei Regressionsproblemen oder die Vorhersage der Klasse bei Klassifizierungsproblemen sind dafür ausreichend. Aber man muss genau hinschauen: Wenn man für ein bestimmtes Problem eine Vorhersagegenauigkeit von 90 Prozent hat, aber in 99 Prozent der Fälle richtig liegt, weil man immer das Gleiche vorhersagt, ist das nicht sehr aufregend. Genauigkeit ist nicht das Maß aller Dinge.

Die entscheidende Frage ist, wie man Vertrauen in ML-Systeme aufbauen kann. Dazu muss man einen transparenten Benchmark entwickeln, der die individuelle, produktrelevante Bewertung vereinfacht. Da die Genauigkeit in bestimmten Fällen keine Optimierung darstellt, müssen unter Umständen andere Kriterien herangezogen werden. So ist beispielsweise der F1-Score ein geeigneter Maßstab, der sowohl die Genauigkeit als auch die Wiedererkennung berücksichtigt und nicht nur die absolute Anzahl der richtigen Vorhersagen. Wenn diese Grundwerte feststehen, sichert man sich nach unten ab und verfügt über eine zuverlässige Vorhersageleistung des maschinellen Lernens.

 

4. Strukturiert vorgehen

 

Data Scientists verzetteln sich gerne in eifriger Modellierung und verlieren dabei manchmal das Wichtigste aus den Augen: das ständige Hinterfragen und Verstehen der Daten, im konstruktiven Austausch mit verschiedenen Stakeholdern und Experten.

Konzentrieren Sie sich auch nicht zu voreilig auf das technische Problem. Anstatt über die Wahl der Programmbibliothek zu diskutieren, sollte man sich zuerst mit der Anwendbarkeit befassen. Bevor man auf die technischen Details eingeht, sollte man zunächst klären, wie bestimmte Modelle eingesetzt werden können und wie sie den Erfolg eines Unternehmens steigern. Man muss immer eine ganzheitliche Sicht auf die Daten und das gewünschte Ergebnis haben, auf das man hinarbeitet.

Schließlich ist es noch wichtig zu wissen, woher die Daten stammen, wie sie erhoben wurden, und dann genau zu planen, wie sie verwendet werden können und wie nicht.

 

5. Die Wahl des richtigen Aufgabenbereichs

 

Ein gutes Team ist in der Lage, sich gegenseitig zu ergänzen. Jeder hat seine Stärken und Schwächen. Aber natürlich braucht man auch neue Talente, die Innovationen und Ideen einbringen.

Irgendwann muss sich jeder spezialisieren. Das Gebiet der Data Science umfasst so viele Aspekte, dass es unmöglich ist, den Überblick über alle Entwicklungen zu behalten. Durch die Wahl eines Spezialgebiets macht man sich zu einem hochqualifizierten Ansprechpartner für bestimmte Themen wie ML, NLP oder Computer Vision. Eine gewisse Leidenschaft für das Thema ist unabdingbar, ebenso wie ein spezifisches Fachwissen in einem hochaktuellen und umfassenden Bereich.

Um sich von der Masse abzuheben und mehr zu bieten, können sich Data Scientists durch die Entwicklung spezifischer Data-Science-Tools, insbesondere Low-Code- und No-Code-Lösungen, profilieren. Auf diese Weise verbessern sie ihre Effizienz und Produktivität in geschäftlichen und technischen Bereichen.

Data Scientists sind ohnehin gefragter denn je. Aber wenn Sie die oben genannten Eigenschaften in Ihrer Person vereinen können, wird Ihre Expertise äußerst gefragt sein. Das ist Fachkompetenz, die die richtigen geschäftlichen und datenbezogenen Fragen stellt, eine solide Ausgangsbasis und zugehörige Metriken aufbaut und die eigene Spezialisierung nutzt, um die Ergebnisse effektiv an die Beteiligten zu kommunizieren.

Brooke Wenig ist Director, Machine Learning Practice bei Databricks. Sie leitet ein Team von Datenwissenschaftlern, die groß angelegte Pipelines für maschinelles Lernen für Kunden entwickeln und Kurse über bewährte Verfahren für verteiltes maschinelles Lernen geben.

Um einen Kommentar zu hinterlassen müssen sie Autor sein, oder mit Ihrem LinkedIn Account eingeloggt sein.

28382

share

Artikel teilen

Top Artikel

Ähnliche Artikel