Open Science im Bereich KI: ein Boost für Wissenschaft, Industrie und Gesellschaft

In welchen Bereichen wird der Mensch immer besser sein als künstliche Intelligenz? Diese Frage erhielt ich von Jugendlichen im Projekt „what the FAQ, informatik?” im Rahmen des Wissenschaftsjahres 2022 - Nachgefragt!. Früher hätte ich vielleicht „Kunst und Kreativität” gesagt. Heute antworte ich den Jugendlichen, die mir diese Frage gestellt haben, nicht so leichtfertig. Denn in den letzten Monaten hat sich so viel getan, was ich nie für möglich gehalten hätte! Heute können Algorithmen Bilder generieren, die zumindest ich als Kunst wahrnehme. Ein Beispiel dafür ist die künstliche Intelligenz Stable Diffusion: Mit Stable Diffusion kann ich einen Satz eintippen, und die KI generiert ein Bild. Wenn ich eingebe, dass es ein „Gemälde” oder „Painting” sein soll, dann erhalte ich etwas, das tatsächlich nach einem Gemälde aussieht. Dieser Algorithmus ist derzeit in aller Munde - vor allem, weil er so zugänglich ist: Ich kann die KI als Software auf meinem Laptop installieren oder im Netz nutzen (z.B. unter https://stablediffusionweb.com).
Von   Heidi Seibold   |  Trainerin und Beraterin für Open und Reproducible Data Science   |  Freiberuflerin
19. Dezember 2022

pastedGraphic.pngpastedGraphic_1.png

Bilder generiert mit Stable Diffusion über die Anwendung DiffusionBee. Prompt links: „Painting of a colourful market”. Prompt rechts: „Doctor holding a sign”.

Open Source als Erfolgsrezept

Stable Diffusion ist nicht nur leicht nutzbar, sondern sogar Open Source – das heißt, die KI ist unter einer offenen Lizenz für alle verfügbar (siehe https://github.com/CompVis/stable-diffusion). Mit ihrer Hilfe entsteht derzeit ein ganzer Blumenstrauß von Produkten und Kunstwerken: Suchmaschinen für KI-generierte Bilder (z.B. https://lexica.art/ oder https://www.infinitestockphotos.com/), Plug-Ins für die Bildbearbeitung in Photoshop (https://www.getalpaca.io/) oder GIMP (https://github.com/blueturtleai/gimp-stable-diffusion) sowie die besten Katzenbilder im Stil berühmter Künstler*innen (https://www.kaggle.com/code/steubk/a-stable-diffusion-experiment).  

Demokratisierung von KI

Diese Demokratisierung von künstlicher Intelligenz hat das Team hinter Stable Diffusion von Anfang an mitgedacht. In einem Interview mit dem Podcast digdeep gab Björn Ommer – einer der Köpfe hinter der KI – an, dass dadurch nicht nur Kunst und Bildbearbeitung für mehr Menschen zugänglich gemacht werden sollen, sondern auch die allgemeine KI-Forschung von der Open-Source-KI profitieren könnte. Diese Art der künstlichen Intelligenz sei noch nicht perfekt und viele Probleme nicht gelöst, aber dank der Demokratisierung hätten viele Forschende Zugang zu einem bildergenerierenden Algorithmus. Diese Art von Algorithmen waren bisher aufgrund von hierfür hoher benötigter Rechenleistungen nur Wenigen vorbehalten. 

Offene KI für Krisenbewältigung

Nicht nur für den KI-Experten Björn Ommer ist offene Wissenschaft ganz natürlich, sondern auch die Jugendlichen im FAQ-Informatik-Projekt fragten sich, warum Forschende nicht transparenter arbeiten. Und das zu Recht – denn sie stehen vor gewaltigen Herausforderungen! Allen voran ist hier der Klimawandel zu nennen, der die junge Generation treffen wird und für den wir und sie Lösungen finden müssen. Diesen Herausforderungen und Krisen können wir uns nur gemeinsam stellen, und zwar mit der Hilfe aller. Das gelingt nur, wenn der Zugang zu wichtigem Wissen für alle zugänglich wird. Vorhersagestarke KI können dazu einen wichtigen Beitrag leisten. Denken wir zum Beispiel an Vorhersagen von Überflutungsgebieten oder die Planung der Stromversorgung mit erneuerbaren Energien. Wenn auch solche KI und die zugrundeliegenden Daten offen und nutzbar sind, schaffen wir es vielleicht, unseren blauen Planeten zu schützen. 

Was ist Open Science?

Treten wir einen Schritt zurück: Was bedeutet eigentlich offene Wissenschaft oder – wie meist gesagt wird – Open Science? Open Science hat viele Bestandteile: offene Daten (Open Data), einen offenen Code (Open Source), einen offenen Zugang zu Forschungsergebnissen (Open Access) und so weiter. Welchen Einfluss ein offener Code (Open Source) haben kann, haben wir am Beispiel von Stable Diffusion bereits gesehen. Auch der offene Zugang zu Daten und anderen Forschungsergebnissen kann zur Beschleunigung von Wissenschaft beitragen. Ein Beispiel dafür konnte während der COVID-19-Pandemie beobachtet werden, als Forschende und Ämter Daten (z.B. zu Fallzahlen) miteinander öffentlich teilten und Forschungsergebnisse schnell und offen zugänglich veröffentlicht wurden.  

Hinter Open Science steht aber noch etwas anderes: ein Wandel hin zu mehr Zusammenarbeit und Team Science, weg von Konkurrenzdenken und Forschung im Elfenbeinturm. Heute gibt es aus gutem Grund keine Einsteins und Humboldts mehr, die wissenschaftliche Fragen wie einzelne Helden beantworten. Die Helden von heute sind große Teams wie die Forschenden im Kernforschungszentrum CERN, wo jede*r einen kleinen Beitrag für eine große Frage leistet und schon mal Hunderte von Wissenschaftler*innen an einem einzigen wissenschaftlichen Artikel mitarbeiten.
Auch hinter Stable Diffusion steht kein einzelner Forschender im Elfenbeinturm, sondern eine große Kollaboration.

Open Science braucht sozialen Wandel und neue Skills

Was hindert KI-Forschende dann noch daran, ihre Forschung zu öffnen? Es gibt soziale Gründe, aber auch Wissensmangel (im rechtlichen sowie technischen Sinne). 

Zu den sozialen Gründen gehören das Anreizsystem in der Wissenschaft – in dem die Anzahl der Publikationen zählt, nicht aber die Qualität –, aber auch ganz menschliche Ängste, wie die Angst davor, sich zu blamieren. In meinen Kursen höre ich immer wieder den Satz: „Ich stelle meinen Code nicht online, weil ich Angst habe, dass mich Leute kritisieren werden.” Das ist verständlich, doch widerspricht es gleichzeitig der grundlegenden Idee von Wissenschaft. Wissenschaftliches Arbeiten setzt kritisches Hinterfragen und das Aufbauen auf bereits Bekanntem voraus. 

Der Wissensmangel ist im Bereich KI geringer als in anderen Feldern, da technisches Wissen sehr bei der Veröffentlichung von Daten und Codes hilft. Wenn ich meinen Code ohnehin schon mithilfe von Versionskontrollsystemen wie Git verwalte, ist die Veröffentlichung auf Plattformen wie GitHub oder Zenodo nur einen Klick entfernt. Aber auch in der KI stellen große Fragen wie „Wem gehören die generierten Daten?” oder „Welche Lizenz soll ich für meinen Code vergeben?” immense Hürden dar. Rechtsabteilungen sind oft nicht die beste Hilfe, da sie noch immer auf Patente statt auf offene Wissenschaft fokussiert sind.

Eine Vision für die Zukunft

Wie geht es also weiter? Junge Wissenschaftler*innen fordern offene Wissenschaft (https://doi.org/10.1186/s13059-017-1351-7) und für die Krisenbewältigung müssen wir alle an einem Strang ziehen. Können wir warten, bis die junge Generation am Zug ist und die Alten in Rente gehen? Ich denke nicht. Es ist schon jetzt viel im Wandel. Wer Forschungsgelder von der EU erhält, muss Open Science betreiben und große KI-Konferenzen publizieren vermehrt ausschließlich Artikel, bei denen der Code verfügbar ist. 

Immer mehr Forschungseinrichtungen bieten Hilfestellung bei Open Science an und bilden ihre Forschenden in Open-Science-Kursen weiter. Wir sind auf einem guten Weg und mit Erfolgsprojekten wie Stable Diffusion bekommen wir auch immer mehr Vorbilder, die man nachahmen kann.

Dr. Heidi Seibold (heidiseibold.com) hilft Forschenden, Forschungsteams und R&D Abteilungen bei offener Innovation und reproduzierbaren wissenschaftlichen Arbeiten. Nach acht Jahren Forschung in Biostatistik und Machine Learning ist sie heute selbstständig und bietet Trainings, Consulting und Events an. In ihrem Podcast “>reboot academia” geht es um die Zukunft von Forschung und Lehre.

Um einen Kommentar zu hinterlassen müssen sie Autor sein, oder mit Ihrem LinkedIn Account eingeloggt sein.

33636

share

Artikel teilen

Top Artikel

Ähnliche Artikel