KI & Knowledge Graphen: Mit Kontext noch smarter

bei

 / 6. December. 2019

Alexa und Siri sind nur ein kleiner Vorgeschmack wie Künstliche Intelligenz unser Leben verändern wird. Doch bevor eine Maschine tatsächlich intelligent agieren kann, muss sie lernen. Das Trainingslager dazu ist ein Pool an vernetzten Daten, der Kontext schafft, Zusammenhänge nachvollziehbar abbildet und von Algorithmen in jede erdenkliche Richtung abgefragt werden kann. Knowledge Graphen bieten hier das passende Datenmodell.  

Zunächst einmal, was ist denn überhaupt künstliche Intelligenz? Künstliche Intelligenz (KI) ahmt menschliche Intelligenz nach, um Probleme verschiedener Art zu lösen. Mit künstlicher Intelligenz können also gezielt Vorhersagen getroffen werden. Grundsätzlich wird zwischen schwacher und starker KI unterschieden. Schwache KI kann eine einzelne Aufgabe sehr gut ausführen. So planen Systeme beispielweise die optimale Route im Navigationssystem oder geben individualisierte Filmempfehlungen auf Netflix. Im Gegensatz dazu haben starke KIs verschiedene Skills rund um Planung, Sprachverständnis, Objekterkennung, Lernen oder Problemlösung und nähern sich damit ein Stück mehr der menschlichen Intelligenz an. Heute eingesetzte KI-Lösungen fallen meist in die schwache KI-Kategorie, werden aber in ihrer Anwendbarkeit auf neue Situationen immer vielfältiger und im Laufe der Zeit leistungsfähiger.

Wie wichtig ist Kontext?

KI braucht Kontext und muss mit Informationen gefüttert werden, die für das Lösen von Problemen relevant sind. Autonomes Fahren ist ein gutes Beispiel. Für das intelligente System im selbstfahrenden Auto ist Regen tatsächlich nicht gleich Regen. Es gibt unterschiedliche Formen von Regen, an die sich das Fahrzeug anpassen muss: leichter Nieselregen, kurzer Sommerschauer, Eis- und Schneeregen, Regen und Hagel, Sturmböen mit Regengüssen. Mit den richtigen Kontextinformationen zu meteorologischen Daten, Datum und Ort sowie der Fahrbahnbeschaffung und Verkehrslage kann eine KI die Daten kombinieren und den Fahrer sicher ans Ziel bringen. Um also eine Situation zu verstehen und dieses Wissen auf neue Situationen anzuwenden, sind eine Vielzahl an peripheren und miteinander verknüpften Informationen zu berücksichtigen. Kontext ist hier essentiell für die Entscheidungsfindung, sowohl für den Menschen als auch für die künstliche Intelligenz.

Graphen liefern das Gesamtbild

Welche Datenpunkte sind relevant für die KI? Und wie mache ich den wichtigen Kontext für die künstliche Intelligenz verfügbar? Oder genauer, wie schafft man es unterschiedliche Daten so miteinander zu verknüpfen, dass Zusammenhänge abgefragt und Entscheidungen basierend auf Kontextinformationen in Millisekunden getroffen werden können? In den letzten Jahren hat sich hier insbesondere Graphtechnologie als passende Datenbank-Architektur herauskristallisiert. Mit einer Graphdatenbank lassen sich sowohl einzelne Datensätze als auch die Zusammenhänge zwischen den Daten visualisieren und stark vernetzte Informationen abfragen. Sie bilden die Basis für smarte Anwendungen und kommen in den unterschiedlichsten Bereichen zum Einsatz – von der Betrugsaufdeckung in Banken bis zum Supply Chain Management in der Smart Factory.

Das Datenmodell lässt sich besonders gut am Beispiel eines Online-Shops darstellen: Der Graph setzt sich aus Knoten („Produkt“, „Farbe“, „Preis“) und Kanten (z.B. „kaufen“, „bewertet“) zusammen. Jedem Knoten und jeder Kante lassen sich zudem Attribute wie „rot“ oder „XY Euro“ hinzufügen. Sucht nun der Kunde nach einer roten Jacke für 100 Euro, können die einzelnen Informationen in Kombination miteinander abgefragt werden. Je mehr Daten miteinander verknüpft werden, desto mehr Kontext entsteht, den die Algorithmen abfragen und für Entscheidungen heranziehen können.

Knowledge Graphs: Die richtigen Entscheidungen

Die sogenannten Knowledge Graphen helfen situationsgerechte Antworten zu geben. Wird beispielsweise im Kundenservice eine Störung eines Geräts gemeldet, müssen Techniker nicht unbedingt jedes Problem von Grund auf neu lösen, sondern können ähnliche Vorfälle heranziehen und bewährte Lösungswege anwenden – und zwar in Echtzeit. Daten sind nicht automatisch Wissen und nicht alle Daten sind gleich relevant. Um kontextbezogene Informationen zu gewinnen, müssen relevante Attribute und Datenknoten um eine Abfrage herum verknüpft werden. Des Weiteren sind die Graphen dynamisch und verstehen, was Entitäten miteinander verbindet. Deshalb ist es nicht notwendig, jede neue Information manuell zu programmieren. Ein Knowledge Graph kann vielmehr selbstständig sinnvolle Verknüpfungen zwischen Attributen herstellen. Die Metadaten im Graphen helfen Antworten auf spezifische Probleme zu finden, ohne die Suchanfrage selbst genau definieren zu müssen. Der Weg zur Antwort bleibt dabei nachvollziehbar und verständlich.

In der Praxis finden sich Knowledge Graphen in unterschiedlichen Formen.

Bildquelle: https://www.lucyturpin.de/wp-content/uploads/2019/10/Neo4j_KnowledgeGraphen.jpg

 

  • Context-Rich Knowledge Graph: Wissensschatz in Unternehmen bergen

Ein Context-Rich Knowledge Graph hilft dabei, interne Dokumente und Dateien mit Metadaten zur Klassifizierung zu versehen. Das ist vor allem für Unternehmen spannend, die über ein hohes Maß an Wissen in Form von heterogenen Dokumenten verfügen, wie beispielweise die NASA. Um Ingenieuren den Wissensstand aus über 50 Jahren Raumfahrtforschung zugänglich zu machen, nutzt die Organisation für ihre Lessons Learned-Datenbank die Graphtechnologie von Neo4j.

  • External Sensing Knowledge Graph: Die Gesamtlage im Blick

Eine weitere Form von Knowledge Graphs sind External Sensing Knowledge Graphen. Diese fassen externe Datenquellen zusammen und ordnen sie internen Einheiten von Interesse zu. Generell ist es möglich externe Informationsquellen zu integrieren: die Informationen werden erfasst, kontextrelevant gefiltert und schließlich für Abfragen im Graphen abgelegt.

Sie unterstützen Unternehmen beispielsweise bei Supply-Chain-Risiken und bilden das gesamte Liefernetzwerk im Graphen ab. So kann untersucht werden, wie sich lokale Engpässe auf die gesamte Lieferkette auswirken und an welchen Standorten alternative Lieferanten bereitstehen. Neben der Überwachung der Lieferkette werden External Sensing Knowledge Graphen zur Analyse des Compliance-Risiken, der Auswirkungen von Marktaktivitäten und Vertriebsmöglichkeiten eingesetzt.

  • Natural Language Processing Knowledge Graph: Halo, I bims!

Das KI-System von Morgen soll nicht nur intelligente Entscheidungen treffen, sondern auch mit uns sprechen können, oder vielleicht noch wichtiger: unsere Sprache verstehen. Natural Language Processing (NLP) Knowledge Graphen kommen hier zum Einsatz, um die Komplexität und Nuancen der menschlichen Sprache innerhalb eines Datenmodells abzubilden und für das KI-System abfragbar zu gestalten. Im NLP-Graphen wird eine Ontologie aufgebaut, die unternehmensspezifische Fachbegriffe, Produktnamen, Branchenkürzel, Sachnummern und sogar gängige Rechtschreibfehler erfasst.

Der Hersteller Caterpillar verwendet NLP-Knowledge Graphen bereits für die Wartung und Instandhaltung seiner Baufahrzeuge. Bei jeder Reparatur einer Caterpillar-Maschine werden sowohl Beanstandungen als auch die Fehleranalyse und Lösung genaustens in einem Serviceheft dokumentiert. Über ein graphbasiertes NLP-Tool lassen sich die relevanten Informationen aus über 27 Mio. Dokumenten abfragen sowie verborgene Zusammenhänge und Tendenzen aufdecken. Dank der intelligenten Analyse der Berichte kann das System vordefinierte Maßnahmen empfehlen.

Fazit

Heute findet sich schwache KI schon in vielen smarten Anwendungen. Der Weg zur tatsächlichen KI mag noch weit erscheinen, doch Knowledge Graphen, NLP und Machine Learning legen schon jetzt das Fundament für die Zukunft – sei es bei der Entscheidungsfindung, dem Wissensmanagement oder dem Verstehen und Interpretieren der menschlichen Sprache.

 

Dirk Möller ist seit über 20 Jahren in der IT-Branche im Bereich NoSQL und Graphdatenbanken unterwegs. Als Area Director of Sales CEMEA bei Neo4j unterstützt Dirk Möller Kunden, bestehende Datenbanklösungen zu ersetzen, Kosten einzusparen und echten Mehrwert aus ihren Daten zu gewinnen.