Künstliche neuronale Netze versuchen bekanntlich, ein biologisches Netz von Neuronen zu imitieren. Dabei werden zentrale Eigenschaften des biologischen Netzes heraus gegriffen:
- formelle Reduktion der neuronalen Verbindungen auf Graphen und formalisierte neuronale Architekturen (Hopfield-, Kohonen-, Elman-Netze u.a.)
- formelle Reduktion der Neuronen auf binäre Schalter
- Absehen von der biochemischen epi-neuronalen Regulation der neuronalen Aktivität, insbes. durch Astrogliazellen
- veränderliche Gewichtung der neuronalen Verbindungen, um der Hebbschen Korrelationsregel gerecht zu werden („neurons wire together if they fire together“): die Dynamik der neuronalen Aktivität wirkt zurück auf die neuronale Architektur
- Reduktion der neuronalen Informationsverarbeitung auf die lineare Algebra n-dimensionaler Vektorräume, um Entscheidungsoberflächen (decision surfaces) im n-dimensionalen Vektorraum zu finden.
Aus der notwendigen Reduktion der Eigenschaften biologischer Netze auf künstliche neuronale Netze folgen grundsätzliche Einschränkungen der potentiellen Reichweite der aktuellen Künstlichen Intelligenz:
- Der Energie- und Zeitverbrauch steigt nichtlinear mit dem Anwachsen der Problemstellung
- Die Anpassung des Systems erfolgt durch den Programmierer bzw. Ingenieur: die Bewertungsfunktion, etwa als Backward-Propagation umgesetzt, muss vorgegeben werden
- Die Informationsverarbeitung in einem neuronalen Netz erfolgt wenig effektiv durch Versuch und Irrtum
- Das überwachte, nicht überwachte sowie das Reinforcement Learning brauchen eine große Menge an Daten, bis die gewünschte Gewichtung der neuronalen Verbindungen erreicht ist
- Begrenzte Kapazität: es sind nur eine bestimmte Anzahl von Mustern im neuronalen Netz speicherbar, etwa in einem Hopfield-Netz 0.14n
Wie können diese grundsätzlichen Einschränkungen umgangen werden? Hier hilft zunächst ein Vergleich mit biologischen Systemen – was geschieht dort anders? Was könnte in Zukunft auch in ein künstliches Netz übernommen werden?
- Der Energie- und Zeitverbrauch kann minimiert werden, wenn die Wirkung als Produkt aus Energie und Zeit minimiert wird. Ein biologisches neuronales Netz ist kein thermodynamisches System: hier wird die Wirkung durch die Verarbeitung komplexer Information Eine sog. Ordo-Dynamik komplexer Systeme harrt freilich (noch) ihrer Ausarbeitung.
- Physikalisch spricht neben der Wirkungsminimierung durch komplexe Informationsverarbeitung in einem biologischen Gehirn auch die Geschwindigkeit der Anpassung der neuronalen Architektur sowie der nicht-binäre Charakter der Informationsverarbeitung dafür, dass parallel zur klassischen Informationsverarbeitung auch eine topologische Quanteninformationsverarbeitung stattfindet
- Ein biologisches Gehirn ist auch kein klassischer Computer. Vielmehr organisiert sich ein biologisches neuronales Netz durch sich selbst: es gibt keine extern implementierte Bewertungsfunktion.
- Ein Neuron ist kein binärer Schalter, sondern ein komplexes System von zahlreichen Ereignissen, die miteinander zusammen wirken (Synergetik).
- Auch wird Information nicht binär, sondern holistisch kodiert und repräsentiert: so gibt es im biologischen neuronalen Netz stets mehrere mögliche neuronale Aktivitätsmuster, die demselben Grundmuster (i.S. der „Lösung“ eines Problems) entsprechen.
Um der Begrenzung der aktuellen KI entgegen zu wirken, kann die Fokussierung auf die topologische Informationsverarbeitung weiter helfen. Daher soll eine Definition der komplexen Information (CI = Complex Information) vorgeschlagen werden.
Im Wesentlichen führt der Vorschlag dazu, dass die Bewertung des Systemzustandes eines neuronalen Netzes nicht mehr durch eine Bewertungsfunktion erfolgt, sondern anhand der komplexen Information: so soll zwischen verschiedenen komplexen Mustern selektiert werden und nicht mehr zwischen 2N binären Zuständen.
Ein weiterer Vorteil wäre die drastische Reduzierung der Trainingszeit eines KI-Systems: die komplexe Information würde es dem System erlauben, das gesuchte Muster bereits nach ein bis zwei Einschwingvorgängen einzunehmen. Auch wären keine immensen Datenmengen mehr zwecks des Trainings des neuronalen Netzes erforderlich; ebenso wäre die Wirkung durch unmittelbare komplexe Informationsverarbeitung drastisch reduziert.
Die komplexe Information ist für die künftige KI unserer Einschätzung nach zentral. Sie hat folgende Eigenschaften:
- Die komplexe Information kann als komplexe (geometrische und algebraische) Topologie verstanden werden.
- Die komplexe Information ist holistisch und nichtlokal. Das kann anschaulich durch das Tribar von Roger Penrose visualisiert werden, bei der die Nicht-Lokalität der Unmöglichkeit der Figur identifiziert werden muss. Eine weitere Visualisierung wäre das Möbius-Band , bei der die Verdrehung nichtlokal ist : das Möbius-Band ist ein Beispiel für ein sog. nicht-triviales Vektor-Bündel, das durch „Zusammenkleben“ von trivialen Bündeln entsteht. Dieses „Zusammenkleben“ kann mathematisch exakt definiert werden mittels Techniken wie zB. dem „Push-Out“ oder der unten behandelten „Garben-Kohomologie“ ( Sheaf Cohomology ).
- Die komplexe Information ist höher-dimensional und definiert einen komplexen Möglichkeitsraum eine Menge von korrelierten Untermengen, die die analoge Projektion der komplexen Information darstellen.
- Die komplexe Information kodiert die Relationen (zwischen Bits, aber auch zwischen QuBits) und definiert begrenzt somit die Menge möglicher Muster.
Topologie
Was ist nun Topologie? Sie wird auch als Rubber Sheet Geometry bezeichnet, da Räume, die durch stetige Deformationen auseinander hervorgehen, als „gleich“ angesehen werden. Daher ist es der Topologie inhärent, dass sie invariant unter stetigen Deformationen ist (Dehnung, Stauchung, Verdrehung, aber nicht Zerreißen). Dies scheint auch im biologischen visuellen System „implementiert“ zu sein, da etwa Menschen mühelos Objekte erkennen können, auch wenn sie im Raum aus verschiedenen Perspektiven betrachtet werden, oder eben stetig deformiert sind, z. B. Buchstaben-Erkennung: ein A ist beispielsweise topologisch ein Loop mit zwei Beinen, und dies gilt auch, wenn das A völlig anders geschrieben wird.
Komplexe Information des
Sehr mächtig wurde ein Teilgebiet der Topologie, als algebraische Invarianten definiert wurden: die sog. Kohomologie-Gruppen (Algebraische Topologie), mit deren Hilfe ehedem schwierige mathematische Sätze zu Übungsaufgaben von Mathematik-Studenten wurden, z. B. der Brouwer’sche Fixpunktsatz, der in der Spieltheorie den Beweis der Existenz eines Nash-Gleichgewichtes liefert. Man beachte, dass es unendlich viele solcher Gruppen gibt: sei die Menge der natürlichen Zahlen.
Man kann diese Kohomologie-Gruppen verwenden, um nicht-lokale (d.h. globale) Eigenschaften zunächst nur des Anschauungsraumes mathematisch rigoros zu fassen. Wir nennen diese die Komplexe Information des . Als erstes Beispiel solcher Eigenschaften betrachten wir das Phänomen, dass es möglich ist, auf der Zeichenebene Figuren zu zeichnen, die sich jedoch NICHT physikalisch im Raum realisieren lassen, sog. unmögliche Figuren, z. B. das Tribar von Roger Penrose, oder auch Zeichnungen von M.C. Escher .
Die Kohomologie-Gruppen liefern uns ein globales Maß, um den Grad der in einem Bild enthaltenen Unmöglichkeit zu berechnen. Wir behaupten, dass herkömmliche Bilderkennungssysteme, z. B. Deep-Learning-Netze in selbst-fahrenden Autos, solche Phänomene nicht „erkennen“ ,d.h. semantisch verstehen können, da Deep-Learning-Netze nur lokal einzelne Pixel verarbeiten.
Wie definiert man die o.g. komplexe Information bzw. die Erste Kohomologie-Gruppe? Man bricht die Figur in Stücke und klebt diese dann wieder zusammen, so dass die detaillierte Gesamtstruktur der Klebestellen in die Definition einfließt.
Wir schreiben für die Erste Kohomologie-Gruppe :
In diesem Beispiel besteht aus Äquivalenzklassen von positiven reellen Zahlen, sie enthält also die reelle Zahl 1 (schärfer: die Äquivalenzklasse der 1) .
Dann gilt folgender Satz :
Der Beweis findet sich in Referenz [1] .
Der Satz ermöglicht eine mathematisch rigorose Entscheidung, ob eine gezeichnete Figur im Raum realisiert werden kann, oder nicht. Als erstes Beispiel für eine Komplexe Information können wir nun definieren:
Definition: Die Komplexe Information des ist
Die Untersuchung der höheren Kohomologie-Gruppen auf ihre Nützlichkeit für noch komplexere KI-Probleme wird von uns aktuell weiterbetrieben. Wir sind der Überzeugung, dass die künftige KI nicht um die Implementierung der komplexen Information und –verarbeitung umhin kommen wird. Schließlich wird dadurch die holistische Identifikation von Perzepten ebenso ermöglicht wie die Zuordnung bzw. Gruppierung von Inputs auch ohne den o.g. Trainingsaufwand mit einer möglichst hohen Datenmenge.
Quellen und Referenzen:
[1] On the Cohomology of Impossible Figures , R. Penrose , 1991, Structural Topology, 17, 11-16
[2] Algebraic Geometry, R. Hartshorne,1977, GTM 52, Springer
[3] Twistor Theory and Field Theory, R. Ward, R. Wells Jr, 1995, Cambridge U Press
[4] Topological Quantum Field Theory, Nonlocal Operators, and Gapped Phases of Gauge Theories, Gukov, A. Kapustin, 2013, arXiv:1307, 4793v2 [hep-th]
[5] Introduction to Topological Quantum Computing, Jannis K. Pachos, 2012, Cambridge U Press
Um einen Kommentar zu hinterlassen müssen sie Autor sein, oder mit Ihrem LinkedIn Account eingeloggt sein.