14. Die Zeitanalyse im Gehirn – Übergang zu RNNs

1. Warum Rekurrenz notwendig ist: Statische vs. zeitabhängige Signalverarbeitung

Künstliche neuronale Netze (KNNs) der ersten Generation verarbeiten ausschließlich statische Eingangssignale. Ein Eingabevektor wird durch das Netz propagiert, und das Ergebnis hängt nur von diesem einen Zustand ab. Solche Modelle eignen sich für Aufgaben wie Mustererkennung in Bildern oder Klassifikation einzelner Datenpunkte, berücksichtigen jedoch keine zeitlichen Veränderungen.

Im realen Leben sind Signale jedoch dynamisch. Sie verändern sich entlang einer Zeitachse, und gerade diese Veränderungen bilden oft die entscheidenden Muster. Sprache, Musik, Bewegungen, visuelle Szenen, emotionale Reaktionen und interne Körperzustände sind zeitabhängige Prozesse. Das Gehirn muss daher nicht nur statische Muster erkennen, sondern Sequenzen, Übergänge, Rhythmen und Verläufe.

Um solche zeitlichen Muster zu verarbeiten, entwickelte die KI‑Forschung rekurrente neuronale Netze (RNNs). RNNs besitzen Rückkopplungsschleifen, die frühere Zustände in die aktuelle Verarbeitung einbeziehen. Dadurch können sie zeitliche Komponenten in Signalen abbilden, erlernen und wiedererkennen. Sie sind damit funktional näher an biologischen Systemen, die ebenfalls rekurrente Schleifen nutzen, um zeitliche Informationen zu integrieren.

 

Das Gehirn arbeitet grundsätzlich rekurrent. Jede Wahrnehmung, jede Entscheidung und jede Bewegung entsteht aus der Integration aktueller Signale mit kurzfristigen und langfristigen Echos vergangener Aktivität. Diese Rekurrenz ist keine technische Ergänzung, sondern ein grundlegendes Prinzip biologischer Intelligenz.

2. Rekurrenz im Gehirn: zwei Systeme, zwei Zeitkonstanten

Das Gehirn verfügt über zwei rekurrente Signalsysteme, die parallel arbeiten und völlig unterschiedliche Zeitkonstanten besitzen. Diese Dualität ist funktional notwendig, weil verschiedene Lern‑ und Verarbeitungsprozesse unterschiedliche Echodauern erfordern.

3. Basalganglien – Kurzzeitechos im Millisekundenbereich

Die Basalganglien erzeugen extrem kurzzeitige rekurrente Signale, typischerweise im Bereich von 10–50 Millisekunden. Diese Echos bestimmen unter anderem das zeitliche Auflösungsvermögen des visuellen Systems. Historisch lag die Wahrnehmungsgrenze bei etwa 18–20 Bildern pro Sekunde (≈ 50 ms Echo). Moderne Generationen zeigen eine feinere zeitliche Auflösung, was sich in der Akzeptanz höherer Bildfrequenzen (60–100 Hz) widerspiegelt. Das Nervensystem hat sich hier innerhalb weniger Generationen funktional angepasst. Die Basalganglien eignen sich damit für schnelle Verstärkungsmodulation, Action Selection und die Sequenzierung motorischer Mikroabläufe – nicht jedoch für langsame Lernprozesse.

4. Papez‑Kreise – Langzeitechos im Minuten‑ bis Stundenbereich

Die rekurrenten limbischen Schleifen des Papez‑Kreises erzeugen deutlich länger anhaltende Aktivitätsmuster. Diese Langzeitechos stabilisieren emotionale, motivationale und episodische Inhalte und liefern die zeitliche Grundlage für Lernprozesse, die Sekunden bis Minuten benötigen. Das Pontocerebellum ist auf solche langen Echos angewiesen, da LTD/LTP‑Mechanismen nicht im Millisekundenbereich arbeiten. Die kurzen Echos der Basalganglien wären hierfür unbrauchbar.

Funktionale Konsequenz 

Die Existenz zweier rekurrenter Systeme mit unterschiedlichen Zeitkonstanten ist keine anatomische Kuriosität, sondern eine funktionale Notwendigkeit. Schnelle und langsame Rückkopplungsschleifen erfüllen unterschiedliche Rollen in der Signalverarbeitung und im Lernen. Ein einziges rekurrentes System könnte diese Anforderungen nicht gleichzeitig erfüllen. Dies zwei Systeme (Basalganglien/Papez-Kreise) sind im Gehirn parallelgeschaltet derart, dass ihr Output gemeinsam die rekurrenten Netze erreicht. Zum Lernen mittels LTP/LTD stehen die Signale der Papez-Kreise zur Verfügung, für die schnelle Erkennung die der Basalganglien.

5. Evolution der Rekurrenz: Von Einzelneuronen zu den ersten Differenzschaltungen

Die frühen Wirbeltiergehirne bestanden nicht aus Netzwerken, sondern aus einzelnen Neuronen, die sensorische Signale direkt an Muskeln oder an autonome Mittelwertsysteme weiterleiteten. Diese Architektur erlaubte einfache Reflexe, aber keine Mustererkennung über die Zeit.

Der entscheidende Schritt erfolgte mit der Entwicklung hemmender Neurone. Durch sie konnten erstmals zwei unterschiedlich lange Signalwege zu einem gemeinsamen Outputneuron geführt werden, wobei einer der Wege hemmend wirkte. Der Laufzeitunterschied zwischen den beiden Wegen führte dazu, dass zeitkonstante Signale sich auslöschten, während zeitliche Veränderungen – also Bewegungen – ein Differenzsignal erzeugten.

Diese Schaltung war die Urform des Basalganglien‑Systems: eine frühe rekurrente Struktur, die Bewegungen erkennen konnte, bevor komplexe neuronale Netze existierten.

Der erste Signalweg entstand aus der Notwendigkeit der motorischen Steuerung. Der zweite, hemmende Signalweg entwickelte sich, weil Mittelwertsysteme des autonomen Nervensystems möglichst viel Input benötigen – einschließlich motorischer Signale. Durch die hemmende Rückprojektion zu den Signallieferanten im Cortex entstand dort bereits ein frühes Differenzsignal, das Bewegungen abbildete.

Im weiteren Verlauf der Evolution wurden die hemmenden Interneurone zu Projektionsneuronen, die im motorischen Ausgangskern (Nucleus ruber) die dort vorhandenen motorischen Signale hemmten. Damit entstand die erste explizite Differenzabbildung der Motorik, die später auf digitalisierte Signale erweitert wurde.

6. Rekurrente neuronale Netze - Grundprinzipien

Nach der Herausbildung der biologischen Convolutional Neural Networks (CNNs) im primären Gehirnsystem entstand die Notwendigkeit, nicht nur aktuelle Muster, sondern auch deren zeitliche Abfolge zu analysieren. Dies wurde durch modifizierte CNNs erreicht, die zusätzlich zum aktuellen Input auch zeitverzögerte Signale als Echos empfangen konnten.

Damit entstand eine neue Klasse von neuronalen Netzen: die Recurrent Neural Networks (RNNs)

Die RNNs markieren somit den Übergang von der rein räumlichen Mustererkennung der CNNs zur zeitlichen Musteranalyse. Erst auf dieser Grundlage konnte später die nächste Evolutionsstufe entstehen – die Transformer-Netze, die komplexe Divergenz- und Parallelverarbeitungen ermöglichen. Gehirn und KI nutzen die gleichen Algorithmen, unterscheiden sich jedoch in der technischen Realisierung.

Die technische Realisierung von RNNs im Wirbeltiergehirn

Bereits im Kapitel über die Entstehung von CNNs im Wirbeltiergehirn wies ich darauf hin, dass es im Wirbeltiergehirn, insbesondere bei Primaten und beim Homo sapiens insgesamt vier Signalkopien gibt, die aus den cortikalen Signalen hervorgehen:

Für die technische Realisierung der biologischen CNNs ist die Signalkopie in den Papez-Kreisen ausschlaggebend.

1. Die Papez-Kreise als Rotationsspeicher

Die Papez-Kreise des limbischen Systems lassen sich als biologische Rotationsspeicher für neuronale Signale verstehen. Ursprünglich entstanden sie aus der Notwendigkeit, den Duft einer Beute für längere Zeit im Gedächtnis zu behalten – ein evolutionärer Vorteil, da sich Geruchssignale im Wasser des Urozeans zu schnell verflüchtigten.

Im Hippocampus wurden diese Duftsignale in eine höherfrequente Signalfolge transformiert. Die Moosfasern bewirkten dabei eine Zeitverzögerung, indem sie die Signale entlang des Axons streckten. Die Schaffer-Kollateralen zapften diese Moosfasern an und konvergierten auf ein gemeinsames Outputneuron, welches die verteilten Aktionspotentiale integrierte und eine höherfrequente Erregung erzeugte.

Diese Erregung wurde dem zugehörigen Papez-Kreis zugeführt und konnte dort über längere Zeit rotieren.

Signalfluss im Papez‑Kreis

  1. Hippocampus
  2. → Fornix
  3. → Corpora mamillaria (Mammillarkörper)
  4. → Tractus mamillothalamicus
  5. → Nucleus anterior thalami
  6. → Cingulum
  7. → Cingulärer Cortex / Gyrus cinguli
  8. → Entorhinaler Cortex / Parahippocampaler Gyrus
  9. → zurück zum Hippocampus

Die Signalzuführung in die Papez-Kreise erfolgte über drei mögliche Eintrittswege.

Über den cingulären Cortex → Cingulum → Hippocampus

Über den entorhinalen Cortex direkt

Über Amygdala / Septum (erweiterter limbischer Kreis)

Aus den Papez‑Kreisen können die rotierenden Signale an das Cerebellum weitergeleitet werden, wozu sie die folgenden indirekten Projektionswege nutzen:

Über den Hypothalamus → Hirnstamm → Cerebellum

Der Papez‑Kreis enthält die Mammillarkörper, die Teil des Hypothalamus sind. Vom Hypothalamus bestehen Projektionen zu:

Diese projizieren massiv in das Cerebellum (v. a. Vermis und Hemisphären).

Über den anterioren Thalamus → Cortex → Pons → Cerebellum

Der Papez‑Kreis sendet über den Nucleus anterior thalami zum cingulären Cortex. Von dort:

Dies ist der wichtigste funktionelle Weg.

Fast alle Signale können den Weg in die Papez-Kreise finden. Der Gyrus cinguli besteht aus Millionen Axonen, von denen jedes einem rotierenden Signal zugeordnet ist.

Bei jedem Umlauf erhält das Cerebellum eine Signalkopie, die ins Moosfasersystem eingespeist wird. Diese Signalkopie ist auch dann noch verfügbar, wenn das ursprüngliche Signal bereits endete. So bewahren die Papez-Kreise Vergangenheitssignale für die Gegenwart, indem sie sie in Rotationsschleifen einfangen und dort längere Zeit als Signalechos rotieren lassen.

Das vorhandene neuronale Netz im Cerebellum entwickelte sich durch die Einspeisung der Signalechos zum Recurrent Neural Network (RNN).

2. Hinweis zum Hippocampus

Der Hippocampus dient im hier beschriebenen Zusammenhang lediglich der Erzeugung von Rotationssignalen, die als Echos auch dann noch aktiv sind, wenn das Ursprungssignal bereits endete. Es gibt Hinweise auf Lernvorgänge, die auf die Existenz neuronaler Netze im Hippocampus hindeuten, doch deren genaue Funktionsweise ist bislang nicht vollständig verstanden. Der Autor dieser Monografie verzichtet daher bewusst auf eine detaillierte Beschreibung und beschränkt sich auf die Feststellung, dass der Hippocampus als Quelle zeitverzögerter Signale eine wichtige Rolle für die Rückkopplung in RNNs spielt.

3. Ergänzung: Warum nicht alle Purkinjezellen dasselbe Signal lernen

Eine immer wiederkehrende Frage für das neue RNN lautet: Warum lernen nicht alle Purkinjezellen dasselbe Signal, obwohl die rotierenden Papez-Signale für alle Purkinjezellen dauerhaft zur Verfügung stehen?

Die Antwort liegt in der Topologie der realen neuronalen Netze. Diese verwenden keine Punkt-zu-Punkt-Verbindungen, sondern eine Bustopologie mit lateraler Hemmung im afferenten Signalweg. Bei RNN ist die laterale Hemmung zudem auch auf die Papez-Kreise ausgeweitet. In einer solchen Struktur werden die Signale nicht kontinuierlich allen Empfängern gleichzeitig zur Verfügung gestellt, sondern die Rotation wird durch die Netzarchitektur immer wieder unterbrochen. Dadurch entstehen zeitliche und räumliche Differenzen im Signalfluss, die verhindern, dass alle Purkinjezellen identische Muster erlernen.

Diese Unterbrechungen sind funktional notwendig: Sie schaffen die Grundlage für Diversität im Lernen und ermöglichen die Spezialisierung einzelner Purkinjezellen auf unterschiedliche Muster.

4. Bustopologie und laterale Hemmung in biologischen neuronalen Netzen

Künstliche neuronale Netze (KNN) nutzen eine Ebenentopologie

Das Gehirn hingegen arbeitet mit einer Bustopologie, die auch in Computern verbreitet ist:

Die Bustopologie biologischer Netze ermöglicht damit eine ökonomische Signalverarbeitung:

Der Unterschied zwischen Ebenentopologie und Bustopologie ist daher fundamental: Während künstliche Netze auf maximale Parallelität setzen, arbeitet das Gehirn mit einer sequentiellen, ökonomischen Signalverteilung, die durch laterale Hemmung zusätzlich abgesichert wird.

Deep Neural Network mit Bustopologie

Abbildung: Deep Neural Network mit Bustopologie (Prinzipschaltbild)

5. Signalspezifische, relative Hemmung im efferenten Signalweg

Die Hemmung im efferenten Signalweg beruht ebenfalls auf dem Hebbschen Prinzip und ist signalspezifisch:

Folgen für die Signalverarbeitung:

Bedeutung für künstliche neuronale Netze:

6. Spracherwerb mittels RNNs im Gehirn

Die Fähigkeit zum Spracherwerb beruht wesentlich auf der zeitlichen Verarbeitung von Signalsequenzen, die durch RNNs im Gehirn ermöglicht wird. Während CNNs räumliche Muster erkennen, sind RNNs in der Lage, zeitlich aufeinanderfolgende Signale zu speichern, zu vergleichen und zu verknüpfen.

Ab hier raus!

Grundprinzipien:

Biologische Umsetzung:

Evolutionäre Bedeutung:

7. Ergänzung: Sprachverständnis bei niederen Wirbeltieren

Aber auch niedere Wirbeltiere entwickeln ein gewisses Sprachverständnis. Hunde oder Katzen reagieren eindeutig auf ihren Namen – sie „verstehen“ ihn im Sinne einer erlernten Lautsequenz. Papageien können sogar ganze Sätze nachplappern. Dies beweist, dass sie Sprache analysieren können, also über RNN‑Strukturen verfügen, auch wenn sie den Sinn dieser Sätze nicht erfassen.

Damit wird deutlich: Die Fähigkeit zur Verarbeitung zeitlicher Lautfolgen ist evolutionär breit verankert. Beim Menschen wurde sie zur Grundlage des Spracherwerbs und der komplexen Sprachproduktion, während sie bei anderen Spezies in reduzierter Form für Kommunikation und Interaktion genutzt wird.

8. Rückführung erkannter Komplexsignale in die Papez-Kreise

Wenn die Originalsignale und ihre zeitlichen Echos im RNN ausgewertet werden, erreicht der Output (unter anderem) den Cortex und absteigend das Cerebellum. Aber ebenso erreichen sie das limbische System mit seinen Papez-Kreisen, wo sie wieder in Signalechos überführt und an das Cerebellum übergeben werden. Dadurch entstehen tief geschichtete CNNs im Gehirn des Menschen, die Phoneme, Wörter, Sätze und Sprache an sich verarbeiten können.

9. Die Rolle des Gyrus cinguli für biologische RNNs

Im Gyrus cinguli verlaufen beim Menschen Millionen Axone, auf denen die Signale in den zugehörigen Papez-Kreisen rotieren. Sie sind der materielle Beleg für die Existenz riesiger neuronaler Netze mit rekurrenter Signaleinspeisung. Doch auch niedere Wirbeltiere müssen bereits Vorstufen dieser Architektur aufweisen, ist doch ein gewissen Sprachverständnis bei etlichen Tierarten nachgewiesen.

CNNs ohne Cerebellumrinde

Personen, die ohne Cerebellumrinde geboren wurden, jedoch ein gut ausgebildetes limbisches System besitzen, können das neuronale Netz in den Kleinhirnkernen durch Integration der limbischen Signale durchaus zu einem CNN ausbauen, so dass sie zur Mustererkennung fähig sind.

Dritter Hauptsatz für biologische neuronale Netze

Mit der Entstehung des Hippocampus und der Papez‑Schleifen begann die Transformation der cerebellären Netzwerke zu rückgekoppelten neuronalen Netzen. Durch die Einführung eines zeitverzögerten Rückkopplungssignals wurde der frühere Systemzustand als zusätzlicher Eingangswert in die Kleinhirnkerne eingespeist. Die Überlagerung von Vergangenheit und Gegenwart erzeugte komplexe Muster, die die zeitliche Struktur der Signale abbildeten und erstmals prädiktive Funktionen ermöglichten.

Monografie von Dr. rer. nat. Andreas Heinrich Malczan