Signaltheorie der Intelligenz

4 Signale in Raum und Zeit

Neuronale Signale verändern sich fortlaufend. Jede Auswertung muss diese Zeitabhängigkeit berücksichtigen. In künstlichen Transformern werden alle Signale, die zu einem bestimmten Zeitpunkt gleichzeitig aktiv sind, zu einer Einheit zusammengefasst: dem Token. Da jedes Einzelsignal indiziert ist, lässt sich ein Token als Vektor darstellen. Auch im Wirbeltiergehirn können gleichzeitige Aktivitätsmuster formal als Token aufgefasst werden.

4.1 Token als flüchtige Informationseinheiten

Token sind die kleinsten Informationseinheiten sowohl künstlicher als auch biologischer Transformer. Sie repräsentieren immer nur den Zustand eines Systems in einem einzigen Moment. Ein Token ist daher keine dauerhafte Größe, sondern eine Momentaufnahme des Aktivitätsmusters vieler Neurone eines Tokengebiets.

Verfolgt man die Aktivität dieser Neurone über eine Zeitreihe hinweg, entsteht eine Sequenz von Tokens, die die zeitliche Veränderung des Signals abbildet. Künstliche Transformer benötigen stets eine solche Tokenfolge, um zeitliche Strukturen zu erkennen.

Damit das Gehirn aus diesen kurzlebigen Momentaufnahmen zeitliche Muster extrahieren kann, benötigt es Mechanismen, die Signale über mehrere Zeitschritte hinweg analysieren. Das Wirbeltiergehirn hat dafür zwei grundlegend verschiedene technische Lösungen entwickelt:

kurze Signalechos – Basalganglien
langlebige Rotationssignale – Papez-Kreise

4.2 Die Basalganglien: kurze Signalechos

Die Basalganglien erzeugen kurze, wenige Zeitschritte überdauernde Echos. Sie eignen sich besonders für:

schnelle sensorische Verarbeitung
motorische Kontrolle
Sprache
visuelle und akustische Sequenzen

Dieses Kurzzeitgedächtnis entsteht durch Laufzeitverzögerungen auf schwach oder nicht myelinisierten Axonen. Diese liegt in der Größenordnung von etwa 10 bis 50 Millisekunden, abhängig von der Modalität (Bewegung, Hören, Sehen).

Bewegungserkennung

Das verzögerte Signal wird auf einen hemmenden Transmitter umgeschaltet und hemmt im Thalamus oder Nucleus ruber das aktuelle Gegenwartssignal.

Keine Veränderung → beide Signale löschen sich aus
Veränderung → ein Restsignal bleibt bestehen

Verknüpfung von Gegenwart und Vergangenheit

Da das Echo noch existiert, wenn das aktuelle Signal bereits abgeklungen ist, kann es mit neuen Signalen kombiniert werden. So entsteht ein Mechanismus, der zeitliche Abfolgen lernen kann – essenziell für Sprache und Sequenzverarbeitung. Dazu muss das hemmende Echo allerdings in ein erregendes überführt werden.

4.3 Theorem der zwei Auswertesysteme der Basalganglien

Die Basalganglien besitzen zwei parallele Auswertesysteme:

Signalweg	Art des Outputs	Funktion
1	hemmend	Differenzschaltung zur Erkennung von Bewegungen und Signaländerungen
2	erregend	Kombination von verzögerten und aktuellen Signalen zur Sequenzbildung

Diese Architektur bildet die Grundlage der biologischen Transformerschaltungen mit kurzer Reaktionszeit.

Ausführliche Darstellungen finden sich in den Monografien des Autors (online verfügbar):

Gehirntheorie der Wirbeltiere (2020), Kapitel 3.8 und 6
Gehirntheorie des Menschen (2021), Kapitel 5

4.4 Die Papez-Kreise: langlebige Signalechos

Die langlebigen Echos der Papez-Kreise beruhen nicht auf Axonverzögerungen. Stattdessen handelt es sich um selbstaufrechterhaltende Rotationssignale in geschlossenen neuronalen Schleifen.

Solange die Schleife aktiv bleibt, bleibt auch das Echo bestehen:

Das Signal rotiert kontinuierlich.
Es verliert keine Energie, da es aktiv regeneriert wird.
Es existiert dauerhaft, bis ein externer Eingriff es löscht.

Damit entsteht ein permanenter Signalspeicher, der sich ideal eignet für:

Gedanken
episodische Inhalte
mentale Simulationen
längerfristige Kontextbildung

Die Papez-Kreise bilden somit ein langes Zeitsystem, das viele Zeitschritte stabil halten kann.

4.5 Wie der circadiane Zeitgeber die Rotationsspeicher leert

Der Nucleus suprachiasmaticus (SCN) fungiert als circadianer Taktgeber. Seine Aktivität folgt dem Tagesrhythmus und kann:

die Rotationsschleifen nachts deaktivieren
gespeicherte Signale löschen
am nächsten Tag einen leeren Speicher bereitstellen

Damit wird klar: Die Papez-Kreise sind keine Verzögerungsleitungen, sondern dauerhafte Gedächtnisschleifen, die täglich durch den SCN zurückgesetzt werden.

4.6 Zwei Zeitsysteme → zwei biologische Transformerarten

Da das Gehirn zwei Mechanismen zur zeitlichen Signalhaltung besitzt, existieren auch zwei biologische Transformerarchitekturen:

1. Transformer mit kurzer Reaktionszeit

Basierend auf den schnellen Signalechos der Basalganglien → optimiert für Wahrnehmung, Sprache, Motorik

2. Transformer mit langer Reaktionszeit

Basierend auf den langlebigen Rotationssignalen der Papez-Kreise → optimiert für Denken, Planen, Erinnern

In dieser Monografie analysieren wir zunächst die Transformervariante, die ausschließlich die Basalganglien nutzt: den Transformer mit kurzer Reaktionszeit – das Fundament der schnellen, zeitkritischen Verarbeitung von Tokenfolgen im sensorischen und motorischen System.

4.7 Originalbereich und Bildbereich in biologischen und künstlichen Transformern

Transformer – sowohl biologische als auch künstliche – verarbeiten zeitlich geordnete Folgen von Tokens. Diese strukturelle Gemeinsamkeit verdeckt jedoch einen fundamentalen Unterschied in der Art der Signale, die jeweils verarbeitet werden. Während künstliche Transformer ausschließlich in einem mathematisch konstruierten Bildbereich operieren, arbeiten biologische Transformer direkt im Originalbereich der neuronalen Aktivität.

4.7.1 Biologische Transformer: Verarbeitung im Originalbereich

Im Gehirn entsprechen Tokens den realen Aktivitätsmustern von Neuronengruppen. Diese Muster liegen als physikalische Signale im Nervensystem selbst vor. Die Verarbeitung erfolgt daher unmittelbar im Originalbereich, also in der tatsächlichen neuronalen Dynamik:

Die Signale sind die originalen Membranpotenziale und Transmitterwirkungen.
Die Netzwerke, die diese Signale verarbeiten, sind physisch vorhanden.
Die Kopplung zwischen Tokens entsteht durch reale synaptische Verbindungen.
Die Gewichtsmatrizen der beteiligten Netzwerke sind so breit angelegt, dass sie alle Tokens gleichzeitig erfassen können.

Damit besitzt der biologische Transformer eine globale Kopplungsstruktur: Jedes Tokensignal kann direkt mit jedem anderen Tokensignal der gesamten Sequenz wechselwirken, ohne dass eine zusätzliche Berechnungsebene erforderlich ist.

4.7.2 Künstliche Transformer: Verarbeitung im Bildbereich

Künstliche Transformer arbeiten nicht mit den ursprünglichen Eingangsdaten selbst, sondern mit Vektorrepräsentationen, die aus diesen Daten berechnet werden. Diese Vektoren bilden einen Bildbereich (Embedding Space), in dem sämtliche weiteren Operationen stattfinden:

Die ursprünglichen Signale (z. B. Wörter, Pixel, Sensordaten) werden in Vektoren abgebildet.
Die Gewichtsmatrizen operieren ausschließlich auf diesen Vektoren.
Die Breite der Gewichtsmatrizen ist künstlich auf die Tokenbreite begrenzt.
Eine globale Wechselwirkung zwischen Tokens entsteht nicht direkt, sondern wird rechnerisch hergestellt.

Damit künstliche Transformer dennoch Beziehungen zwischen Tokens erkennen können, müssen sie zunächst:

Skalarprodukte zwischen den Vektoren verschiedener Tokens berechnen
diese Werte über eine Softmax‑Normalisierung gewichten
erst danach die eigentliche Wechselwirkung herstellen

Die Kopplung zwischen Tokens ist somit nicht physisch, sondern wird durch eine mathematische Prozedur erzeugt, die die begrenzte Breite der Gewichtsmatrizen kompensiert.

4.7.3 Konsequenz: zwei unterschiedliche Verarbeitungsprinzipien

Obwohl beide Systeme mit Tokenfolgen arbeiten, unterscheiden sie sich grundlegend in ihrer Architektur:

Merkmal	Biologischer Transformer	KI‑Transformer
Signalraum	Originalbereich der neuronalen Aktivität	mathematischer Bildbereich (Embedding Space)
Gewichtsmatrizen	breit, erfassen alle Tokens gleichzeitig	begrenzt auf Tokenbreite
Token‑Wechselwirkung	direkte physische Kopplung	indirekt über Skalarprodukte + Softmax
Netzstruktur	global gekoppelt	lokal gekoppelt, globale Struktur wird simuliert

Diese Unterschiede sind nicht wertend, sondern beschreiben zwei technische Lösungen für dieselbe Aufgabe: die Verarbeitung zeitlich geordneter Tokenfolgen.

Monografie von Dr. rer. nat. Andreas Heinrich Malczan