Signaltheorie der Intelligenz
für das Human Brain Projekt der Europäischen Union
4 Signale in Raum und Zeit
Neuronale Signale verändern sich fortlaufend. Jede Auswertung muss diese Zeitabhängigkeit berücksichtigen. In künstlichen Transformern werden alle Signale, die zu einem bestimmten Zeitpunkt gleichzeitig aktiv sind, zu einer Einheit zusammengefasst: dem Token. Da jedes Einzelsignal indiziert ist, lässt sich ein Token als Vektor darstellen. Auch im Wirbeltiergehirn können gleichzeitige Aktivitätsmuster formal als Token aufgefasst werden.
4.1 Token als flüchtige Informationseinheiten
Token sind die kleinsten Informationseinheiten sowohl künstlicher als auch biologischer Transformer. Sie repräsentieren immer nur den Zustand eines Systems in einem einzigen Moment. Ein Token ist daher keine dauerhafte Größe, sondern eine Momentaufnahme des Aktivitätsmusters vieler Neurone eines Tokengebiets.
Verfolgt man die Aktivität dieser Neurone über eine Zeitreihe hinweg, entsteht eine Sequenz von Tokens, die die zeitliche Veränderung des Signals abbildet. Künstliche Transformer benötigen stets eine solche Tokenfolge, um zeitliche Strukturen zu erkennen.
Damit das Gehirn aus diesen kurzlebigen Momentaufnahmen zeitliche Muster extrahieren kann, benötigt es Mechanismen, die Signale über mehrere Zeitschritte hinweg analysieren. Das Wirbeltiergehirn hat dafür zwei grundlegend verschiedene technische Lösungen entwickelt:
- kurze Signalechos – Basalganglien
- langlebige Rotationssignale – Papez-Kreise
4.2 Die Basalganglien: kurze Signalechos
Die Basalganglien erzeugen kurze, wenige Zeitschritte überdauernde Echos. Sie eignen sich besonders für:
- schnelle sensorische Verarbeitung
- motorische Kontrolle
- Sprache
- visuelle und akustische Sequenzen
Dieses Kurzzeitgedächtnis entsteht durch Laufzeitverzögerungen auf schwach oder nicht myelinisierten Axonen. Diese liegt in der Größenordnung von etwa 10 bis 50 Millisekunden, abhängig von der Modalität (Bewegung, Hören, Sehen).
Bewegungserkennung
Das verzögerte Signal wird auf einen hemmenden Transmitter umgeschaltet und hemmt im Thalamus oder Nucleus ruber das aktuelle Gegenwartssignal.
- Keine Veränderung → beide Signale löschen sich aus
- Veränderung → ein Restsignal bleibt bestehen
Verknüpfung von Gegenwart und Vergangenheit
Da das Echo noch existiert, wenn das aktuelle Signal bereits abgeklungen ist, kann es mit neuen Signalen kombiniert werden. So entsteht ein Mechanismus, der zeitliche Abfolgen lernen kann – essenziell für Sprache und Sequenzverarbeitung. Dazu muss das hemmende Echo allerdings in ein erregendes überführt werden.
4.3 Theorem der zwei Auswertesysteme der Basalganglien
Die Basalganglien besitzen zwei parallele Auswertesysteme:
|
Signalweg |
Art des Outputs |
Funktion |
|
1 |
hemmend |
Differenzschaltung zur Erkennung von Bewegungen und Signaländerungen |
|
2 |
erregend |
Kombination von verzögerten und aktuellen Signalen zur Sequenzbildung |
Diese Architektur bildet die Grundlage der biologischen Transformerschaltungen mit kurzer Reaktionszeit.
Ausführliche Darstellungen finden sich in den Monografien des Autors (online verfügbar):
- Gehirntheorie der Wirbeltiere (2020), Kapitel 3.8 und 6
- Gehirntheorie des Menschen (2021), Kapitel 5
4.4 Die Papez-Kreise: langlebige Signalechos
Die langlebigen Echos der Papez-Kreise beruhen nicht auf Axonverzögerungen. Stattdessen handelt es sich um selbstaufrechterhaltende Rotationssignale in geschlossenen neuronalen Schleifen.
Solange die Schleife aktiv bleibt, bleibt auch das Echo bestehen:
- Das Signal rotiert kontinuierlich.
- Es verliert keine Energie, da es aktiv regeneriert wird.
- Es existiert dauerhaft, bis ein externer Eingriff es löscht.
Damit entsteht ein permanenter Signalspeicher, der sich ideal eignet für:
- Gedanken
- episodische Inhalte
- mentale Simulationen
- längerfristige Kontextbildung
Die Papez-Kreise bilden somit ein langes Zeitsystem, das viele Zeitschritte stabil halten kann.
4.5 Wie der circadiane Zeitgeber die Rotationsspeicher leert
Der Nucleus suprachiasmaticus (SCN) fungiert als circadianer Taktgeber. Seine Aktivität folgt dem Tagesrhythmus und kann:
- die Rotationsschleifen nachts deaktivieren
- gespeicherte Signale löschen
- am nächsten Tag einen leeren Speicher bereitstellen
Damit wird klar: Die Papez-Kreise sind keine Verzögerungsleitungen, sondern dauerhafte Gedächtnisschleifen, die täglich durch den SCN zurückgesetzt werden.
4.6 Zwei Zeitsysteme → zwei biologische Transformerarten
Da das Gehirn zwei Mechanismen zur zeitlichen Signalhaltung besitzt, existieren auch zwei biologische Transformerarchitekturen:
1. Transformer mit kurzer Reaktionszeit
Basierend auf den schnellen Signalechos der Basalganglien → optimiert für Wahrnehmung, Sprache, Motorik
2. Transformer mit langer Reaktionszeit
Basierend auf den langlebigen Rotationssignalen der Papez-Kreise → optimiert für Denken, Planen, Erinnern
In dieser Monografie analysieren wir zunächst die Transformervariante, die ausschließlich die Basalganglien nutzt: den Transformer mit kurzer Reaktionszeit – das Fundament der schnellen, zeitkritischen Verarbeitung von Tokenfolgen im sensorischen und motorischen System.
4.7 Originalbereich und Bildbereich in biologischen und künstlichen Transformern
Transformer – sowohl biologische als auch künstliche – verarbeiten zeitlich geordnete Folgen von Tokens. Diese strukturelle Gemeinsamkeit verdeckt jedoch einen fundamentalen Unterschied in der Art der Signale, die jeweils verarbeitet werden. Während künstliche Transformer ausschließlich in einem mathematisch konstruierten Bildbereich operieren, arbeiten biologische Transformer direkt im Originalbereich der neuronalen Aktivität.
4.7.1 Biologische Transformer: Verarbeitung im Originalbereich
Im Gehirn entsprechen Tokens den realen Aktivitätsmustern von Neuronengruppen. Diese Muster liegen als physikalische Signale im Nervensystem selbst vor. Die Verarbeitung erfolgt daher unmittelbar im Originalbereich, also in der tatsächlichen neuronalen Dynamik:
- Die Signale sind die originalen Membranpotenziale und Transmitterwirkungen.
- Die Netzwerke, die diese Signale verarbeiten, sind physisch vorhanden.
- Die Kopplung zwischen Tokens entsteht durch reale synaptische Verbindungen.
- Die Gewichtsmatrizen der beteiligten Netzwerke sind so breit angelegt, dass sie alle Tokens gleichzeitig erfassen können.
Damit besitzt der biologische Transformer eine globale Kopplungsstruktur: Jedes Tokensignal kann direkt mit jedem anderen Tokensignal der gesamten Sequenz wechselwirken, ohne dass eine zusätzliche Berechnungsebene erforderlich ist.
4.7.2 Künstliche Transformer: Verarbeitung im Bildbereich
Künstliche Transformer arbeiten nicht mit den ursprünglichen Eingangsdaten selbst, sondern mit Vektorrepräsentationen, die aus diesen Daten berechnet werden. Diese Vektoren bilden einen Bildbereich (Embedding Space), in dem sämtliche weiteren Operationen stattfinden:
- Die ursprünglichen Signale (z. B. Wörter, Pixel, Sensordaten) werden in Vektoren abgebildet.
- Die Gewichtsmatrizen operieren ausschließlich auf diesen Vektoren.
- Die Breite der Gewichtsmatrizen ist künstlich auf die Tokenbreite begrenzt.
- Eine globale Wechselwirkung zwischen Tokens entsteht nicht direkt, sondern wird rechnerisch hergestellt.
Damit künstliche Transformer dennoch Beziehungen zwischen Tokens erkennen können, müssen sie zunächst:
- Skalarprodukte zwischen den Vektoren verschiedener Tokens berechnen
- diese Werte über eine Softmax‑Normalisierung gewichten
- erst danach die eigentliche Wechselwirkung herstellen
Die Kopplung zwischen Tokens ist somit nicht physisch, sondern wird durch eine mathematische Prozedur erzeugt, die die begrenzte Breite der Gewichtsmatrizen kompensiert.
4.7.3 Konsequenz: zwei unterschiedliche Verarbeitungsprinzipien
Obwohl beide Systeme mit Tokenfolgen arbeiten, unterscheiden sie sich grundlegend in ihrer Architektur:
|
Merkmal |
Biologischer Transformer |
KI‑Transformer |
|
Signalraum |
Originalbereich der neuronalen Aktivität |
mathematischer Bildbereich (Embedding Space) |
|
Gewichtsmatrizen |
breit, erfassen alle Tokens gleichzeitig |
begrenzt auf Tokenbreite |
|
Token‑Wechselwirkung |
direkte physische Kopplung |
indirekt über Skalarprodukte + Softmax |
|
Netzstruktur |
global gekoppelt |
lokal gekoppelt, globale Struktur wird simuliert |
Diese Unterschiede sind nicht wertend, sondern beschreiben zwei technische Lösungen für dieselbe Aufgabe: die Verarbeitung zeitlich geordneter Tokenfolgen.
Monografie von Dr. rer. nat. Andreas Heinrich Malczan
Monografie von Dr. rer. nat. Andreas Heinrich Malczan