Signaltheorie der Intelligenz

13 Die Evolution faltender neuronaler Netze (CNNs)

Was sind Convolutional Neural Networks (CNNs)?

Neuronale Netze, egal ob biologisch oder künstlich, können Muster erlernen. Visuelle Muster können an verschiedenen Stellen des Sichtfeldes auftauchen. Auch andere Muster können ihre Position im Signalraum verändern. Daher war es notwendig, neuronale Netze zu entwickeln, bei denen eine Verschiebung eines Musters seine Erkennung nicht nachteilig beeinflusste. Genau über diese Fähigkeit verfügen CNNs

Convolutional Neural Networks (CNNs) – auf Deutsch faltende neuronale Netze – sind eine spezielle Klasse künstlicher neuronaler Netze, die besonders gut darin sind, räumliche Muster in Daten zu erkennen. Während klassische („vollverbundene“) neuronale Netze jedes Eingangssignal mit jedem Neuron verknüpfen, nutzen CNNs eine andere Strategie: Sie arbeiten mit lokalen rezeptiven Feldern, Gewichtsteilung und Faltungskernen (Convolutional Filters). Dadurch können sie Strukturen wie Kanten, Texturen oder komplexe Formen in Bildern oder anderen räumlich organisierten Signalen effizient erkennen.

Der entscheidende Unterschied zu herkömmlichen neuronalen Netzen liegt also darin, dass CNNs räumliche Nachbarschaft explizit ausnutzen. Sie verarbeiten Signale nicht global, sondern schichtweise und lokal – ähnlich wie biologische visuelle Systeme, in denen Neurone ebenfalls nur auf begrenzte Ausschnitte des Gesichtsfelds reagieren und dort spezifische Merkmale extrahieren.

Historischer Ursprung

Die Grundidee der CNNs entstand nicht in der Informatik, sondern wurde direkt von der Neurobiologie inspiriert. Der japanische Forscher Kunihiko Fukushima entwickelte 1979 das Neocognitron, ein Modell, das explizit an den visuellen Cortex angelehnt war und bereits zentrale Elemente moderner CNNs enthielt. Es war das erste künstliche System, das Merkmalsdetektoren und hierarchische Verarbeitung kombinierte.

In den späten 1980er und frühen 1990er Jahren griffen Yann LeCun und Kollegen diese Ideen auf und kombinierten sie mit dem Backpropagation‑Lernverfahren. Daraus entstand die berühmte LeNet‑Architektur, die erstmals praktisch erfolgreich für die automatische Erkennung handgeschriebener Ziffern eingesetzt wurde. Damit begann der Siegeszug der CNNs in der modernen KI.

Warum CNNs für Neurowissenschaftler relevant sind

Für Neurologen und Hirnforscher sind CNNs deshalb interessant, weil sie eine algorithmische Perspektive auf die Funktionsweise sensorischer Hirnareale bieten. Viele Prinzipien der CNNs – lokale Filter, hierarchische Merkmalsextraktion, Pooling – finden sich in erstaunlich ähnlicher Form im visuellen System von Wirbeltieren wieder. CNNs sind daher nicht nur ein Werkzeug der KI, sondern auch ein Modell für biologische Informationsverarbeitung.

Die Entstehung von biologischen CNNs in der Evolution

Im Gehirn der Wirbeltiere finden wir sämtliche Klassen neuronaler Netze. Die Entstehung vollverbundene neuronalen Netze (KNNs) in der Formatio reticularis wurde im vorherigen Kapitel dargestellt. Die Herausbildung faltender neuronaler Netze (CNNs) im Gehirn erfolgte schrittweise über eine ganze Reihe von Zwischenstufen, die sich aus der Abfolge von evolutionären Weiterentwicklungen des Wirbeltiergehirns ergeben haben. Den Startschuss gab die neuronale Konkurrenz der zwei Körperhälften der bilateral aufgebauten Wirbeltiere. Diese führte in einem längeren Entwicklungsweg zur Herausbildung des Cerebellums, welches sich in Vestibulocerebellum, Spinocerebellum und Pontocerebellum untergliederte. Das Wachstum der Dendritenfelder in der Retina und im Cerebellum führte dann direkt zur Herausbildung von CNNs im Wirbeltiergehirn.

Neuronale Konkurrenz der Körperseiten und die Signalwege der Eingangsetage

Ausgangslage: bilaterale Signalzufuhr

In der Eingangsetage des Gehirns befand sich der motorische Mittelwertkern des Gehirns, die Formatio reticularis (bzw. ihr Vorläufer).
Mittelwertkerne liefern Steuersignale für das autonome Lebenserhaltungssystem des Körpers.
Jede Körperhälfte liefert ihre motorischen und sensorischen Signale in die Formatio reticularis, die bilateral ausgebildet war.
Damit entstehen zwei parallele Signalströme der beiden Körperseiten, die zunächst unabhängig voneinander verarbeitet werden.

Seitenwechselkern (Nucleus olivaris)

Recht früh bildete sich zwischen beiden Körperhälften eine neuronale Konkurrenz heraus.
Der Nucleus olivaris – ebenfalls bilateral vorhanden – vermittelt als Seitenwechselkern den Austausch zwischen beiden Körperhälften.
Er sorgt dafür, dass Signale der linken und rechten Seite nicht isoliert bleiben, sondern in Konkurrenz treten können.
Diese Konkurrenz ist funktional notwendig: Sie erzwingt, dass das stärkere Signal einer Körperseite das schwächere Signal der anderen Seite hemmt und sich so durchsetzt. Nur so war eine Beutesuche oder eine Flucht vor Fressfeinden möglich.
Anfangs war die Hemmung der Gegenseite auf die Mittelwertsignale beschränkt. Erst im Verlauf der Evolution konnten andere Signale eingebunden werden.
Die Hemmung wurde realisiert, indem die kontralateralen Signale an hemmenden Interneuronen endeten, die ihrerseits die ipsilateralen Outputneuronen hemmten. Diese Interneuronen entwickelten sich zu Purkinjezellen, die sich im Verlauf der Evolution von der Formatio reticularis trennten und zur späteren Cerebellumrinde formierten.

Hemmende Purkinjezellen

Der Nucleus olivaris überträgt die Signale der anderen Körperseite zu den Purkinjezellen.
Purkinjezellen hemmen in der Formatio reticularis die ipsilateralen Signale.
Sie realisieren die Konkurrenz, indem sie die Signale der jeweils anderen Körperseite unterdrücken.
Ergebnis: Nur die stärkere Seite setzt sich durch – ein „Winner-takes-all“-Prinzip auf bilateraler Ebene.

Die Entstehung des Spinocerebellums

Die Purkinjezellen bildeten anfangs einen Neuronenkern, den wir als Nucleus Purkinje bezeichnen können. Aus ihm entwickelte sich die spätere Cerebellumrinde. Die Purkinjezellen des sich entwickelnden Cerebellums hemmten unter anderem die Neuronen der Formatio reticularis. Damit standen beide Mittelwertkerne der zwei Körperseiten in direkter Konkurrenz zueinander. Die Hemmung stärkerer Mittelwertsignale erfolge jedoch nicht total, sondern nur relativ, da die Mittelwertsignale eine stärkere Aktivität besaßen. So entstand keine vollständige Unterdrückung, sondern eine relative Hemmung. Denn die Aktivität der gehemmten Körperseite durfte nicht völlig zum Erliegen kommen. Es sollte nur eine Balance zwischen beiden Körperseiten gefunden werden, bei der stärkere Signale die schwächeren hemmten.

Signale repräsentieren meist eine Urgröße, z. B. die Muskelkraft, die Krafteinwirkung auf Tastrezeptoren oder die Helligkeit. Hierbei gibt es eine funktionale Abhängigkeit der Feuerrate von der Urgröße. Diese kann streng monoton wachsend sein oder auch streng monoton fallen.

Die relative Hemmung von stärkeren Mittelwertsignalen durch Inputsignale führt zur Umkehr des Monotonieverlaufs dieser Inputsignale. Aus einem streng monoton wachsenden Signalverlauf entsteht beispielsweise ein streng monoton fallender Signalverlauf. Wir bezeichnen diese Umkehr des Monotonieverlaufs durch relative Hemmung als Signalinversion. Sie wurde eine Hauptaufgabe des frühen Cerebellums. Die Inversion vestibulärer Signale wurde erforderlich durch den Umbau des Paläovestibularsinns zum Neovestibularsinn. Der zugehörige Cerebellumteil wurde zum Vestibulocerebellum.

Auch motorische Signale fanden den Weg über den Nucleus olivaris zur Gegenseite ins Cerebellum. Durch diese relative Hemmung wurde die Signalstärke der Gegenseite invertiert. Jeder Muskel hemmte nun seinen Gegenspieler auf der Gegenseite relativ. Ein Restsignal blieb bestehen, das den Gegenspieler invers erregte. Neurologen bezeichnen diesen Mechanismus als Koaktivierung: Beide Muskeln waren angespannt, einer stärker, der andere schwächer. Diese Koaktivierung ermöglichte eine präzisere Einstellung der Gelenkwinkel und wirkte zugleich der Schwerkraftbelastung entgegen. Der zugehörige Teil des Cerebellums entwickelte sich zum Spinocerebellum. Dieses schuf die funktionale Voraussetzung für den Landgang der Wirbeltiere.

Mit der zunehmenden Zahl motorischer Signale der Gegenseite, die in das Spinocerebellum einflossen, zerfiel die ursprüngliche Formatio reticularis. Der Anteil, der ausschließlich der Signalinversion diente, entwickelte sich zu einem eigenständigen Kernbereich – dem Kleinhirnkern. Dieser differenzierte sich je nach Herkunft der Signale weiter aus. Der Nucleus fastigii verarbeitete Vestibularsignale. Der Nucleus globosus und der Nucleus emboliformis verarbeiteten motorische Signale. Das für die Signalinversion notwendige Mittelwertsignal stammte aus der Formatio reticularis, die weiterhin dem autonomen Lebenserhaltungssysten diente. Diese Mittelwerteinspeisung entfällt später beim Pontocerebellum.

Das Vestibulo- und das Spinocerebellum dienten anfangs ausschließlich der Signalinversion der Signale der Gegenseite.

Wir fassen das Vestibolocerebellum und das Spinocerebellum zum Inversionscerebellum zusammen. Seine Hauptaufgabe bestand anfangs in der Signalinversion der kontralateralen Signale zur Co-Aktivierung der motorischen Gegenspieler. Durch die später einsetzende Signaldivergenz entwickelte sich das Spinocerebellum zu einer Art Digitalisierungsschaltung, bei der die Signalstärke eines Signals als Skalenwert dargestellt und in einen spärlich kodierten Signalvektor überführt wurde, dessen einzige von Null verschiedene Vektorposition die Signalstärke repräsentierte. Dies ähnelt einem One-Hot-Vektor, jedoch ist dieser zusätzlich normiert.

Entstehung des Pontocerebellums

Das besondere topologische Kennzeichen des Pontocerebellums ist sein Signalursprung aus dem Cortex. Während Spinocerebellum und Vestibulocerebellum ihre Eingänge vor allem aus Rückenmark und Gleichgewichtssystem beziehen, erhält das Pontocerebellum seine Signale über die Pons aus nahezu allen kortikalen Arealen. Diese kortikopontinen Bahnen bilden die größte Projektionsstrecke des Gehirns und machen das Pontocerebellum zur eigentlichen Eingangsetage für kortikale Muster.

Für das Spinocerebellum gilt:

Der Input der kontralateralen Seite kommt vom dortigen Nucleus ruber über den Nucleus olivaris ins Kletterfasersystem.
Der Input des Moosfasersystems kommt aus der ipsilateralen Rumpfhälfte.

Für das Pontocerebellum gilt:

Der Input aus dem kontralateralen Cortex kommt vom dortigen Nucleus olivaris ins Kletterfasersystem. Der Nucleus ruber ist in den Signalweg nicht eingebunden.
Der Moosfaserinput kommt vom kontralateralen Cortex über die Nuclei pontis.

Im Unterschied zu den älteren Kleinhirnstrukturen ist das Pontocerebellum von der Mittelwertbildung der Formatio reticularis abgekoppelt. Es erzeugt die für seine Funktion notwendigen Mittelwertsignale autark aus seinen eigenen Inputsignalen. Aufgrund des großen räumlichen Abstands besteht keine direkte Verbindung mehr zur Formatio reticularis. Diese Unabhängigkeit markiert einen entscheidenden Schritt in der Evolution:

Mit dem Pontocerebellum wurde der Weg geöffnet für die höhere Intelligenz der Primaten und des Menschen, während diese Struktur bei anderen Spezies vermutlich nur rudimentär vorhanden ist.

Dennoch gibt es einen entscheidenden Unterschied zum Inversionscerebellum:

Kletterfasersignale und Moosfasersignale haben den gleichen Signalursprung.

Insbesondere die Moosfasersignale waren eine Art Signalkopie der Kletterfasersignale. Beim Inversionscerebellum kamen die Kletterfasersignale von der Gegenseite. Genau dies ist beim Pontocerebellum nicht mehr der Fall.

Neurologen und KI-Forscher sollten sich langsam an den Gedanken gewöhnen, dass es im Wirbeltiergehirn, insbesondere bei Primaten und beim Homo sapiens insgesamt vier Signalkopien gibt, die aus den cortikalen Signalen hervorgehen:

Die Projektion in den ipsilateralen Nucleus olivaris und von dort in die Kletterfaserprojektion des kontralateralen Cerebellums (Kletterfaserprojektion)
Die Projektion über die Nuclei pontis ins Moosfasersysten des kontralateralen Cerebellums
Die Projektion ins Basalgangliensystem (Matrix und Striosomen)
Die Projektion in die Papez-Kreise des limbischen Systems.

Die Kletterfaserprojektion und die Moosfaserprojektion ins Pontocerebellum wurde die Grundlage für die Mustererkennung in neuronalen Netzen (CNNs).

Jede Kletterfaser endete an einer ihr zugeordneten Purkinjezelle und erregte diese im Aktivitätsfall recht stark. Ihr Axon kletterte am Axon der Purkinjezelle empor und bildete dort viele Synapsen, die die Purkinjezelle bei vorliegendem Kletterfasersignal sehr stark erregen konnten. Ebenso konnte die zur Kletterfaser gehörende Moosfaserkopie, die das gleiche Cortexsignal transportierte, diese Purkinjezelle erregen, indem sie Körnerzellen kontaktierte, deren Parallelfasern erregend auf die Purkinjezelle einwirkten, wenn ein Cortexsignal auf dieser Leitung aktiv war. Die Purkinjezelle verwendete GABA als Neurotransmitter und hemmte im Aktivitätsfall ein zugeordnetes Outputneuron der Nucleus dentatus.

Zusätzlich erregte die Kletterfaser und ihre Moosfaserkopie genau dieses Outputneuron des Nucleus dentatus. Dieser war der Kleinhirnkern des Pontocerebellums. Da die Erregung der Purkinjezelle von den gleichen Signalen hervorgerufen wurde wie die Erregung des Dentatusneurons, gab es in diesem Fall keinen Output. Erregung und Hemmung waren gleichstark.

Differenzschaltung im Pontocerebellum:

Im Cerebellum wurde eine Differenzschaltung realisiert, bei der die Erregungsdifferenz zwischen dem Dentatusneuron und der Purkinjezelle die Stärke des Outputsignal ergab. War die Erregung der Purkinjezelle stärker als die Erregung des Dentatusneurons, gab es keinen Output, da Neuronen keine negativen Feuerraten kennen.

Eine große Erregung einer Purkinjezelle bedeutete, dass es so gut wie keinen Output gab. Genau dies ist die inverse Arbeitsweise.

Ein Output konnte nur auftreten, wenn die übrigen Moosfasern, die keine Kopie des Kletterfasersignals waren, hemmend auf die Purkinjezelle einwirkten. Hierzu kontaktierte diese Moosfaser Körnerzellen. Deren Axone stiegen empor zur Purkinjezellschicht und bildeten dort die T-förmigen Parallelfasern mit großer Länge. Diese kontaktierten Sternzellen und Korbzellen, die ihrerseits die Purkinjezellen hemmten. Dadurch reichte die verminderte Erregung der Purkinjezelle nicht mehr aus, um das Dentatusneuron komplett zu hemmen. Es blieb ein Restsignal übrig, dessen Intensität mit der Stärke des Moosfaserinputs zunahm.

Durch Hebbsches Lernen wurde die synaptische Stärke vergrößert, wenn die Kletterfaser und die Moosfasern gleichzeitig aktiv waren. So konnte die Purkinjezelle das häufigste Cortexsignal erlernen. Mit dem Längenwachstum der Kletterfaser konnten mehrere Purkinjezellen kontaktiert werden, so dass dieses neuronale Netz mehrere verschiedene Cortexsignale erlernen konnte, pro Purkinjezelle genau eins.

Hierbei erwies es sich als nützlich, wenn die Purkinjezellen Signale auswerten konnten, die weiter entfernt waren. So setzte der Prozess der Vergrößerung der Dendritenbäume der Purkinjezellen ein. Dies sollte gravierende Auswirkungen auf den Typ des biologischen neuronalen Netzes im Cerebellum haben.

Wachstum der Dendritenfelder und Beginn des Faltungsalgorithmus

Diese Konvergenz entfernterer Signale auf die Purkinjezellen bildet das evolutionäre Ausgangssubstrat für die spätere Entstehung eines Faltungsmechanismus.

Im visuellen Cortex V1 begannen sich die dendritischen Felder der Pyramidenzellen auszudehnen, sie entwickelten sich zu magnocellularen Pyramidenzellen. Im Pontocerebellum war jeder magnocellularen Pyramidenzelle aus V1 genau eine Purkinjezelle zugeordnet, die von dieser Pyramidenzelle erregt wurde. Das zugehörige Dentatusneuron wurde ebenfalls von diesem Signal erregt.

Gleichzeitig erreichte das Outputsignal genau dieser Pyramidenzelle über das Moosfasersystem sowohl diese Purkinjezelle als auch das zugehörige Dentatusneuron, beide wurden erregt.

In der Summe hoben sich Erregung und Hemmung auf, da sie (anfangs) aus der gleichen Signalquelle stammten. Eigentlich würde diese neuronale Differenzschaltung gar keinen Nutzen bringen. Doch die Dendritenbäume der beteiligten Neuronen in der Cortexrinde und in der Cerebellumrinde setzten ihr Größenwachstum ungleichmäßig fort.

Die Purkinjezellen übertrafen mit dem Wachstum ihrer Dendritenbäume die dendritischen Felder der magnocellularen Pyramidenzellen des Cortex. Dadurch konnte eine Purkinjezelle mit ihrem sehr großen Dendritenbaum auch Signale aus benachbarten cortikalen Pyramidenzellen zu empfangen. Diese Konkurrenzsignale wirkten hemmend auf die Purkinjezelle, denn zwischen den dendritischen Feldern im Cortex herrschte ein neuronaler Konkurrenzkampf. Er übertrug sich auf die Signale des Cerebellums. Jede Purkinjezelle wurde von den Signalen ihrer cortikalen Pyramidenzelle erregt, jedoch von den benachbarten Pyramidenzellen gehemmt. Doch nur das Signal der eigenen Pyramidenzelle erregte das Dentatusneuron.

Die Hemmung erfolgte über Stern- und Korbzellen, die ihrerseits von den denjenigen Parallelfasern erregt wurden, die Signale aus den benachbarten cortikalen Pyramidenzellen über die Moosfasern empfingen. Daher waren die Axone der Parallelfasern und der Korbzellen so extrem lang.

Es blieb ein Restsignal, das stark werden konnte, wenn die benachbarten Felder im Cortex stark erregt waren. Dies war der Beginn eines Faltungsalgorithmus: Die Purkinjezelle konnte (beispielsweise) den Output von neun kortikalen Feldern empfangen – wie eine Maske von 3 × 3 Feldern, die über das visuelle Bild gelegt wird.

Wir unterteilen die Signale dieser neun Felder, die zu einer Maske gehören, in Innensignale und Außensignale. Die Innensignale stammen vom mittleren Feld, die Außensignale von den Randfeldern. Dann können wir den Signalalgorithmus des Pontocerebellums exakter formulieren:

Die Innensignale erregen die Purkinjezelle über die Kletterfaser und mit Hilfe der Parallelfasern über die Moosfasern, ebenso erregen sie das zugehörige Outputneuron im Nucleus dentatus.
Die Außensignale hemmen die Purkinjezelle über die Moosfasern mit Hilfe zwischengeschalteter Parallelfasern, Stern- und Korbzellen.
Genau dann und nur dann, wenn die Innensignale die Purkinjezelle und die zugehörige Dentatuszelle erregen und Außensignale die Purkinjezelle hemmen, entsteht im Dentatusneuron ein Output, weil das Gleichgewicht zwischen der Innenerregung des Dentatusneurons und der Innenerregung des Purkinjeneurons gestört wird. Dies entspricht einer konjunktiven Verknüpfung zwischen den Innensignalen und den Außensignalen. Diese Signalkonjunktion unterscheidet biologische Netze des Cerebellums von den künstlichen Netzen.
So wurde im Cerebellum eine Differenzschaltung realisiert, bei der die Erregungsdifferenz zwischen dem Dentatusneuron und der Purkinjezelle das Outputsignal ergab

So entstand im Pontocerebellum eine explizite anatomische Zweikanal-Struktur:

Purkinje und Dentatus als gekoppelte Vergleichseinheit
Innen-/Außenaufteilung des Inputs

Konjunktion über Struktur, nicht nur über Aktivität

nicht nur „viele Inputs → eine Nichtlinearität
sondern: „ein strukturiert aufgeteiltes Muster + Balanceverschiebung

CNNs und MLPs haben:

lineare Filter + Skalar-Nichtlinearitäten
keine Purkinje–Dentatus-Paare als explizite Vergleichseinheiten
keine In-/Out-Differenzstruktur per se

Sie können etwas Ähnliches approximieren, aber nicht in dieser expliziten, biophysikalisch verdrahteten Form.

KI-Systeme:

arbeiten mit kontinuierlichen Funktionen und statistischer Approximation,
ihnen fehlt diese explizite Differenz-Schaltung und die klare In-/Out-Trennung,
sie „nähern“ so eine Konjunktion nur an, insbesondere bei großen Inputmengen.

Der in der Purkinjezelle eintreffende Input repräsentiert jeweils irgendein visuelles Muster.

Durch Hebbsches Lernen wurde das häufigste visuelle Muster aus diesen neun Augendominanzsäulen in den Synapsen der Purkinjezelle geprägt. Der Output erreichte den Nucleus dentatus und führte dort über laterale Nachbarhemmung zur Unterdrückung benachbarter Dentatusneuronen. So erlernte die Purkinjezelle das häufigste visuelle Muster. Zusätzlich hemmte jedes Outputneuron des Nucleus dentatus das zugehörige Kletterfasersignal im Nucleus olivaris – also auch das Inputsignal aus dem Cortex. Damit konnte eine andere Purkinjezelle dieses Signal nicht mehr wahrnehmen.

Wurde ein visuelles Muster nicht erkannt, blieb die Kletterfaser im Nucleus olivaris aktiv und erzeugte im Pontocerebellum neurotrophe Wachstumsfaktoren. Diese förderten das Ausreifen von Proneuronen zu Purkinjezellen. So entstanden im Verlauf der Evolution weitere Purkinjezellen, an denen die gleiche Kletterfaser andocken konnte. Diese neuen Purkinjezellen konnten die nächsten visuellen Muster in der Reihenfolge ihrer statistischen Häufigkeit erlernten. Später beschleunigten LTD und LTP das Hebbsche Lernen, sodass neue visuelle Muster innerhalb von Sekunden erlernt werden konnten.

Je mehr Purkinjezellen von einer Kletterfaser erreicht werden konnten, umso mehr verschiedene Muster konnte das CNN erlernen, wodurch sich ein Vorteil für das Wirbeltier ergab. Prinzipiell erfolgte der Hebbsche Lernprozess nach Sanger´s Regel, jedoch etwas modifiziert. Denn die Inputsignale waren hier nicht symmetrisch zum Nullpunkt, weil es keine negativen Feuerraten gibt. Daher erlernten die Purkinjezellen nicht die Hauptkomponenten, sondern die Signale in der Reihenfolge ihrer statistischen Häufigkeit.

Der Faltungsalgorithmus, der für CNNs eine Translationsinvarianz der Muster bewirkte, ist im Cerebellum emergent und muss nicht explizit implementiert werden. Ein großer Vorteil der biologischen CNNs im Gehirn ist die parallele Arbeitsweise sämtlicher Outputneuronen.

Zweiter Hauptsatz für biologische neuronale Netzwerke

Durch Vergleich der unterschiedlichen Erregungen der Purkinjezelle und des zugehörigen Dentatusneurons über eine Differenzschaltung entstanden die ersten faltenden Netzwerke. Das überproportionale Wachstum der dendritischen Felder der Purkinjezellen ermöglichte die Integration der Signale benachbarter kortikaler Felder, wodurch eine strukturelle Faltungsoperation entstand, die funktional einem Convolutional Neural Network entspricht, jedoch ohne expliziten Faltungsalgorithmus auskommt.

Damit wird auch klar, warum Menschen, die von Geburt an über keine Purkinjezellen und keine Cerebellumrinde verfügen, dennoch kaum eingeschränkt sind. Solange ihre Kleinhirnkerne vorhanden sind, arbeiten diese als neuronale Netzwerke und können so die notwendigen motorischen und kognitiven Leistungen erbringen.

Methodischer Einschub: Neuroanatomie als archäologische Spurensuche

Die heutige Organisation der sensorischen Bahnen im Wirbeltiergehirn ist nicht nur ein funktionelles Ergebnis, sondern zugleich ein evolutionäres Archiv. Viele anatomische Besonderheiten – getrennte Thalamusschichten, gekreuzte und ungekreuzte Sehbahnen, parallele Projektionswege über Pons und Olive, topologische Karten im Kleinhirn – sind keine zufälligen Konstruktionen. Sie sind Überreste früherer Entwicklungsstufen, die sich über Millionen Jahre erhalten haben, weil sie in die grundlegende Architektur der Informationsverarbeitung eingebettet wurden.

Diese Strukturen lassen sich daher wie archäologische Funde lesen: als konservierte Hinweise auf algorithmische Prinzipien, die bereits in frühen Wirbeltieren wirksam waren. Die Trennung in ipsilaterale und kontralaterale Teilschichten im Thalamus, die unterschiedliche Weiterleitung über Moosfaser- und Kletterfasersysteme sowie die präzise topologische Zuordnung im Pontocerebellum bilden eine Indizienkette, die auf eine gemeinsame funktionelle Wurzel verweist. Sie zeigen, dass das Gehirn nicht nur Signale verarbeitet, sondern dabei Rechenprinzipien nutzt, die sich im Verlauf der Evolution schrittweise herausgebildet und verfeinert haben.

In diesem Sinne dient die Neuroanatomie als archäologisches Fenster in die Vergangenheit der neuronalen Signalverarbeitung. Ihre konservierten Muster erlauben es, hypothetische Entwicklungslinien zu rekonstruieren und die Entstehung komplexer Mechanismen – wie etwa der Faltungsoperationen im Pontocerebellum – plausibel nachzuzeichnen.

Ergänzung am Ende des Kapitels

Es ergibt sich die Frage, ob Personen ohne Kleinhirnrinde über CNNs im Kleinhirnkern verfügen könnten. Der Wegfall der Purkinjezellen ist gleichbedeutend mit dem Wegfall des Zugriffs auf mehrere benachbarte dendritische Felder des Cortex. Da jedoch der Cortex über das Moosfasersystem generell auch in die Kleinhirnkerne projiziert, könnte das Manko ausgeglichen werden. Dazu müssten die Dentatusneuronen ihre dendritischen Felder so ausweiten, dass auch der Input benachbarter cortikaler dendritischer Felder empfangen werden kann. Ein Größenwachstum der Dendritenfelder im Nucleus dentatus bei Personen ohne Cerebellumrinde könnte ein Hinweis sein, dass das Gehirn dieses Fehlen durchaus wenigstens teilweise kompensieren kann.

Alle bisher beschriebenen Schaltungen, Module und neuronalen Netze gehören noch zum primären Gehirnsystem. Dieses Subsystem ist das evolutionär älteste und verarbeitet analoge Signale. Die Signalstärke von Urgrößen, die über Rezeptoren wahrgenommen werden, wird dabei durch die Feuerrate verschlüsselt.

Neuronale Netze konnten sich im primären System bilden, weil einerseits Mittelwertsysteme wie die Formatio reticularis die technische Grundlage lieferten. Andererseits schufen die größeren rezeptiven Felder im Cortex und im Cerebellum die Voraussetzungen für die Signalanalyse in Convolutional Neural Networks (CNNs).

Der nächste evolutionäre Schritt war die Herausbildung der vertikalen Signaldivergenz im Nucleus olivaris sowie der ebenen oder räumlichen Divergenzmodule im Cortex. Diese Entwicklungen führten zur Entstehung einer neuen Klasse von neuronalen Netzen, die in der KI-Terminologie als Transformer bezeichnet werden. Sie werden in einem eigenen Kapitel ausführlich beschrieben.

Für die visuelle Mustererkennung ist hervorzuheben, dass CNNs eine cortikale Projektion in den Nucleus olivaris benötigen. Der Trakt cortikoolivaris ist beim Menschen eindeutig nachgewiesen. Bei niederen Wirbeltieren ist zu vermuten, dass er ebenfalls existiert, jedoch zahlenmäßig unbedeutend bleibt. Während der Mensch etwa 5000 Augendominanzsäulen für das visuelle CNN besitzt, könnten niedere Wirbeltiere bereits mit rund 100 Säulen auskommen. Deren Axone würden im Gehirn kaum auffallen.

Die bisher beschriebenen Schaltungen und Netze gehören vollständig zum primären Gehirnsystem. Innerhalb dieses Systems reagieren die rezeptiven Felder der Ganglienzellen bereits auf periodische Helligkeitsänderungen, die durch teilweise Abdeckung entstehen. Diese Felder sind in der Lage, einfache Schwankungen der Signalintensität zu verarbeiten und bilden damit die Grundlage für die visuelle Mustererkennung in CNNs.

Die späteren Orientierungssäulen im Cortex sind jedoch eine neu gebildete neuronale Struktur, die beim hier beschriebenen Entwicklungsstand noch nicht existiert. Sie entstehen erst Millionen Jahre später in der Evolution und gehören bereits zum nächsten Subsystem des Gehirns. Ihre Funktion – die periodische Signalstärkeschwankung bei Drehung einer Geraden im Sichtfeld – ist ein Kennzeichen der Transformer-Architektur, die in späteren Kapitel beschrieben wird.

Die mathematische Beschreibung der periodischen Helligkeitsänderungen durch teilweise Abdeckung eines kreisförmigen rezeptiven Feldes ist im Kapitel 13 meiner Gehirntheorie ausführlich dargestellt. Für das Verständnis genügt hier der Hinweis, dass die Sehnenlänge einer Geraden im Kreis von deren Abstand zum Mittelpunkt abhängt. Diese einfache geometrische Abhängigkeit erklärt die periodischen Signalstärkeschwankungen, die später zur Ausbildung der Orientierungssäulen führen.

Monografie von Dr. rer. nat. Andreas Heinrich Malczan