Neuronale Netze sind ein zentraler Bestandteil der Künstlichen Intelligenz und eignen sich beispielsweise für Aufgaben wie die Handschrifterkennung. Im Folgenden wird die Funktionsweise eines neuronalen Netzes am Beispiel der Handschrifterkennung erläutert.
Was soll erreicht werden?
Die Aufgabe besteht darin, ein neuronales Netz zu trainieren, um handgeschriebene Ziffern (z. B. von 0 bis 9) zu erkennen. Dazu bekommt das Netz als Eingabe Bilder von handgeschriebenen Ziffern und gibt als Ausgabe die erkannte Ziffer zurück.
Aufbau des neuronalen Netzes
Ein neuronales Netz besteht aus Schichten von Neuronen:
- Eingabeschicht: Sie nimmt die Bilddaten auf. Ein Bild wird in Form einer Matrix von Pixelwerten dargestellt. Beispielsweise könnte ein 28×28-Pixel-Bild in 784 (28×28) Eingabeneuronen umgewandelt werden, wobei jeder Neuron einen Pixelwert enthält (z. B. Graustufen von 0 bis 1).
- Versteckte Schichten: Diese führen Berechnungen durch, indem sie Muster und Zusammenhänge in den Daten erkennen. Jede Schicht besteht aus Neuronen, die miteinander verbunden sind.
- Ausgabeschicht: Diese Schicht hat 10 Neuronen (für die Ziffern 0 bis 9). Das Neuron mit dem höchsten Wert (Aktivierung) repräsentiert die erkannte Ziffer.
Funktionsweise
Im neuronalen Netz wird ein Bild einer Zahl in Pixelwerte zerlegt und durch mehrere Schichten geleitet. Jede Schicht besteht aus Neuronen, die Eingaben (Pixelwerte oder vorherige Berechnungen) mit Gewichten multiplizieren, diese summieren und durch eine Aktivierungsfunktion schicken.
In den ersten Schichten erkennt das Netz einfache Merkmale wie Linien oder Kanten. In tieferen Schichten kombiniert es diese zu komplexeren Strukturen, z. B. der Form einer „1“. Am Ende gibt die Ausgabeschicht Wahrscheinlichkeiten für jede Zahl aus, z. B. „90% wahrscheinlich ist es eine 1“. Durch ständiges Anpassen der Gewichte bei Fehlern wird das Netz immer genauer.
Training
Das Netz wird mit vielen Beispieldaten (z. B. handgeschriebenen Ziffern und den zugehörigen „richtigen“ Ziffern) trainiert. Ein bekannter Datensatz für diese Aufgabe ist MNIST (enthält 60.000 Trainingsbilder und 10.000 Testbilder).
Die Daten eines neuronalen Netzwerks, also Gewichte und Bias-Werte, werden nicht in einer Datenbank, sondern direkt in Speicherstrukturen innerhalb des Modells gespeichert. Während des Trainings liegen sie im Arbeitsspeicher und werden für die Berechnungen und Anpassungen genutzt. Nach Abschluss des Trainings werden sie in Dateien gespeichert, um das Modell für den späteren Einsatz zu laden.
Fazit
Am Beispiel der Handschrifterkennung zeigt sich, wie sie schrittweise von einfachen Pixelwerten zu komplexen Merkmalen wie Formen und Zahlen abstrahieren. Ihr Erfolg beruht darauf, dass sie durch ständige Wiederholung und Fehlerkorrektur flexibel und präzise werden. Das Verständnis ihrer Funktionsweise verdeutlicht, wie künstliche Intelligenz in vielen Bereichen menschliche Fähigkeiten ergänzen kann.