Neuronale Netze: Beispiel Handschrifterkennung

Neuronale Netze sind ein zentraler Bestandteil der Künstlichen Intelligenz und eignen sich beispielsweise für Aufgaben wie die Handschrifterkennung. Im Folgenden wird die Funktionsweise eines neuronalen Netzes am Beispiel der Handschrifterkennung erläutert.

Was soll erreicht werden?

Die Aufgabe besteht darin, ein neuronales Netz zu trainieren, um handgeschriebene Ziffern (z. B. von 0 bis 9) zu erkennen. Dazu bekommt das Netz als Eingabe Bilder von handgeschriebenen Ziffern und gibt als Ausgabe die erkannte Ziffer zurück.

Aufbau des neuronalen Netzes

Ein neuronales Netz besteht aus Schichten von Neuronen:

Eingabeschicht: Sie nimmt die Bilddaten auf. Ein Bild wird in Form einer Matrix von Pixelwerten dargestellt. Beispielsweise könnte ein 28×28-Pixel-Bild in 784 (28×28) Eingabeneuronen umgewandelt werden, wobei jeder Neuron einen Pixelwert enthält (z. B. Graustufen von 0 bis 1).
Versteckte Schichten: Diese führen Berechnungen durch, indem sie Muster und Zusammenhänge in den Daten erkennen. Jede Schicht besteht aus Neuronen, die miteinander verbunden sind.
Ausgabeschicht: Diese Schicht hat 10 Neuronen (für die Ziffern 0 bis 9). Das Neuron mit dem höchsten Wert (Aktivierung) repräsentiert die erkannte Ziffer.

Funktionsweise

Im neuronalen Netz wird ein Bild einer Zahl in Pixelwerte zerlegt und durch mehrere Schichten geleitet. Jede Schicht besteht aus Neuronen, die Eingaben (Pixelwerte oder vorherige Berechnungen) mit Gewichten multiplizieren, diese summieren und durch eine Aktivierungsfunktion schicken.

In den ersten Schichten erkennt das Netz einfache Merkmale wie Linien oder Kanten. In tieferen Schichten kombiniert es diese zu komplexeren Strukturen, z. B. der Form einer „1“. Am Ende gibt die Ausgabeschicht Wahrscheinlichkeiten für jede Zahl aus, z. B. „90% wahrscheinlich ist es eine 1“. Durch ständiges Anpassen der Gewichte bei Fehlern wird das Netz immer genauer.

Training

Das Netz wird mit vielen Beispieldaten (z. B. handgeschriebenen Ziffern und den zugehörigen „richtigen“ Ziffern) trainiert. Ein bekannter Datensatz für diese Aufgabe ist MNIST (enthält 60.000 Trainingsbilder und 10.000 Testbilder).

Die Daten eines neuronalen Netzwerks, also Gewichte und Bias-Werte, werden nicht in einer Datenbank, sondern direkt in Speicherstrukturen innerhalb des Modells gespeichert. Während des Trainings liegen sie im Arbeitsspeicher und werden für die Berechnungen und Anpassungen genutzt. Nach Abschluss des Trainings werden sie in Dateien gespeichert, um das Modell für den späteren Einsatz zu laden.

Fazit

Am Beispiel der Handschrifterkennung zeigt sich, wie sie schrittweise von einfachen Pixelwerten zu komplexen Merkmalen wie Formen und Zahlen abstrahieren. Ihr Erfolg beruht darauf, dass sie durch ständige Wiederholung und Fehlerkorrektur flexibel und präzise werden. Das Verständnis ihrer Funktionsweise verdeutlicht, wie künstliche Intelligenz in vielen Bereichen menschliche Fähigkeiten ergänzen kann.

Cookie	Dauer	Beschreibung
cookielawinfo-checkbox-advertisement	1 year	Set by the GDPR Cookie Consent plugin, this cookie is used to record the user consent for the cookies in the "Advertisement" category .
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
CookieLawInfoConsent	1 year	Records the default button state of the corresponding category & the status of CCPA. It works only in coordination with the primary cookie.
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

Cookie	Dauer	Beschreibung
__gads	1 year 24 days	The __gads cookie, set by Google, is stored under DoubleClick domain and tracks the number of times users see an advert, measures the success of the campaign and calculates its revenue. This cookie can only be read from the domain they are set on and will not track any data while browsing through other sites.
_ga	2 years	The _ga cookie, installed by Google Analytics, calculates visitor, session and campaign data and also keeps track of site usage for the site's analytics report. The cookie stores information anonymously and assigns a randomly generated number to recognize unique visitors.
_ga_8EVYKBJE0L	2 years	This cookie is installed by Google Analytics.
_ga_ECCBGK6LZQ	2 years	This cookie is installed by Google Analytics.
_gat_gtag_UA_216518707_1	1 minute	Set by Google to distinguish users.
_gid	1 day	Installed by Google Analytics, _gid cookie stores information on how visitors use a website, while also creating an analytics report of the website's performance. Some of the data that are collected include the number of visitors, their source, and the pages they visit anonymously.