Generative Adversarial Networks (GANs) sind ein Machine-Learning-Framework, das aus zwei neuralen Netzwerken besteht, die gegeneinander antreten: dem Generator und dem Diskriminator.
- Generator: Dieses Netzwerk erzeugt neue Datenproben, die den echten Daten möglichst ähnlich sehen sollen. Es nimmt zufällige Eingaben (oft als Rauschen bezeichnet) und transformiert sie in synthetische Daten, z.B. Bilder, Texte oder andere Formen von Daten.
- Diskriminator: Dieses Netzwerk bewertet, ob eine gegebene Datenprobe echt (aus dem realen Datensatz) oder vom Generator erzeugt ist. Es versucht, die gefälschten Daten vom Generator zu erkennen.
Der Trainingsprozess eines GANs läuft in mehreren Iterationen ab, in denen die beiden Netzwerke gegeneinander spielen:
- Der Generator erstellt eine Datenprobe und gibt sie an den Diskriminator.
- Der Diskriminator bewertet diese Probe und gibt eine Rückmeldung, ob sie echt oder gefälscht ist.
- Basierend auf dieser Rückmeldung passt der Generator seine Strategie an, um bessere (realistischere) Datenproben zu erzeugen.
- Gleichzeitig passt der Diskriminator seine Strategie an, um gefälschte Proben besser zu erkennen.
Das Ziel ist es, dass der Generator mit der Zeit so gut wird, dass der Diskriminator Schwierigkeiten hat, zwischen echten und gefälschten Daten zu unterscheiden. Dieser iterative Prozess verbessert die Fähigkeiten beider Netzwerke kontinuierlich.
Beispiel „This Person Does Not Exist“
Ein konkretes Beispiel für die Anwendung von Generative Adversarial Networks (GANs) ist die Erstellung realistischer Bilder von Menschen, die es in der Realität nicht gibt. Ein bekanntes Projekt in diesem Bereich ist „This Person Does Not Exist“ (https://thispersondoesnotexist.com).
Wie funktioniert das?
- Datensatz von echten Bildern: Der Diskriminator wird mit einem großen Datensatz von echten Bildern von Menschen trainiert.
- Generator erzeugt Bilder: Der Generator nimmt zufällige Eingaben (Rauschen) und erzeugt daraus Bilder von Gesichtern.
- Training: Der Diskriminator bewertet, ob die Bilder vom Generator echt oder gefälscht sind. Basierend auf diesem Feedback verbessert der Generator seine Fähigkeit, realistische Bilder zu erzeugen. Gleichzeitig wird der Diskriminator darin besser, gefälschte Bilder zu erkennen.
Nach mehreren Trainingszyklen wird der Generator so gut darin, realistische Bilder zu erzeugen, dass es für den Diskriminator und menschliche Betrachter schwierig wird, die generierten Bilder von echten Bildern zu unterscheiden. Das Ergebnis sind hochrealistische Bilder von Personen, die es tatsächlich nicht gibt.
Die Fähigkeit von GANs, realistische Bilder zu erzeugen, hat zu zahlreichen innovativen Anwendungen und Projekten geführt, die die Grenzen dessen erweitern, was mit Künstlicher Intelligenz möglich ist.