Was ist verteiltes maschinelles Lernen?

Verteiltes maschinelles Lernen (Distributed Machine Learning) ist eine Methode, bei der die Berechnungen und das Training von Machine-Learning-Modellen auf mehrere Geräte, Server oder Knoten verteilt werden. Dieser Ansatz wird verwendet, um große Datenmengen zu verarbeiten und komplexe Modelle zu trainieren, die auf einzelnen Maschinen zu lange dauern oder zu viel Speicher benötigen würden. Ziel des verteilten Lernens ist es, Rechenkapazitäten zu skalieren, Zeit zu sparen und Systeme effizienter zu nutzen. Es gibt dabei zwei Hauptansätze:

Modellparallelität: Das Modell selbst wird auf verschiedene Knoten aufgeteilt. Dies wird vor allem bei sehr großen Modellen genutzt, die nicht auf den Speicher eines einzelnen Geräts passen. Jeder Knoten übernimmt einen Teil der Berechnungen für das Modell.

Datenparallelität: Die Daten werden auf verschiedene Knoten aufgeteilt, und jeder Knoten trainiert ein Modell auf einem Teil der Daten. Die Modelle werden regelmäßig synchronisiert, um die Lernfortschritte zu teilen. So können große Datenmengen effizient verarbeitet werden.

Beispiel: Training eines großen Sprachmodells

Ein Sprachmodell wie GPT-4 wird auf riesigen Datenmengen trainiert, die aus Milliarden von Textbeispielen bestehen. Das Modell selbst enthält oft Milliarden von Parametern, was enormen Speicher und Rechenkapazität erfordert. Ein einzelner Computer würde für das Training Jahre brauchen und könnte aufgrund der Speicheranforderungen viele Teile des Modells gar nicht verarbeiten.

Modellparallelität: Ein so großes Modell passt oft nicht komplett in den Speicher eines Servers. Daher werden die Berechnungen auf verschiedene Server verteilt: Server A berechnet zum Beispiel die ersten Schichten des Modells, Server B die mittleren, und Server C die letzten. Die Zwischenresultate werden von Server zu Server weitergeleitet.

Datenparallelität: Die Trainingsdaten (Texte) werden in kleinere Datensätze aufgeteilt und an verschiedene Server geschickt. Jeder Server trainiert ein identisches Modell mit einem Teil der Daten. In regelmäßigen Abständen tauschen die Server ihre Gewichte (Parameter) aus, um sicherzustellen, dass alle Modelle von den Daten aller Server lernen.

Durch die Verteilung der Daten und der Berechnungen kann das Modell in deutlich kürzerer Zeit trainiert werden.

Föderiertes Lernen als verteiltes Lernen

Zusätzlich gibt es föderiertes Lernen als besonderen Fall des verteilten maschinellen Lernens, bei dem mehrere Geräte (wie Smartphones) ein gemeinsames Modell trainieren, ohne dass Daten zentral gesammelt werden. Dies ist vorteilhaft für Datenschutz und Datensicherheit, da die Daten lokal bleiben.

Cookie	Dauer	Beschreibung
cookielawinfo-checkbox-advertisement	1 year	Set by the GDPR Cookie Consent plugin, this cookie is used to record the user consent for the cookies in the "Advertisement" category .
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
CookieLawInfoConsent	1 year	Records the default button state of the corresponding category & the status of CCPA. It works only in coordination with the primary cookie.
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

Cookie	Dauer	Beschreibung
__gads	1 year 24 days	The __gads cookie, set by Google, is stored under DoubleClick domain and tracks the number of times users see an advert, measures the success of the campaign and calculates its revenue. This cookie can only be read from the domain they are set on and will not track any data while browsing through other sites.
_ga	2 years	The _ga cookie, installed by Google Analytics, calculates visitor, session and campaign data and also keeps track of site usage for the site's analytics report. The cookie stores information anonymously and assigns a randomly generated number to recognize unique visitors.
_ga_8EVYKBJE0L	2 years	This cookie is installed by Google Analytics.
_ga_ECCBGK6LZQ	2 years	This cookie is installed by Google Analytics.
_gat_gtag_UA_216518707_1	1 minute	Set by Google to distinguish users.
_gid	1 day	Installed by Google Analytics, _gid cookie stores information on how visitors use a website, while also creating an analytics report of the website's performance. Some of the data that are collected include the number of visitors, their source, and the pages they visit anonymously.