Zum Inhalt springen
Startseite » Mit der ChatGPT API eigene Modelle bauen

Mit der ChatGPT API eigene Modelle bauen

Um eigene Modelle mit ChatGPT zu erstellen und feinzutunen, kann OpenAI’s API genutzt werden. Mit der API lassen sich Modelle wie GPT-4-turbo auf spezifische Anwendungsfälle zuschneiden, indem man eigene Daten als Beispiele zur Verfügung stellt, die das Modell bei der Bearbeitung ähnlicher Aufgaben verbessern. Der Fine-Tuning-Prozess umfasst mehrere Schritte:

  1. Datenaufbereitung: Die Daten müssen im JSONL-Format (JSON Lines) vorliegen. Dabei sollte jedes Beispiel ein Eingabe-Ausgabe-Paar sein, das die gewünschten Antworten des Modells illustriert.
  2. Daten-Upload: Die Daten werden mit der OpenAI-API hochgeladen.
  3. Fine-Tuning starten: Mit einem API-Aufruf wird der Fine-Tuning-Prozess gestartet. Währenddessen lernt das Modell, wie es ähnliche Anfragen beantworten sollte.
  4. Verwendung des Fine-Tuning-Modells: Nach Abschluss des Trainings kann das feingetunte Modell über die OpenAI-API genutzt werden, indem man die Modell-ID des neu trainierten Modells in seinen API-Aufrufen angibt.

Beispiel: Mietvertragsanalyse

Stellen wir uns vor, du möchtest ein Modell erstellen, das Mietverträge auf häufige rechtliche Fehler untersucht, wie etwa Klauseln zur Kündigung oder Nebenkosten. Der Prozess könnte so aussehen:

  1. Sammeln von Vertragsbeispielen: Sammle Mietverträge oder Vertragsausschnitte (anonymisiert), die entweder korrekte oder fehlerhafte Klauseln enthalten.
  2. Labeln der Daten: Erstelle für jede Vertragsklausel eine Beschreibung im JSONL-Format.
  3. Fine-Tuning des Modells: Lade die JSONL-Datei über die OpenAI-API hoch und starte den Fine-Tuning-Prozess.
  4. Analyse von Mietverträgen: Nachdem das Modell trainiert ist, kann es Texteingaben analysieren und angeben, ob Klauseln gesetzeskonform sind oder häufige Fehler enthalten.
{"prompt": "Kündigungsfrist-Klausel: 'Der Mieter kann das Mietverhältnis jederzeit innerhalb von 2 Wochen kündigen.'", "completion": "Fehler: Die Kündigungsfrist für Mieter beträgt in der Regel 3 Monate, außer bei besonderen Vereinbarungen."}
{"prompt": "Nebenkosten-Klausel: 'Der Mieter trägt alle Kosten für Instandhaltung und Verwaltung.'", "completion": "Fehler: Verwaltungskosten dürfen üblicherweise nicht auf den Mieter umgelegt werden."}
{"prompt": "Klausel zur Mieterhöhung: 'Der Vermieter kann die Miete jährlich um 10 % erhöhen.'", "completion": "Fehler: Die jährliche Mieterhöhung ist gesetzlich auf maximal 15 % in 3 Jahren begrenzt."}

Sobald das Modell feingetunt wurde, lässt es sich über die OpenAI-API nutzen. Dafür sind ein API-Schlüssel und die ID des feingetunten Modells notwendig.

Schritte zur Verwendung des feingetunten Modells

  1. API-Zugriff einrichten: Der API-Schlüssel kann über das OpenAI-Dashboard generiert werden.
  2. Modell-ID des feingetunten Modells: Nach dem Fine-Tuning-Prozess erhält das Modell eine eindeutige Modell-ID (z. B. ft:gpt-4-<datum>-<einzigartige-ID>), die beim API-Aufruf verwendet wird.
  3. API-Aufruf für Mietvertragsanalyse:
    Mit dem feingetunten Modell kann man Mietvertragsklauseln analysieren, indem man die Klausel als Eingabetext über die API sendet. Hier ein Beispiel in Python:
   import openai

   # API-Schlüssel festlegen
   openai.api_key = "api_schlüssel"

   # API-Aufruf mit feingetuntem Modell
   def analyze_clause(clause_text):
       response = openai.Completion.create(
           model="ft:gpt-4-<datum>-<einzigartige-ID>",
           prompt=f"Klausel: '{clause_text}'",
           max_tokens=100,  # Beschränkt die Antwortlänge
           temperature=0  # Sorgt für konsistente Antworten
       )
       return response.choices[0].text.strip()

   # Beispielnutzung
   clause = "Der Mieter trägt alle Kosten für Instandhaltung und Verwaltung."
   result = analyze_clause(clause)
   print("Analyse der Klausel:", result)

Parameter für den API-Aufruf

  • model: Die Modell-ID deines feingetunten Modells, z. B. ft:gpt-4-<datum>-<ID>.
  • prompt: Der Eingabetext, hier die zu analysierende Mietvertragsklausel.
  • max_tokens: Maximale Länge der Antwort, passend zur Komplexität der Klausel.
  • temperature: Hier auf 0 gesetzt, um deterministische, klare Antworten zu erhalten.

Beispielantwort

Angenommen, man sendest die Klausel „Der Mieter trägt alle Kosten für Instandhaltung und Verwaltung.”, könnte die Antwort so aussehen:

"Fehler: Verwaltungskosten dürfen üblicherweise nicht auf den Mieter umgelegt werden."

Das Modell identifiziert so problematische Klauseln und gibt klare Erläuterungen, warum diese gegebenenfalls rechtswidrig sind.

Fazit

Die ChatGPT-API bietet eine flexible Möglichkeit, KI in Anwendungen zu integrieren, von Textgenerierung bis hin zu spezialisierter Analyse. Durch einfache API-Aufrufe und optionales Fine-Tuning lässt sich das Modell effizient für spezifische Anwendungsfälle anpassen. Sie ermöglicht es, Prozesse zu automatisieren und die Nutzererfahrung zu verbessern, ohne hohe Entwicklungs- oder Infrastrukturkosten.