Um eigene Modelle mit ChatGPT zu erstellen und feinzutunen, kann OpenAI’s API genutzt werden. Mit der API lassen sich Modelle wie GPT-4-turbo auf spezifische Anwendungsfälle zuschneiden, indem man eigene Daten als Beispiele zur Verfügung stellt, die das Modell bei der Bearbeitung ähnlicher Aufgaben verbessern. Der Fine-Tuning-Prozess umfasst mehrere Schritte:
- Datenaufbereitung: Die Daten müssen im JSONL-Format (JSON Lines) vorliegen. Dabei sollte jedes Beispiel ein Eingabe-Ausgabe-Paar sein, das die gewünschten Antworten des Modells illustriert.
- Daten-Upload: Die Daten werden mit der OpenAI-API hochgeladen.
- Fine-Tuning starten: Mit einem API-Aufruf wird der Fine-Tuning-Prozess gestartet. Währenddessen lernt das Modell, wie es ähnliche Anfragen beantworten sollte.
- Verwendung des Fine-Tuning-Modells: Nach Abschluss des Trainings kann das feingetunte Modell über die OpenAI-API genutzt werden, indem man die Modell-ID des neu trainierten Modells in seinen API-Aufrufen angibt.
Beispiel: Mietvertragsanalyse
Stellen wir uns vor, du möchtest ein Modell erstellen, das Mietverträge auf häufige rechtliche Fehler untersucht, wie etwa Klauseln zur Kündigung oder Nebenkosten. Der Prozess könnte so aussehen:
- Sammeln von Vertragsbeispielen: Sammle Mietverträge oder Vertragsausschnitte (anonymisiert), die entweder korrekte oder fehlerhafte Klauseln enthalten.
- Labeln der Daten: Erstelle für jede Vertragsklausel eine Beschreibung im JSONL-Format.
- Fine-Tuning des Modells: Lade die JSONL-Datei über die OpenAI-API hoch und starte den Fine-Tuning-Prozess.
- Analyse von Mietverträgen: Nachdem das Modell trainiert ist, kann es Texteingaben analysieren und angeben, ob Klauseln gesetzeskonform sind oder häufige Fehler enthalten.
{"prompt": "Kündigungsfrist-Klausel: 'Der Mieter kann das Mietverhältnis jederzeit innerhalb von 2 Wochen kündigen.'", "completion": "Fehler: Die Kündigungsfrist für Mieter beträgt in der Regel 3 Monate, außer bei besonderen Vereinbarungen."}
{"prompt": "Nebenkosten-Klausel: 'Der Mieter trägt alle Kosten für Instandhaltung und Verwaltung.'", "completion": "Fehler: Verwaltungskosten dürfen üblicherweise nicht auf den Mieter umgelegt werden."}
{"prompt": "Klausel zur Mieterhöhung: 'Der Vermieter kann die Miete jährlich um 10 % erhöhen.'", "completion": "Fehler: Die jährliche Mieterhöhung ist gesetzlich auf maximal 15 % in 3 Jahren begrenzt."}
Sobald das Modell feingetunt wurde, lässt es sich über die OpenAI-API nutzen. Dafür sind ein API-Schlüssel und die ID des feingetunten Modells notwendig.
Schritte zur Verwendung des feingetunten Modells
- API-Zugriff einrichten: Der API-Schlüssel kann über das OpenAI-Dashboard generiert werden.
- Modell-ID des feingetunten Modells: Nach dem Fine-Tuning-Prozess erhält das Modell eine eindeutige Modell-ID (z. B.
ft:gpt-4-<datum>-<einzigartige-ID>
), die beim API-Aufruf verwendet wird. - API-Aufruf für Mietvertragsanalyse:
Mit dem feingetunten Modell kann man Mietvertragsklauseln analysieren, indem man die Klausel als Eingabetext über die API sendet. Hier ein Beispiel in Python:
import openai
# API-Schlüssel festlegen
openai.api_key = "api_schlüssel"
# API-Aufruf mit feingetuntem Modell
def analyze_clause(clause_text):
response = openai.Completion.create(
model="ft:gpt-4-<datum>-<einzigartige-ID>",
prompt=f"Klausel: '{clause_text}'",
max_tokens=100, # Beschränkt die Antwortlänge
temperature=0 # Sorgt für konsistente Antworten
)
return response.choices[0].text.strip()
# Beispielnutzung
clause = "Der Mieter trägt alle Kosten für Instandhaltung und Verwaltung."
result = analyze_clause(clause)
print("Analyse der Klausel:", result)
Parameter für den API-Aufruf
model
: Die Modell-ID deines feingetunten Modells, z. B.ft:gpt-4-<datum>-<ID>
.prompt
: Der Eingabetext, hier die zu analysierende Mietvertragsklausel.max_tokens
: Maximale Länge der Antwort, passend zur Komplexität der Klausel.temperature
: Hier auf0
gesetzt, um deterministische, klare Antworten zu erhalten.
Beispielantwort
Angenommen, man sendest die Klausel „Der Mieter trägt alle Kosten für Instandhaltung und Verwaltung.”, könnte die Antwort so aussehen:
"Fehler: Verwaltungskosten dürfen üblicherweise nicht auf den Mieter umgelegt werden."
Das Modell identifiziert so problematische Klauseln und gibt klare Erläuterungen, warum diese gegebenenfalls rechtswidrig sind.
Fazit
Die ChatGPT-API bietet eine flexible Möglichkeit, KI in Anwendungen zu integrieren, von Textgenerierung bis hin zu spezialisierter Analyse. Durch einfache API-Aufrufe und optionales Fine-Tuning lässt sich das Modell effizient für spezifische Anwendungsfälle anpassen. Sie ermöglicht es, Prozesse zu automatisieren und die Nutzererfahrung zu verbessern, ohne hohe Entwicklungs- oder Infrastrukturkosten.