Anleitungen

Schema-Design

JSON Schemas entwerfen, die die KI zuverlässig extrahieren kann

Das Schema, das du an /extract übergibst, ist gleichzeitig ein Prompt. Jeder Feldname, jede Beschreibung und jeder Typ-Hinweis wird vom Modell gelesen. Ein gut geformtes Schema verbessert die Genauigkeit drastisch.

Feldbenennung

Verwende Namen, die sich wie Englisch lesen. Das Modell kommt mit productName viel besser zurecht als mit pn oder name1.

{ "type": "object", "properties": {
  "productName": { "type": "string" },
  "currentPrice": { "type": "number" }
} }

Feldbeschreibungen

Füge bei allem, was mehrdeutig ist, eine description hinzu. "price" könnte UVP, aktueller Preis oder Stückpreis sein — sei explizit:

{ "currentPrice": {
  "type": "number",
  "description": "Final price after discount, in USD"
} }

Pflicht vs. optional

Markiere nur die Felder als pflichtig, die du wirklich brauchst. Pflichtfelder lassen die gesamte Extraktion fehlschlagen, wenn das Modell sie nicht findet — sparsam einsetzen.

Verschachtelung

Bevorzuge eine Ebene Verschachtelung, wo sinnvoll (address.city). Tiefere Verschachtelung (3+ Ebenen) verschlechtert tendenziell die Extraktionsqualität.

Häufige Fallstricke

  • Mehrdeutige Typen verwenden (string für Zahlen wie "$19.99") — bevorzuge number und lass das Modell parsen
  • Vage Enums ohne Beschreibung
  • Pflichtfelder, die nicht auf jeder Seite tatsächlich vorhanden sind

Diese Seite wird mit einem Schema-Kochbuch erweitert — schau bald wieder vorbei.