Anleitungen

Distill vs Extract

Welcher Endpunkt wann und warum

Thunderbit stellt zwei KI-Endpunkte bereit — /distill und /extract — die unterschiedliche Probleme lösen. Den richtigen zu wählen ist der größte Einzelfaktor für Kosten, Latenz und Ausgabequalität.

Wann Distill nutzen

  • Du willst sauberes, LLM-fertiges Markdown einer ganzen Seite
  • Der nachgelagerte Konsument ist ein Vektorspeicher, eine RAG-Pipeline oder ein LLM-Kontext
  • Du weißt im Voraus nicht, welche Felder du brauchst

Wann Extract nutzen

  • Du kennst die genauen Felder, die du als strukturierte Daten (JSON) willst
  • Der nachgelagerte Konsument ist eine Datenbank, ein Dashboard oder typisierter Code
  • Du willst, dass das Modell auf Feldebene argumentiert (z. B. „Wie hoch ist der Rabatt?")

Kosten- & Latenz-Trade-offs

DistillExtract
Credits1 / Seite20 / Seite
LatenzNiedriger (kein KI-Extraktionsschritt)Höher (KI-Schritt + Schema-Validierung)
AusgabeMarkdownJSON, das deinem Schema entspricht

Entscheidungsmatrix

Wenn deine Ausgabe Inhalt ist (Text, Artikel, Wissensdatenbank-Einträge) → Distill. Wenn deine Ausgabe Datensätze sind (Zeilen, Felder, typisierte Werte) → Extract. Wenn du unsicher bist, fang mit Distill an — du kannst später jederzeit Extract auf dem Markdown laufen lassen.

Diese Seite wird mit konkreten Beispielen erweitert — schau bald wieder vorbei.