Distill vs Extract

Thunderbit stellt zwei KI-Endpunkte bereit — /distill und /extract — die unterschiedliche Probleme lösen. Den richtigen zu wählen ist der größte Einzelfaktor für Kosten, Latenz und Ausgabequalität.

Wann Distill nutzen

Du willst sauberes, LLM-fertiges Markdown einer ganzen Seite
Der nachgelagerte Konsument ist ein Vektorspeicher, eine RAG-Pipeline oder ein LLM-Kontext
Du weißt im Voraus nicht, welche Felder du brauchst

Wann Extract nutzen

Du kennst die genauen Felder, die du als strukturierte Daten (JSON) willst
Der nachgelagerte Konsument ist eine Datenbank, ein Dashboard oder typisierter Code
Du willst, dass das Modell auf Feldebene argumentiert (z. B. „Wie hoch ist der Rabatt?")

Kosten- & Latenz-Trade-offs

	Distill	Extract
Credits	1 / Seite	20 / Seite
Latenz	Niedriger (kein KI-Extraktionsschritt)	Höher (KI-Schritt + Schema-Validierung)
Ausgabe	Markdown	JSON, das deinem Schema entspricht

Entscheidungsmatrix

Wenn deine Ausgabe Inhalt ist (Text, Artikel, Wissensdatenbank-Einträge) → Distill. Wenn deine Ausgabe Datensätze sind (Zeilen, Felder, typisierte Werte) → Extract. Wenn du unsicher bist, fang mit Distill an — du kannst später jederzeit Extract auf dem Markdown laufen lassen.

Diese Seite wird mit konkreten Beispielen erweitert — schau bald wieder vorbei.

Wann Distill nutzen

Wann Extract nutzen

Kosten- & Latenz-Trade-offs

Entscheidungsmatrix

On this page