Anleitungen
Distill vs Extract
Welcher Endpunkt wann und warum
Thunderbit stellt zwei KI-Endpunkte bereit — /distill und /extract — die unterschiedliche Probleme lösen. Den richtigen zu wählen ist der größte Einzelfaktor für Kosten, Latenz und Ausgabequalität.
Wann Distill nutzen
- Du willst sauberes, LLM-fertiges Markdown einer ganzen Seite
- Der nachgelagerte Konsument ist ein Vektorspeicher, eine RAG-Pipeline oder ein LLM-Kontext
- Du weißt im Voraus nicht, welche Felder du brauchst
Wann Extract nutzen
- Du kennst die genauen Felder, die du als strukturierte Daten (JSON) willst
- Der nachgelagerte Konsument ist eine Datenbank, ein Dashboard oder typisierter Code
- Du willst, dass das Modell auf Feldebene argumentiert (z. B. „Wie hoch ist der Rabatt?")
Kosten- & Latenz-Trade-offs
| Distill | Extract | |
|---|---|---|
| Credits | 1 / Seite | 20 / Seite |
| Latenz | Niedriger (kein KI-Extraktionsschritt) | Höher (KI-Schritt + Schema-Validierung) |
| Ausgabe | Markdown | JSON, das deinem Schema entspricht |
Entscheidungsmatrix
Wenn deine Ausgabe Inhalt ist (Text, Artikel, Wissensdatenbank-Einträge) → Distill. Wenn deine Ausgabe Datensätze sind (Zeilen, Felder, typisierte Werte) → Extract. Wenn du unsicher bist, fang mit Distill an — du kannst später jederzeit Extract auf dem Markdown laufen lassen.
Diese Seite wird mit konkreten Beispielen erweitert — schau bald wieder vorbei.