Guide

Distill vs Extract

Quale endpoint usare, quando e perché

Thunderbit espone due endpoint AI — /distill ed /extract — che risolvono problemi diversi. Sceglierne il giusto è il singolo fattore più importante per costo, latenza e qualità dell'output.

Quando usare Distill

  • Vuoi Markdown pulito e pronto per LLM di un'intera pagina
  • Il consumatore a valle è un vector store, una pipeline RAG o un contesto LLM
  • Non sai in anticipo quali campi ti serviranno

Quando usare Extract

  • Conosci esattamente i campi che vuoi come dati strutturati (JSON)
  • Il consumatore a valle è un database, una dashboard o codice tipizzato
  • Vuoi che il modello faccia ragionamento a livello di campo (es. "qual è lo sconto?")

Compromessi tra costo e latenza

DistillExtract
Crediti1 / pagina20 / pagina
LatenzaPiù bassa (nessuno step di estrazione AI)Più alta (step AI + validazione schema)
OutputMarkdownJSON conforme al tuo schema

Matrice decisionale

Se il tuo output è contenuto (testo, articoli, voci di knowledge base) → Distill. Se il tuo output sono record (righe, campi, valori tipizzati) → Extract. Se non sei sicuro, parti da Distill — puoi sempre eseguire Extract sul markdown in seguito.

Questa pagina è in fase di ampliamento con esempi concreti — torna a controllare presto.