Distill vs Extract

Thunderbit espone due endpoint AI — /distill ed /extract — che risolvono problemi diversi. Sceglierne il giusto è il singolo fattore più importante per costo, latenza e qualità dell'output.

Quando usare Distill

Vuoi Markdown pulito e pronto per LLM di un'intera pagina
Il consumatore a valle è un vector store, una pipeline RAG o un contesto LLM
Non sai in anticipo quali campi ti serviranno

Quando usare Extract

Conosci esattamente i campi che vuoi come dati strutturati (JSON)
Il consumatore a valle è un database, una dashboard o codice tipizzato
Vuoi che il modello faccia ragionamento a livello di campo (es. "qual è lo sconto?")

Compromessi tra costo e latenza

	Distill	Extract
Crediti	1 / pagina	20 / pagina
Latenza	Più bassa (nessuno step di estrazione AI)	Più alta (step AI + validazione schema)
Output	Markdown	JSON conforme al tuo schema

Se il tuo output è contenuto (testo, articoli, voci di knowledge base) → Distill. Se il tuo output sono record (righe, campi, valori tipizzati) → Extract. Se non sei sicuro, parti da Distill — puoi sempre eseguire Extract sul markdown in seguito.

Questa pagina è in fase di ampliamento con esempi concreti — torna a controllare presto.

Quando usare Distill

Quando usare Extract

Compromessi tra costo e latenza

Matrice decisionale

On this page