Guide
Distill vs Extract
Quale endpoint usare, quando e perché
Thunderbit espone due endpoint AI — /distill ed /extract — che risolvono problemi diversi. Sceglierne il giusto è il singolo fattore più importante per costo, latenza e qualità dell'output.
Quando usare Distill
- Vuoi Markdown pulito e pronto per LLM di un'intera pagina
- Il consumatore a valle è un vector store, una pipeline RAG o un contesto LLM
- Non sai in anticipo quali campi ti serviranno
Quando usare Extract
- Conosci esattamente i campi che vuoi come dati strutturati (JSON)
- Il consumatore a valle è un database, una dashboard o codice tipizzato
- Vuoi che il modello faccia ragionamento a livello di campo (es. "qual è lo sconto?")
Compromessi tra costo e latenza
| Distill | Extract | |
|---|---|---|
| Crediti | 1 / pagina | 20 / pagina |
| Latenza | Più bassa (nessuno step di estrazione AI) | Più alta (step AI + validazione schema) |
| Output | Markdown | JSON conforme al tuo schema |
Matrice decisionale
Se il tuo output è contenuto (testo, articoli, voci di knowledge base) → Distill. Se il tuo output sono record (righe, campi, valori tipizzati) → Extract. Se non sei sicuro, parti da Distill — puoi sempre eseguire Extract sul markdown in seguito.
Questa pagina è in fase di ampliamento con esempi concreti — torna a controllare presto.