Guides
Distill vs Extract
Quel endpoint utiliser, quand et pourquoi
Thunderbit expose deux endpoints IA — /distill et /extract — qui résolvent des problèmes différents. Choisir le bon est le facteur le plus déterminant pour le coût, la latence et la qualité de la sortie.
Quand utiliser Distill
- Tu veux du Markdown propre et prêt pour LLM de toute la page
- Le consommateur en aval est un vector store, un pipeline RAG ou un contexte LLM
- Tu ne sais pas à l'avance de quels champs tu auras besoin
Quand utiliser Extract
- Tu connais exactement les champs que tu veux en données structurées (JSON)
- Le consommateur en aval est une base de données, un dashboard ou du code typé
- Tu veux que le modèle fasse du raisonnement au niveau du champ (par exemple « quelle est la remise ? »)
Compromis coût et latence
| Distill | Extract | |
|---|---|---|
| Crédits | 1 / page | 20 / page |
| Latence | Plus basse (pas d'étape d'extraction IA) | Plus haute (étape IA + validation du Schema) |
| Sortie | Markdown | JSON conforme à ton Schema |
Matrice de décision
Si ta sortie est du contenu (texte, articles, entrées de base de connaissances) → Distill. Si ta sortie est constituée d'enregistrements (lignes, champs, valeurs typées) → Extract. Si tu n'es pas sûr, commence par Distill — tu peux toujours lancer Extract sur le Markdown plus tard.
Cette page est en cours d'enrichissement avec des exemples concrets — reviens bientôt.