Distill vs Extract

Thunderbit expose deux endpoints IA — /distill et /extract — qui résolvent des problèmes différents. Choisir le bon est le facteur le plus déterminant pour le coût, la latence et la qualité de la sortie.

Quand utiliser Distill

Tu veux du Markdown propre et prêt pour LLM de toute la page
Le consommateur en aval est un vector store, un pipeline RAG ou un contexte LLM
Tu ne sais pas à l'avance de quels champs tu auras besoin

Quand utiliser Extract

Tu connais exactement les champs que tu veux en données structurées (JSON)
Le consommateur en aval est une base de données, un dashboard ou du code typé
Tu veux que le modèle fasse du raisonnement au niveau du champ (par exemple « quelle est la remise ? »)

Compromis coût et latence

	Distill	Extract
Crédits	1 / page	20 / page
Latence	Plus basse (pas d'étape d'extraction IA)	Plus haute (étape IA + validation du Schema)
Sortie	Markdown	JSON conforme à ton Schema

Matrice de décision

Si ta sortie est du contenu (texte, articles, entrées de base de connaissances) → Distill. Si ta sortie est constituée d'enregistrements (lignes, champs, valeurs typées) → Extract. Si tu n'es pas sûr, commence par Distill — tu peux toujours lancer Extract sur le Markdown plus tard.

Cette page est en cours d'enrichissement avec des exemples concrets — reviens bientôt.

Quand utiliser Distill

Quand utiliser Extract

Compromis coût et latence

Matrice de décision

On this page