Guides

Distill vs Extract

Quel endpoint utiliser, quand et pourquoi

Thunderbit expose deux endpoints IA — /distill et /extract — qui résolvent des problèmes différents. Choisir le bon est le facteur le plus déterminant pour le coût, la latence et la qualité de la sortie.

Quand utiliser Distill

  • Tu veux du Markdown propre et prêt pour LLM de toute la page
  • Le consommateur en aval est un vector store, un pipeline RAG ou un contexte LLM
  • Tu ne sais pas à l'avance de quels champs tu auras besoin

Quand utiliser Extract

  • Tu connais exactement les champs que tu veux en données structurées (JSON)
  • Le consommateur en aval est une base de données, un dashboard ou du code typé
  • Tu veux que le modèle fasse du raisonnement au niveau du champ (par exemple « quelle est la remise ? »)

Compromis coût et latence

DistillExtract
Crédits1 / page20 / page
LatencePlus basse (pas d'étape d'extraction IA)Plus haute (étape IA + validation du Schema)
SortieMarkdownJSON conforme à ton Schema

Matrice de décision

Si ta sortie est du contenu (texte, articles, entrées de base de connaissances) → Distill. Si ta sortie est constituée d'enregistrements (lignes, champs, valeurs typées) → Extract. Si tu n'es pas sûr, commence par Distill — tu peux toujours lancer Extract sur le Markdown plus tard.

Cette page est en cours d'enrichissement avec des exemples concrets — reviens bientôt.