Guías

Distill vs Extract

Qué endpoint usar, cuándo y por qué

Thunderbit expone dos endpoints de IA — /distill y /extract — que resuelven problemas distintos. Elegir el correcto es el factor más determinante en coste, latencia y calidad de salida.

Cuándo usar Distill

  • Quieres Markdown limpio y listo para LLM de una página entera
  • El consumidor downstream es un vector store, un pipeline RAG o el contexto de un LLM
  • No sabes de antemano qué campos vas a necesitar

Cuándo usar Extract

  • Conoces exactamente los campos que quieres como datos estructurados (JSON)
  • El consumidor downstream es una base de datos, un panel o código tipado
  • Quieres que el modelo razone a nivel de campo (p. ej. "¿cuál es el descuento?")

Compensaciones de coste y latencia

DistillExtract
Créditos1 / página20 / página
LatenciaMenor (sin paso de extracción con IA)Mayor (paso de IA + validación de Schema)
SalidaMarkdownJSON conforme a tu Schema

Matriz de decisión

Si tu salida es contenido (texto, artículos, entradas de base de conocimiento) → Distill. Si tu salida son registros (filas, campos, valores tipados) → Extract. Si no estás seguro, empieza con Distill — siempre puedes ejecutar Extract sobre el Markdown más tarde.

Esta página se está ampliando con ejemplos concretos — vuelve pronto.