Distill vs Extract

Thunderbit expone dos endpoints de IA — /distill y /extract — que resuelven problemas distintos. Elegir el correcto es el factor más determinante en coste, latencia y calidad de salida.

Cuándo usar Distill

Quieres Markdown limpio y listo para LLM de una página entera
El consumidor downstream es un vector store, un pipeline RAG o el contexto de un LLM
No sabes de antemano qué campos vas a necesitar

Cuándo usar Extract

Conoces exactamente los campos que quieres como datos estructurados (JSON)
El consumidor downstream es una base de datos, un panel o código tipado
Quieres que el modelo razone a nivel de campo (p. ej. "¿cuál es el descuento?")

Compensaciones de coste y latencia

	Distill	Extract
Créditos	1 / página	20 / página
Latencia	Menor (sin paso de extracción con IA)	Mayor (paso de IA + validación de Schema)
Salida	Markdown	JSON conforme a tu Schema

Si tu salida es contenido (texto, artículos, entradas de base de conocimiento) → Distill. Si tu salida son registros (filas, campos, valores tipados) → Extract. Si no estás seguro, empieza con Distill — siempre puedes ejecutar Extract sobre el Markdown más tarde.

Esta página se está ampliando con ejemplos concretos — vuelve pronto.

Cuándo usar Distill

Cuándo usar Extract

Compensaciones de coste y latencia

Matriz de decisión

On this page