Guías
Distill vs Extract
Qué endpoint usar, cuándo y por qué
Thunderbit expone dos endpoints de IA — /distill y /extract — que resuelven problemas distintos. Elegir el correcto es el factor más determinante en coste, latencia y calidad de salida.
Cuándo usar Distill
- Quieres Markdown limpio y listo para LLM de una página entera
- El consumidor downstream es un vector store, un pipeline RAG o el contexto de un LLM
- No sabes de antemano qué campos vas a necesitar
Cuándo usar Extract
- Conoces exactamente los campos que quieres como datos estructurados (JSON)
- El consumidor downstream es una base de datos, un panel o código tipado
- Quieres que el modelo razone a nivel de campo (p. ej. "¿cuál es el descuento?")
Compensaciones de coste y latencia
| Distill | Extract | |
|---|---|---|
| Créditos | 1 / página | 20 / página |
| Latencia | Menor (sin paso de extracción con IA) | Mayor (paso de IA + validación de Schema) |
| Salida | Markdown | JSON conforme a tu Schema |
Matriz de decisión
Si tu salida es contenido (texto, artículos, entradas de base de conocimiento) → Distill. Si tu salida son registros (filas, campos, valores tipados) → Extract. Si no estás seguro, empieza con Distill — siempre puedes ejecutar Extract sobre el Markdown más tarde.
Esta página se está ampliando con ejemplos concretos — vuelve pronto.