Distill vs Extract

A Thunderbit expõe dois endpoints de IA — /distill e /extract — que resolvem problemas diferentes. Escolher o certo é o maior fator isolado em custo, latência e qualidade da saída.

Quando usar Distill

Você quer Markdown limpo e pronto para LLM de uma página inteira
O consumidor downstream é um vector store, pipeline RAG ou contexto de LLM
Você não sabe de antemão quais campos vai precisar

Quando usar Extract

Você sabe os campos exatos que quer como dados estruturados (JSON)
O consumidor downstream é um banco de dados, dashboard ou código tipado
Você quer que o modelo faça raciocínio em nível de campo (ex.: "qual é o desconto?")

Tradeoffs de custo e latência

	Distill	Extract
Créditos	1 / página	20 / página
Latência	Menor (sem etapa de extração por IA)	Maior (etapa de IA + validação de schema)
Saída	Markdown	JSON conforme seu schema

Se sua saída é conteúdo (texto, artigos, entradas de base de conhecimento) → Distill. Se sua saída são registros (linhas, campos, valores tipados) → Extract. Se estiver em dúvida, comece com Distill — você sempre pode rodar Extract no markdown depois.

Esta página está sendo expandida com exemplos concretos — volte em breve.

Quando usar Distill

Quando usar Extract

Tradeoffs de custo e latência

Matriz de decisão

On this page