Guias
Boas Práticas
Dicas operacionais para uso em produção
- Faça cache agressivamente. Respostas do Distill são determinísticas para páginas estáticas — faça cache do markdown por hash de URL no seu lado e ignore o cache com
forceRefresh: trueapenas quando precisar de dados frescos. - Use
includeem vez dos booleans legados.includeHtml: trueeextractLinks: trueainda funcionam; o novo arrayinclude: ["metadata", "links"]é composável e mais claro em code review. - Prefira batch a loops. Um batch de 50 URLs retorna um Job ID; 50 chamadas individuais ao
/distillqueimam rate limit e concorrência. - Use webhooks para jobs >10 URLs. Polling a cada 5 segundos para um job de 5 minutos desperdiça ~60 round-trips. Veja Webhooks.
- Espere apenas quando necessário.
waitFor: 2000dobra seu orçamento de latência — use só para SPAs que hidratam devagar. - Fixe um
countryCodeao raspar sites geo-aware (preço, resultados de busca, e-commerce). O padrão é US. - Comece com
renderMode: "none"e suba parabasicoufullapenas se a página retornar vazia — a maioria das páginas não precisa de browser headless. Veja Modos de Renderização. - Seja específico em schemas.
descriptions de campos são lidas pela IA;"product MSRP in USD before discount"extrai com mais confiabilidade do que"price". Veja Design de Schema. - Faça handlers de Webhook idempotentes. Um Webhook pode disparar mais de uma vez para o mesmo Job ID sob partição de rede.