FAQ
Perguntas frequentes
P: Posso raspar sites que exigem login?
R: Hoje, não. Você pode passar cookies ou tokens de auth via o parâmetro headers para sites que aceitem, mas fluxos de login interativos não são suportados via API. Entre em contato para opções enterprise.
P: Qual é o tamanho máximo de página?
R: 10 MB de HTML antes do processamento. Páginas que excedem isso retornam SCRAPE_CONTENT_TOO_LARGE.
P: Quão fresca é a data?
R: O comportamento padrão busca ao vivo, em toda chamada. Defina forceRefresh: true para ignorar qualquer camada de cache interna explicitamente.
P: Posso rodar múltiplos jobs em batch em paralelo? R: Sim — o limite por batch é 100 URLs, mas não há cap no número de jobs em batch concorrentes (sujeito à concorrência do seu plano).
P: O que acontece se uma única URL em um batch falhar?
R: O batch continua. A URL que falhou recebe status: "FAILED" com um código de erro; as outras têm sucesso. O job vai para COMPLETED assim que todas as URLs atingem um estado terminal.
P: A API respeita robots.txt?
R: Respeitamos robots.txt para distillation por padrão. Planos enterprise podem solicitar override por domínio com prova de autorização.
P: Posso usar schema e prompt juntos no /extract?
R: Não — eles são mutuamente exclusivos (SCHEMA_AND_PROMPT_EXCLUSIVE). Hoje, schema é o único modo suportado; extração só com prompt está no roadmap.
P: Como sou notificado quando um batch longo termina?
R: Use o campo webhook na submissão. Polling também funciona, mas Webhooks são mais baratos para jobs com mais de 1 minuto. Veja Webhooks.
P: Como reporto um bug ou solicito uma feature? R: Envie e-mail para support@thunderbit.com ou use o formulário de contato in-app no dashboard.