FAQ | Thunderbit API

P: Posso raspar sites que exigem login? R: Hoje, não. Você pode passar cookies ou tokens de auth via o parâmetro headers para sites que aceitem, mas fluxos de login interativos não são suportados via API. Entre em contato para opções enterprise.

P: Qual é o tamanho máximo de página? R: 10 MB de HTML antes do processamento. Páginas que excedem isso retornam SCRAPE_CONTENT_TOO_LARGE.

P: Quão fresca é a data? R: O comportamento padrão busca ao vivo, em toda chamada. Defina forceRefresh: true para ignorar qualquer camada de cache interna explicitamente.

P: Posso rodar múltiplos jobs em batch em paralelo? R: Sim — o limite por batch é 100 URLs, mas não há cap no número de jobs em batch concorrentes (sujeito à concorrência do seu plano).

P: O que acontece se uma única URL em um batch falhar? R: O batch continua. A URL que falhou recebe status: "FAILED" com um código de erro; as outras têm sucesso. O job vai para COMPLETED assim que todas as URLs atingem um estado terminal.

P: A API respeita robots.txt? R: Respeitamos robots.txt para distillation por padrão. Planos enterprise podem solicitar override por domínio com prova de autorização.

P: Posso usar schema e prompt juntos no /extract? R: Não — eles são mutuamente exclusivos (SCHEMA_AND_PROMPT_EXCLUSIVE). Hoje, schema é o único modo suportado; extração só com prompt está no roadmap.

P: Como sou notificado quando um batch longo termina? R: Use o campo webhook na submissão. Polling também funciona, mas Webhooks são mais baratos para jobs com mais de 1 minuto. Veja Webhooks.

P: Como reporto um bug ou solicito uma feature? R: Envie e-mail para support@thunderbit.com ou use o formulário de contato in-app no dashboard.