Guide

FAQ

Domande frequenti

D: Posso fare scraping di siti che richiedono il login? R: Oggi no. Puoi passare cookie o token di auth tramite il parametro headers per i siti che li accettano, ma i flussi di login interattivi non sono supportati via API. Contattaci per opzioni enterprise.

D: Qual è la dimensione massima della pagina? R: 10 MB di HTML prima dell'elaborazione. Le pagine che superano questa soglia restituiscono SCRAPE_CONTENT_TOO_LARGE.

D: Quanto sono freschi i dati? R: Il comportamento predefinito recupera dati live ad ogni chiamata. Imposta forceRefresh: true per bypassare esplicitamente qualsiasi livello di cache interno.

D: Posso eseguire più batch job in parallelo? R: Sì — il limite per batch è di 100 URL, ma non c'è un tetto sul numero di batch job concorrenti (soggetto alla concorrenza del tuo piano).

D: Cosa succede se un singolo URL in un batch fallisce? R: Il batch va avanti. L'URL che fallisce ottiene status: "FAILED" con un codice di errore; gli altri vanno a buon fine. Il job passa a COMPLETED una volta che tutti gli URL raggiungono uno stato terminale.

D: L'API rispetta robots.txt? R: Onoriamo robots.txt per la distillazione per impostazione predefinita. I piani enterprise possono richiedere l'override su base per dominio con prova di autorizzazione.

D: Posso usare sia schema che prompt su /extract? R: No — sono mutuamente esclusivi (SCHEMA_AND_PROMPT_EXCLUSIVE). Oggi schema è l'unica modalità supportata; l'estrazione solo con prompt è in roadmap.

D: Come ricevo notifica quando un batch lungo finisce? R: Usa il campo webhook al momento dell'invio. Anche il polling funziona, ma i webhook sono più economici per job che durano > 1 minuto. Vedi Webhooks.

D: Come segnalo un bug o richiedo una feature? R: Scrivi a support@thunderbit.com o usa il modulo di contatto in-app sulla dashboard.