FAQ
Domande frequenti
D: Posso fare scraping di siti che richiedono il login?
R: Oggi no. Puoi passare cookie o token di auth tramite il parametro headers per i siti che li accettano, ma i flussi di login interattivi non sono supportati via API. Contattaci per opzioni enterprise.
D: Qual è la dimensione massima della pagina?
R: 10 MB di HTML prima dell'elaborazione. Le pagine che superano questa soglia restituiscono SCRAPE_CONTENT_TOO_LARGE.
D: Quanto sono freschi i dati?
R: Il comportamento predefinito recupera dati live ad ogni chiamata. Imposta forceRefresh: true per bypassare esplicitamente qualsiasi livello di cache interno.
D: Posso eseguire più batch job in parallelo? R: Sì — il limite per batch è di 100 URL, ma non c'è un tetto sul numero di batch job concorrenti (soggetto alla concorrenza del tuo piano).
D: Cosa succede se un singolo URL in un batch fallisce?
R: Il batch va avanti. L'URL che fallisce ottiene status: "FAILED" con un codice di errore; gli altri vanno a buon fine. Il job passa a COMPLETED una volta che tutti gli URL raggiungono uno stato terminale.
D: L'API rispetta robots.txt?
R: Onoriamo robots.txt per la distillazione per impostazione predefinita. I piani enterprise possono richiedere l'override su base per dominio con prova di autorizzazione.
D: Posso usare sia schema che prompt su /extract?
R: No — sono mutuamente esclusivi (SCHEMA_AND_PROMPT_EXCLUSIVE). Oggi schema è l'unica modalità supportata; l'estrazione solo con prompt è in roadmap.
D: Come ricevo notifica quando un batch lungo finisce?
R: Usa il campo webhook al momento dell'invio. Anche il polling funziona, ma i webhook sono più economici per job che durano > 1 minuto. Vedi Webhooks.
D: Come segnalo un bug o richiedo una feature? R: Scrivi a support@thunderbit.com o usa il modulo di contatto in-app sulla dashboard.