Gidsen

FAQ

Veelgestelde vragen

V: Kan ik sites scrapen die login vereisen? A: Vandaag niet. Je kunt cookies of auth-Tokens meegeven via de headers-parameter voor sites die dat accepteren, maar interactieve loginflows worden niet ondersteund via de API. Neem contact op voor enterprise-opties.

V: Wat is de maximale paginagrootte? A: 10 MB HTML vóór verwerking. Pagina's die dit overschrijden geven SCRAPE_CONTENT_TOO_LARGE terug.

V: Hoe vers is de data? A: Standaardgedrag haalt live op, bij elke aanroep. Stel forceRefresh: true in om expliciet eventuele interne cachelaag te omzeilen.

V: Kan ik meerdere batchjobs parallel uitvoeren? A: Ja — de limiet per batch is 100 URL's, maar er is geen plafond op het aantal gelijktijdige batchjobs (afhankelijk van de concurrency van je plan).

V: Wat gebeurt er als één URL in een batch mislukt? A: De batch gaat door. De mislukkende URL krijgt status: "FAILED" met een foutcode; de rest slaagt. De job gaat naar COMPLETED zodra alle URL's een eindstatus bereiken.

V: Respecteert de API robots.txt? A: We respecteren robots.txt standaard voor distillatie. Enterprise-plannen kunnen override aanvragen per domein met bewijs van autorisatie.

V: Kan ik zowel schema als prompt gebruiken op /extract? A: Nee — ze sluiten elkaar uit (SCHEMA_AND_PROMPT_EXCLUSIVE). Vandaag is schema de enige ondersteunde modus; prompt-only-extractie staat op de roadmap.

V: Hoe word ik op de hoogte gebracht wanneer een lange batch klaar is? A: Gebruik het webhook-veld bij indienen. Polling werkt ook, maar Webhooks zijn goedkoper voor jobs die langer duren dan 1 minuut. Zie Webhooks.

V: Hoe meld ik een bug of vraag ik een feature aan? A: Mail support@thunderbit.com of gebruik het in-app contactformulier op het dashboard.