FAQ
Veelgestelde vragen
V: Kan ik sites scrapen die login vereisen?
A: Vandaag niet. Je kunt cookies of auth-Tokens meegeven via de headers-parameter voor sites die dat accepteren, maar interactieve loginflows worden niet ondersteund via de API. Neem contact op voor enterprise-opties.
V: Wat is de maximale paginagrootte?
A: 10 MB HTML vóór verwerking. Pagina's die dit overschrijden geven SCRAPE_CONTENT_TOO_LARGE terug.
V: Hoe vers is de data?
A: Standaardgedrag haalt live op, bij elke aanroep. Stel forceRefresh: true in om expliciet eventuele interne cachelaag te omzeilen.
V: Kan ik meerdere batchjobs parallel uitvoeren? A: Ja — de limiet per batch is 100 URL's, maar er is geen plafond op het aantal gelijktijdige batchjobs (afhankelijk van de concurrency van je plan).
V: Wat gebeurt er als één URL in een batch mislukt?
A: De batch gaat door. De mislukkende URL krijgt status: "FAILED" met een foutcode; de rest slaagt. De job gaat naar COMPLETED zodra alle URL's een eindstatus bereiken.
V: Respecteert de API robots.txt?
A: We respecteren robots.txt standaard voor distillatie. Enterprise-plannen kunnen override aanvragen per domein met bewijs van autorisatie.
V: Kan ik zowel schema als prompt gebruiken op /extract?
A: Nee — ze sluiten elkaar uit (SCHEMA_AND_PROMPT_EXCLUSIVE). Vandaag is schema de enige ondersteunde modus; prompt-only-extractie staat op de roadmap.
V: Hoe word ik op de hoogte gebracht wanneer een lange batch klaar is?
A: Gebruik het webhook-veld bij indienen. Polling werkt ook, maar Webhooks zijn goedkoper voor jobs die langer duren dan 1 minuut. Zie Webhooks.
V: Hoe meld ik een bug of vraag ik een feature aan? A: Mail support@thunderbit.com of gebruik het in-app contactformulier op het dashboard.