FAQ | Thunderbit API

F: Kann ich Sites scrapen, die einen Login erfordern? A: Aktuell nein. Du kannst Cookies oder Auth-Tokens via headers-Parameter für Sites mitgeben, die das akzeptieren, aber interaktive Login-Flows werden über die API nicht unterstützt. Für Enterprise-Optionen melde dich bei uns.

F: Was ist die maximale Seitengröße? A: 10 MB HTML vor der Verarbeitung. Seiten, die das überschreiten, geben SCRAPE_CONTENT_TOO_LARGE zurück.

F: Wie aktuell sind die Daten? A: Standardverhalten: bei jedem Aufruf live abrufen. Setz forceRefresh: true, um etwaige interne Caching-Schichten explizit zu umgehen.

F: Kann ich mehrere Batch-Jobs parallel laufen lassen? A: Ja — das Pro-Batch-Limit ist 100 URLs, aber es gibt keine Obergrenze für die Anzahl gleichzeitiger Batch-Jobs (vorbehaltlich der Concurrency deines Plans).

F: Was passiert, wenn eine einzelne URL in einem Batch fehlschlägt? A: Der Batch läuft weiter. Die fehlgeschlagene URL bekommt status: "FAILED" mit einem Fehlercode; der Rest gelingt. Der Job wechselt zu COMPLETED, sobald alle URLs einen terminalen Zustand erreicht haben.

F: Respektiert die API robots.txt? A: Wir respektieren robots.txt für die Distillation standardmäßig. Enterprise-Pläne können einen Override pro Domain mit Autorisierungsnachweis anfordern.

F: Kann ich schema und prompt zusammen bei /extract verwenden? A: Nein — sie schließen sich gegenseitig aus (SCHEMA_AND_PROMPT_EXCLUSIVE). Aktuell ist schema der einzige unterstützte Modus; prompt-only-Extraktion steht auf der Roadmap.

F: Wie werde ich benachrichtigt, wenn ein langer Batch fertig ist? A: Verwende das webhook-Feld bei der Einreichung. Polling funktioniert auch, aber Webhooks sind günstiger für Jobs, die länger als 1 Minute dauern. Siehe Webhooks.

F: Wie melde ich einen Bug oder fordere ein Feature an? A: Schreib eine E-Mail an support@thunderbit.com oder verwende das In-App-Kontaktformular im Dashboard.