FAQ
Häufige Fragen
F: Kann ich Sites scrapen, die einen Login erfordern?
A: Aktuell nein. Du kannst Cookies oder Auth-Tokens via headers-Parameter für Sites mitgeben, die das akzeptieren, aber interaktive Login-Flows werden über die API nicht unterstützt. Für Enterprise-Optionen melde dich bei uns.
F: Was ist die maximale Seitengröße?
A: 10 MB HTML vor der Verarbeitung. Seiten, die das überschreiten, geben SCRAPE_CONTENT_TOO_LARGE zurück.
F: Wie aktuell sind die Daten?
A: Standardverhalten: bei jedem Aufruf live abrufen. Setz forceRefresh: true, um etwaige interne Caching-Schichten explizit zu umgehen.
F: Kann ich mehrere Batch-Jobs parallel laufen lassen? A: Ja — das Pro-Batch-Limit ist 100 URLs, aber es gibt keine Obergrenze für die Anzahl gleichzeitiger Batch-Jobs (vorbehaltlich der Concurrency deines Plans).
F: Was passiert, wenn eine einzelne URL in einem Batch fehlschlägt?
A: Der Batch läuft weiter. Die fehlgeschlagene URL bekommt status: "FAILED" mit einem Fehlercode; der Rest gelingt. Der Job wechselt zu COMPLETED, sobald alle URLs einen terminalen Zustand erreicht haben.
F: Respektiert die API robots.txt?
A: Wir respektieren robots.txt für die Distillation standardmäßig. Enterprise-Pläne können einen Override pro Domain mit Autorisierungsnachweis anfordern.
F: Kann ich schema und prompt zusammen bei /extract verwenden?
A: Nein — sie schließen sich gegenseitig aus (SCHEMA_AND_PROMPT_EXCLUSIVE). Aktuell ist schema der einzige unterstützte Modus; prompt-only-Extraktion steht auf der Roadmap.
F: Wie werde ich benachrichtigt, wenn ein langer Batch fertig ist?
A: Verwende das webhook-Feld bei der Einreichung. Polling funktioniert auch, aber Webhooks sind günstiger für Jobs, die länger als 1 Minute dauern. Siehe Webhooks.
F: Wie melde ich einen Bug oder fordere ein Feature an? A: Schreib eine E-Mail an support@thunderbit.com oder verwende das In-App-Kontaktformular im Dashboard.