Nutze Thunderbit vom Terminal aus — Seiten in Markdown destillieren, strukturierte Daten extrahieren, Felder vorschlagen lassen und bis zu 100 URLs im Batch verarbeiten. Die CLI funktioniert eigenständig oder als Skills-Toolkit, das KI-Coding-Agents auffinden können.
Destilliere, extrahiere, schlage Felder vor und führe Batch-Jobs direkt aus dem Terminal aus.
Bevor du die CLI nutzt, musst du dich mit deinem Thunderbit-API-Key authentifizieren. Hol dir einen Key im Thunderbit Dashboard. Format: tb_ gefolgt von 32 Hex-Zeichen.
Für Self-Hosted-Thunderbit-Gateways überschreibe die Base-URL:
# Pro Aufrufthunderbit --base-url https://api.your-domain.com distill https://example.com# Oder per Umgebungsvariableexport THUNDERBIT_API_BASE_URL=https://api.your-domain.comthunderbit distill https://example.com
Extrahiere strukturierte Daten aus einer Seite. Das schema ist eine flache Map aus fieldName → Natural-Language-Anweisung — jeder Wert ist ein Hinweis, mit dem die KI das Feld auf der Seite findet.
Hinweis: Das vorgelagerte OpenAPI-Spec-Beispiel zeigt JSON Schema ({type:"object",properties:…}). Zum Zeitpunkt der Erstellung erwartet der Live-Server die unten gezeigte flache Anweisungs-Map; wir gleichen die Spec an.
# Inline-Schema — flache Map aus Feld → Anweisungthunderbit extract https://example.com/product \ --schema '{"name":"product name","price":"the listed price as a number","currency":"3-letter currency code"}'# Schema aus Dateithunderbit extract https://example.com/product --schema ./schema.json# Extrahiertes JSON speichernthunderbit extract https://example.com/product --schema ./schema.json --format json -o data.json
Die Antwort liefert data.data immer als Array, ein Element pro Seitenbereich, der zu deinem Schema passt:
# Die KI schlägt Felder vor, du toggelst/editierst, dann läuft die Extraktion mit dem kuratierten Schemathunderbit extract https://example.com/product --interactive# Vorschlag mit Prompt steuernthunderbit extract https://example.com/product -i --prompt "focus on pricing and availability"# Schema zur Wiederverwendung speichernthunderbit extract https://example.com/product -i --save-schema ./product-schema.json
Lass die KI extrahierbare Felder vorschlagen, bevor du ein Schema schreibst.
# Grundlegendthunderbit suggest-fields https://example.com/product# Mit Prompt steuernthunderbit suggest-fields https://example.com/listings --prompt "extract job postings only"# Regionsspezifischthunderbit suggest-fields https://example.com --country-code DE
Im interaktiven Editor kannst du Felder per Nummer toggeln (1 3 5), add, rm 2, edit 4 und dann mit done bestätigen. suggest-fields liefert [{name, type, instruction}, …]; wenn du das in extract einspeist, wandle es zuerst in eine flache Map um:
Sende bis zu 100 URLs in einem einzigen Batch-Job. Standardverhalten: submit + pollen bis COMPLETED / FAILED / CANCELLED.
# URLs als Positionsargumentethunderbit batch distill https://a.com https://b.com https://c.com# Oder URLs aus Datei lesen (eine pro Zeile)thunderbit batch distill --file urls.txt# Nur einreichen — Job-ID ausgeben und beenden (Webhook nutzen oder später pollen)thunderbit batch distill --file urls.txt --no-poll
Bereits abgeschlossene Seiten behalten ihre Ergebnisse. Ausstehende Seiten werden verworfen und dafür wird nichts mehr berechnet. Der Status wechselt auf CANCELLED, sobald der Server bestätigt.
Aller Fehlertext wird nach stderr geschrieben. Bei einem Fehler bleibt stdout leer (ja, auch mit --format json). Damit erhält eine jq-Pipeline nie ein halbgares Envelope — prüfe vor dem Parsen den Exit-Code (oder set -e).
Polling-Fortschritt (z. B. Processing... (3) aus async submit + poll) wird ebenfalls auf stderr geschrieben. Mit 2>/dev/null kannst du ihn stummschalten. Synchrone Single-Page-Aufrufe (--sync) geben keinen Fortschritt aus.
Error: API key is required. Exportiere THUNDERBIT_API_KEY oder übergib --api-key.
Netzwerkfehler hinter einem Unternehmens-Proxy. Setze HTTPS_PROXY und HTTP_PROXY — sowohl Node- als auch Python-Clients respektieren sie.
Langsames Batch-Polling. Erhöhe --timeout für das Pro-Seite-Budget. Die Polling-Frequenz selbst ist fest auf wenige Sekunden eingestellt und derzeit nicht über die CLI konfigurierbar.
Die Thunderbit-CLI ist MIT-lizenziert und Open Source auf GitHub: GitHub repository (das gleiche Repo enthält auch den MCP-Server und das Claude-Code-Plugin). Auf npm als @thunderbit/thunderbit-cli veröffentlicht.