Draai Thunderbit vanuit de terminal — distilleer pagina's tot Markdown, extraheer gestructureerde data, stel velden voor en verwerk tot 100 URLs in batch. De CLI werkt zelfstandig of als skills-toolkit die AI coding agents kunnen ontdekken.
Distilleer, extraheer, stel velden voor en draai batch-jobs direct vanuit de terminal.
Voordat je de CLI gebruikt, moet je je authenticeren met je Thunderbit-API-key. Haal een key op in het Thunderbit Dashboard. Formaat: tb_ gevolgd door 32 hex-tekens.
Voor self-hosted Thunderbit-gateways overschrijf je de base-URL:
# Per callthunderbit --base-url https://api.your-domain.com distill https://example.com# Or set via environment variableexport THUNDERBIT_API_BASE_URL=https://api.your-domain.comthunderbit distill https://example.com
# Use the basic JS renderer (covers most modern sites)thunderbit distill https://example.com --render-mode basic# Use the full headless browser (slowest, highest fidelity)thunderbit distill https://example.com --render-mode full# Geo-target for region-aware sitesthunderbit distill https://example.com --country-code DE# Bump per-page timeoutthunderbit distill https://example.com --timeout 60000# Use sync /distill instead of the default async submit + pollthunderbit distill https://example.com --sync
Extraheer gestructureerde data uit een pagina. Het schema is een platte map van fieldName → natuurlijke-taalinstructie — elke waarde is een hint die de AI gebruikt om het veld op de pagina te vinden.
Opmerking: het voorbeeld in de upstream OpenAPI-spec toont JSON Schema ({type:"object",properties:…}). Op het moment van schrijven verwacht de live server de hieronder getoonde platte instructie-map; we trekken de spec gelijk.
# AI proposes fields, you toggle/edit, then extraction runs with the curated schemathunderbit extract https://example.com/product --interactive# Steer the suggestion with a promptthunderbit extract https://example.com/product -i --prompt "focus on pricing and availability"# Persist the schema for reusethunderbit extract https://example.com/product -i --save-schema ./product-schema.json
Laat de AI extraheerbare velden voorstellen voordat je een schema schrijft.
# Basicthunderbit suggest-fields https://example.com/product# Steer with a promptthunderbit suggest-fields https://example.com/listings --prompt "extract job postings only"# Region-awarethunderbit suggest-fields https://example.com --country-code DE
In de interactieve editor kun je velden togglen op nummer (1 3 5), add, rm 2, edit 4, en daarna done om te bevestigen. suggest-fields retourneert [{name, type, instruction}, …]; wanneer je dat aan extract voert, zet het eerst om in een platte map:
Dien tot 100 URLs in als één batch-job. Standaardgedrag: submit + pollen tot COMPLETED / FAILED / CANCELLED.
# URLs as positional argsthunderbit batch distill https://a.com https://b.com https://c.com# Or read URLs from a file (one per line)thunderbit batch distill --file urls.txt# Submit only — print the job ID and exit (use webhook or poll later)thunderbit batch distill --file urls.txt --no-poll
Reeds voltooide pagina's behouden hun resultaten. Wachtende pagina's worden verwijderd en daarvoor wordt niets meer in rekening gebracht. De status springt op CANCELLED zodra de server het bevestigt.
Alle foutmeldingen worden naar stderr geschreven. Bij een fout blijft stdout leeg (ja, ook met --format json). Dat betekent dat een jq-pipeline nooit een halfgaar envelope ontvangt — controleer de exit-code (of set -e) voordat je gaat parsen.
Polling-voortgang (bijv. Processing... (3) van async submit + poll) wordt ook naar stderr geschreven. Pipe 2>/dev/null om dat te dempen. Synchrone single-page calls (--sync) sturen geen voortgang.
Error: API key is required. Exporteer THUNDERBIT_API_KEY of geef --api-key mee.
Netwerkfouten achter een bedrijfsproxy. Stel HTTPS_PROXY en HTTP_PROXY in — zowel Node- als Python-clients respecteren deze.
Traag batch-pollen. Verhoog --timeout voor het per-pagina-budget. De pollfrequentie zelf staat vast op enkele seconden en is op dit moment niet configureerbaar vanuit de CLI.
De Thunderbit CLI is MIT-gelicentieerd en open source op GitHub: GitHub repository (dezelfde repo bevat ook de MCP-server en de Claude Code-plugin). Gedistribueerd op npm als @thunderbit/thunderbit-cli.