Recepten

Zoeken en distilleren

Voer een Google-zoekopdracht en Distill van de top-resultaten in één aanroep uit met de Thunderbit web scraping API. Markdown, AI-samenvatting, Q&A en highlights.

/search voert een Google-query uit en stuurt elk topresultaat in één enkele request door Distill. Gebruik het wanneer je wilt dat een research-agent direct op de top-N pagina's belandt zonder een search-API plus N Distill-calls te hoeven combineren.

Wanneer gebruiken

  • Research-agents — geef de agent één enkele tool die zowel zoekt als leest.
  • Nieuws- / monitoring-scanners — haal de vijf laatste artikelen over een onderwerp op en vat elk samen.
  • RAG-ingest-bursts — bootstrap een kleine kennisbank vanuit een thematische zoekopdracht in één klap.

Heb je al URLs om te lezen, blijf dan bij /distill (of /batch/distill) — /search brengt extra kosten per resultaat met zich mee.

Quickstart

import httpx

API = "https://openapi.thunderbit.co/openapi/v1"
H = {"Authorization": "Bearer YOUR_API_KEY"}

resp = httpx.post(
    f"{API}/search",
    headers=H,
    json={
        "query":   "best web scraping tools 2026",
        "limit":   5,
        "formats": ["markdown", {"type": "summary"}],
    },
    timeout=120.0,
).json()

for r in resp["data"]["results"]:
    if r["success"]:
        print(r["position"], r["title"])
        print(r["summary"])
        print("---")

print("credits used:", resp["data"]["credits_used"])

Kosten

  • 1 credit per resultaat waarvan de Distill-stap slaagt.
  • +4 credits per LLM-formaat per geslaagd resultaat (summary, question, highlights).
  • +1 base-credit per zoekrequest (wordt ook berekend wanneer 0 resultaten slagen).
  • Mislukte Distills per resultaat worden niet berekend.

Voor de bovenstaande request (5 resultaten, summary gevraagd) betaal je 5 × (1 + 4) + 1 = 26 credits als elk resultaat slaagt.

Tips

  • Houd limit op het aantal dat je daadwerkelijk nodig hebt. Elk resultaat kost minstens 1 credit.
  • Gebruik site om de zoekopdracht te beperken tot één domein (bijv. site: "techcrunch.com") wanneer je samengestelde bronnen wilt.
  • Combineer met {"type":"highlights","query":"…"} om pull-quotes te krijgen die je in een digest kunt tonen.
  • Voor background jobs: laat de API-side timeout-parameter per resultaat op de standaard (30 s) staan — het traagste resultaat bepaalt de totale latency.