Recettes

Rechercher et distiller

Lancez une recherche Google et distillez les meilleurs résultats en un appel avec la Thunderbit web scraping API. Markdown, résumé IA, Q&A et points clés.

/search lance une requête Google et fait passer chaque résultat top dans Distill en une seule requête. À utiliser quand tu veux qu'un agent de recherche atterrisse directement sur les N premières pages sans jongler entre une API de recherche et N appels à Distill.

Quand l'utiliser

  • Agents de recherche — donne à l'agent un seul outil qui cherche et lit à la fois.
  • Scanners news / monitoring — récupère les cinq derniers articles sur un sujet et résume chacun.
  • Bursts d'ingestion RAG — bootstrappe une petite base de connaissances depuis une recherche thématique en un seul coup.

Si tu as déjà les URLs à lire, reste sur /distill (ou /batch/distill) — /search ajoute un coût par résultat.

Quickstart

import httpx

API = "https://openapi.thunderbit.co/openapi/v1"
H = {"Authorization": "Bearer YOUR_API_KEY"}

resp = httpx.post(
    f"{API}/search",
    headers=H,
    json={
        "query":   "best web scraping tools 2026",
        "limit":   5,
        "formats": ["markdown", {"type": "summary"}],
    },
    timeout=120.0,
).json()

for r in resp["data"]["results"]:
    if r["success"]:
        print(r["position"], r["title"])
        print(r["summary"])
        print("---")

print("credits used:", resp["data"]["credits_used"])

Coût

  • 1 crédit par résultat dont l'étape Distill réussit.
  • +4 crédits par format LLM par résultat réussi (summary, question, highlights).
  • +1 crédit de base par requête de recherche (facturé même si 0 résultat réussit).
  • Les Distills par-résultat en échec ne sont pas facturés.

Pour la requête ci-dessus (5 résultats, summary demandé) tu paies 5 × (1 + 4) + 1 = 26 crédits si tous les résultats réussissent.

Astuces

  • Plafonne limit au nombre dont tu as réellement besoin. Chaque résultat coûte au moins 1 crédit.
  • Utilise site pour restreindre la recherche à un seul domaine (par ex. site: "techcrunch.com") quand tu veux des sources curatées.
  • Combine avec {"type":"highlights","query":"…"} pour récupérer des pull-quotes à afficher dans un digest.
  • Pour les tâches en arrière-plan, laisse le paramètre timeout par résultat de l'API à sa valeur par défaut (30 s) — le résultat le plus lent dicte la latence totale.