Ricette

Cerca e distilla

Esegui una ricerca Google e Distill dei risultati migliori in una sola chiamata con la Thunderbit web scraping API. Markdown, riassunto IA, Q&A e highlights.

/search esegue una query Google e fa passare ogni risultato top attraverso Distill in un'unica richiesta. Usalo quando vuoi che un agente di research atterri sulle prime N pagine senza dover gestire una search API più N chiamate a Distill.

Quando usarlo

  • Agenti di research — dai all'agente un singolo tool che fa sia la ricerca sia la lettura.
  • Scanner news / monitoring — tira giù gli ultimi cinque articoli su un tema e riassumi ciascuno.
  • Burst di ingestion per RAG — fai il bootstrap di una piccola knowledge base da una ricerca tematica in un colpo solo.

Se hai già gli URL da leggere, rimani su /distill (o /batch/distill) — /search aggiunge un costo per risultato.

Quickstart

import httpx

API = "https://openapi.thunderbit.co/openapi/v1"
H = {"Authorization": "Bearer YOUR_API_KEY"}

resp = httpx.post(
    f"{API}/search",
    headers=H,
    json={
        "query":   "best web scraping tools 2026",
        "limit":   5,
        "formats": ["markdown", {"type": "summary"}],
    },
    timeout=120.0,
).json()

for r in resp["data"]["results"]:
    if r["success"]:
        print(r["position"], r["title"])
        print(r["summary"])
        print("---")

print("credits used:", resp["data"]["credits_used"])

Costo

  • 1 credito per risultato il cui step Distill riesce.
  • +4 crediti per ogni formato LLM per risultato riuscito (summary, question, highlights).
  • +1 credito base per richiesta di ricerca (addebitato anche quando 0 risultati riescono).
  • I Distill per-risultato falliti non vengono addebitati.

Per la richiesta sopra (5 risultati, summary richiesto) paghi 5 × (1 + 4) + 1 = 26 crediti se ogni risultato riesce.

Suggerimenti

  • Tieni limit al numero che ti serve davvero. Ogni risultato costa almeno 1 credito.
  • Usa site per limitare la ricerca a un dominio (es. site: "techcrunch.com") quando vuoi fonti curate.
  • Combina con {"type":"highlights","query":"…"} per ottenere pull-quote da mostrare in un digest.
  • Per i job in background, lascia il parametro timeout per risultato dell'API al valore predefinito (30 s) — il risultato più lento determina la latenza totale.