Ricette
Cerca e distilla
Esegui una ricerca Google e Distill dei risultati migliori in una sola chiamata con la Thunderbit web scraping API. Markdown, riassunto IA, Q&A e highlights.
/search esegue una query Google e fa passare ogni risultato top attraverso Distill in un'unica richiesta. Usalo quando vuoi che un agente di research atterri sulle prime N pagine senza dover gestire una search API più N chiamate a Distill.
Quando usarlo
- Agenti di research — dai all'agente un singolo tool che fa sia la ricerca sia la lettura.
- Scanner news / monitoring — tira giù gli ultimi cinque articoli su un tema e riassumi ciascuno.
- Burst di ingestion per RAG — fai il bootstrap di una piccola knowledge base da una ricerca tematica in un colpo solo.
Se hai già gli URL da leggere, rimani su /distill (o /batch/distill) — /search aggiunge un costo per risultato.
Quickstart
import httpx
API = "https://openapi.thunderbit.co/openapi/v1"
H = {"Authorization": "Bearer YOUR_API_KEY"}
resp = httpx.post(
f"{API}/search",
headers=H,
json={
"query": "best web scraping tools 2026",
"limit": 5,
"formats": ["markdown", {"type": "summary"}],
},
timeout=120.0,
).json()
for r in resp["data"]["results"]:
if r["success"]:
print(r["position"], r["title"])
print(r["summary"])
print("---")
print("credits used:", resp["data"]["credits_used"])Costo
- 1 credito per risultato il cui step Distill riesce.
- +4 crediti per ogni formato LLM per risultato riuscito (
summary,question,highlights). - +1 credito base per richiesta di ricerca (addebitato anche quando 0 risultati riescono).
- I Distill per-risultato falliti non vengono addebitati.
Per la richiesta sopra (5 risultati, summary richiesto) paghi 5 × (1 + 4) + 1 = 26 crediti se ogni risultato riesce.
Suggerimenti
- Tieni
limital numero che ti serve davvero. Ogni risultato costa almeno 1 credito. - Usa
siteper limitare la ricerca a un dominio (es.site: "techcrunch.com") quando vuoi fonti curate. - Combina con
{"type":"highlights","query":"…"}per ottenere pull-quote da mostrare in un digest. - Per i job in background, lascia il parametro
timeoutper risultato dell'API al valore predefinito (30 s) — il risultato più lento determina la latenza totale.