Recetas
Buscar y destilar
Ejecuta una búsqueda en Google y Distill de los mejores resultados en una sola llamada con la Thunderbit web scraping API. Markdown, resumen IA, Q&A y destacados.
/search ejecuta una consulta de Google y canaliza cada resultado top a través de Distill en una única petición. Úsalo cuando quieras que un agente de investigación aterrice en las N primeras páginas sin tener que combinar una API de búsqueda con N llamadas a Distill.
Cuándo usarlo
- Agentes de investigación — dale al agente una sola herramienta que busque y lea.
- Escáneres de noticias / monitorización — trae los cinco últimos artículos sobre un tema y resume cada uno.
- Ráfagas de ingesta para RAG — arranca una pequeña base de conocimiento a partir de una búsqueda temática en un solo paso.
Si ya tienes URLs para leer, quédate con /distill (o /batch/distill) — /search añade coste por resultado.
Quickstart
import httpx
API = "https://openapi.thunderbit.co/openapi/v1"
H = {"Authorization": "Bearer YOUR_API_KEY"}
resp = httpx.post(
f"{API}/search",
headers=H,
json={
"query": "best web scraping tools 2026",
"limit": 5,
"formats": ["markdown", {"type": "summary"}],
},
timeout=120.0,
).json()
for r in resp["data"]["results"]:
if r["success"]:
print(r["position"], r["title"])
print(r["summary"])
print("---")
print("credits used:", resp["data"]["credits_used"])Coste
- 1 crédito por resultado cuya etapa de Distill tenga éxito.
- +4 créditos por cada formato LLM por resultado exitoso (
summary,question,highlights). - +1 crédito base por petición de búsqueda (se cobra incluso cuando ningún resultado tiene éxito).
- Los Distills fallidos por resultado no se cobran.
Para la petición de arriba (5 resultados, summary solicitado) pagas 5 × (1 + 4) + 1 = 26 créditos si todos los resultados tienen éxito.
Consejos
- Limita
limital número que realmente necesitas. Cada resultado cuesta al menos 1 crédito. - Usa
sitepara acotar la búsqueda a un dominio (p. ej.site: "techcrunch.com") cuando quieras fuentes curadas. - Combínalo con
{"type":"highlights","query":"…"}para obtener pull-quotes que mostrar en un digest. - Para trabajos en segundo plano, deja el parámetro
timeoutpor resultado de la API en su valor por defecto (30 s) — el resultado más lento marca la latencia total.