Recetas

Buscar y destilar

Ejecuta una búsqueda en Google y Distill de los mejores resultados en una sola llamada con la Thunderbit web scraping API. Markdown, resumen IA, Q&A y destacados.

/search ejecuta una consulta de Google y canaliza cada resultado top a través de Distill en una única petición. Úsalo cuando quieras que un agente de investigación aterrice en las N primeras páginas sin tener que combinar una API de búsqueda con N llamadas a Distill.

Cuándo usarlo

  • Agentes de investigación — dale al agente una sola herramienta que busque y lea.
  • Escáneres de noticias / monitorización — trae los cinco últimos artículos sobre un tema y resume cada uno.
  • Ráfagas de ingesta para RAG — arranca una pequeña base de conocimiento a partir de una búsqueda temática en un solo paso.

Si ya tienes URLs para leer, quédate con /distill (o /batch/distill) — /search añade coste por resultado.

Quickstart

import httpx

API = "https://openapi.thunderbit.co/openapi/v1"
H = {"Authorization": "Bearer YOUR_API_KEY"}

resp = httpx.post(
    f"{API}/search",
    headers=H,
    json={
        "query":   "best web scraping tools 2026",
        "limit":   5,
        "formats": ["markdown", {"type": "summary"}],
    },
    timeout=120.0,
).json()

for r in resp["data"]["results"]:
    if r["success"]:
        print(r["position"], r["title"])
        print(r["summary"])
        print("---")

print("credits used:", resp["data"]["credits_used"])

Coste

  • 1 crédito por resultado cuya etapa de Distill tenga éxito.
  • +4 créditos por cada formato LLM por resultado exitoso (summary, question, highlights).
  • +1 crédito base por petición de búsqueda (se cobra incluso cuando ningún resultado tiene éxito).
  • Los Distills fallidos por resultado no se cobran.

Para la petición de arriba (5 resultados, summary solicitado) pagas 5 × (1 + 4) + 1 = 26 créditos si todos los resultados tienen éxito.

Consejos

  • Limita limit al número que realmente necesitas. Cada resultado cuesta al menos 1 crédito.
  • Usa site para acotar la búsqueda a un dominio (p. ej. site: "techcrunch.com") cuando quieras fuentes curadas.
  • Combínalo con {"type":"highlights","query":"…"} para obtener pull-quotes que mostrar en un digest.
  • Para trabajos en segundo plano, deja el parámetro timeout por resultado de la API en su valor por defecto (30 s) — el resultado más lento marca la latencia total.