Receitas

Buscar e destilar

Execute uma busca no Google e Distill dos melhores resultados em uma única chamada com a Thunderbit web scraping API. Markdown, resumo de IA, Q&A e destaques.

/search executa uma consulta no Google e canaliza cada resultado top através do Distill em uma única requisição. Use quando você quiser que um agente de pesquisa caia direto nas N primeiras páginas sem ter que combinar uma API de busca com N chamadas ao Distill.

Quando usar

  • Agentes de pesquisa — dê ao agente uma única ferramenta que faz a busca e a leitura.
  • Scanners de notícias / monitoramento — puxe os cinco artigos mais recentes sobre um tema e resuma cada um.
  • Bursts de ingestão para RAG — faça o bootstrap de uma pequena base de conhecimento a partir de uma busca temática em um só passo.

Se você já tem URLs para ler, fique com /distill (ou /batch/distill) — /search adiciona custo por resultado.

Quickstart

import httpx

API = "https://openapi.thunderbit.co/openapi/v1"
H = {"Authorization": "Bearer YOUR_API_KEY"}

resp = httpx.post(
    f"{API}/search",
    headers=H,
    json={
        "query":   "best web scraping tools 2026",
        "limit":   5,
        "formats": ["markdown", {"type": "summary"}],
    },
    timeout=120.0,
).json()

for r in resp["data"]["results"]:
    if r["success"]:
        print(r["position"], r["title"])
        print(r["summary"])
        print("---")

print("credits used:", resp["data"]["credits_used"])

Custo

  • 1 crédito por resultado cuja etapa de Distill for bem-sucedida.
  • +4 créditos por formato LLM por resultado bem-sucedido (summary, question, highlights).
  • +1 crédito base por requisição de busca (cobrado mesmo quando 0 resultados forem bem-sucedidos).
  • Distills por-resultado que falham não são cobrados.

Para a requisição acima (5 resultados, summary solicitado) você paga 5 × (1 + 4) + 1 = 26 créditos se todos os resultados forem bem-sucedidos.

Dicas

  • Limite limit ao número que você realmente precisa. Cada resultado custa pelo menos 1 crédito.
  • Use site para restringir a busca a um domínio (ex. site: "techcrunch.com") quando quiser fontes curadas.
  • Combine com {"type":"highlights","query":"…"} para obter pull-quotes que dá para exibir em um digest.
  • Para jobs em segundo plano, deixe o parâmetro timeout por resultado da API no valor padrão (30 s) — o resultado mais lento define a latência total.