實戰範例

搜尋並蒸餾

用 Thunderbit web scraping API 一次完成 Google 搜尋與 Distill:回傳 Markdown 以及 AI 摘要、Q&A、重點。

/search 一次請求就跑 Google 搜尋,並把每條排在前面的結果交給 Distill 處理。當你希望研究型 agent 直接落在 Top-N 頁面,而不必把搜尋 API 和 N 次 Distill 呼叫硬湊在一起時,就用它。

什麼時候用

  • 研究型 agent —— 給 agent 一個工具,同時搞定搜尋與閱讀。
  • 新聞 / 監控掃描器 —— 抓某個主題最新的五篇文章,並各自做摘要。
  • RAG 灌入爆發 —— 用一次主題搜尋,把小型知識庫整個 bootstrap 起來。

如果你手上已經有 URL 要讀,請繼續用 /distill(或 /batch/distill)—— /search 每條結果會額外計費。

Quickstart

import httpx

API = "https://openapi.thunderbit.co/openapi/v1"
H = {"Authorization": "Bearer YOUR_API_KEY"}

resp = httpx.post(
    f"{API}/search",
    headers=H,
    json={
        "query":   "best web scraping tools 2026",
        "limit":   5,
        "formats": ["markdown", {"type": "summary"}],
    },
    timeout=120.0,
).json()

for r in resp["data"]["results"]:
    if r["success"]:
        print(r["position"], r["title"])
        print(r["summary"])
        print("---")

print("credits used:", resp["data"]["credits_used"])

費用

  • 每條 Distill 階段成功的結果計 1 credit。
  • 每條成功結果上每個 LLM 格式額外計 +4 credits(summaryquestionhighlights)。
  • 每次搜尋請求計 +1 基礎 credit(就算 0 條結果成功也照收)。
  • 每條結果層級 Distill 失敗的不計費。

對於上面的請求(5 條結果,要求 summary),如果每條結果都成功,你要付 5 × (1 + 4) + 1 = 26 credits。

小技巧

  • limit 設到你真正需要的條數就好。每條結果至少 1 credit。
  • 想要更挑過的來源,就用 site 把搜尋鎖在單一網域(例如 site: "techcrunch.com")。
  • 想拿到可以放進 digest 的金句,搭配 {"type":"highlights","query":"…"} 使用。
  • 背景任務裡將 API 端單筆結果的 timeout 參數保留在預設值(30 秒)即可——最慢的那筆決定整體延遲。