レシピ

検索とディスティル

Thunderbit web scraping API で Google 検索と Distill を 1 回の呼び出しで実行。Markdown と AI 要約・Q&A・ハイライトを取得。

/search は Google クエリを実行し、各上位結果を単一のリクエスト内で Distill にパイプします。リサーチエージェントに、検索 API と N 回の Distill 呼び出しを組み合わせることなく、上位 N ページに直接アクセスさせたい場合に使用します。

使いどころ

  • リサーチエージェント — 検索と読み込みを 1 つで行う単一のツールをエージェントに提供します。
  • ニュース/モニタリングスキャナー — トピックに関する最新 5 件の記事を取得し、それぞれを要約します。
  • RAG 取り込みバースト — トピック検索から小規模なナレッジベースを 1 回でブートストラップします。

すでに読み込む URL が決まっているなら /distill(または /batch/distill)のままにしてください — /search は結果ごとに追加コストがかかります。

Quickstart

import httpx

API = "https://openapi.thunderbit.co/openapi/v1"
H = {"Authorization": "Bearer YOUR_API_KEY"}

resp = httpx.post(
    f"{API}/search",
    headers=H,
    json={
        "query":   "best web scraping tools 2026",
        "limit":   5,
        "formats": ["markdown", {"type": "summary"}],
    },
    timeout=120.0,
).json()

for r in resp["data"]["results"]:
    if r["success"]:
        print(r["position"], r["title"])
        print(r["summary"])
        print("---")

print("credits used:", resp["data"]["credits_used"])

コスト

  • Distill ステージが成功した結果ごとに 1 クレジット。
  • 成功した結果ごとに LLM フォーマット 1 つあたり +4 クレジット(summaryquestionhighlights)。
  • 検索リクエストごとに +1 ベースクレジット(0 件成功でも課金されます)。
  • 結果単位で失敗した Distill は課金されません。

上記のリクエスト(5 件の結果、summary リクエスト)では、すべての結果が成功した場合 5 × (1 + 4) + 1 = 26 クレジットを支払います。

ヒント

  • limit は実際に必要な件数までに抑えてください。1 件あたり最低 1 クレジットかかります。
  • キュレーション済みのソースが欲しいときは site を使って検索範囲を 1 つのドメインに絞ります(例:site: "techcrunch.com")。
  • ダイジェスト用の引用句を取得したい場合は {"type":"highlights","query":"…"} と組み合わせます。
  • バックグラウンドジョブでは、API の結果ごとの timeout パラメータをデフォルト(30 秒)のままにしておきましょう。最も遅い結果が全体のレイテンシを決めます。