検索とディスティル

Thunderbit web scraping API で Google 検索と Distill を 1 回の呼び出しで実行。Markdown と AI 要約・Q&A・ハイライトを取得。

/search は Google クエリを実行し、各上位結果を単一のリクエスト内で Distill にパイプします。リサーチエージェントに、検索 API と N 回の Distill 呼び出しを組み合わせることなく、上位 N ページに直接アクセスさせたい場合に使用します。

使いどころ

リサーチエージェント — 検索と読み込みを 1 つで行う単一のツールをエージェントに提供します。
ニュース／モニタリングスキャナー — トピックに関する最新 5 件の記事を取得し、それぞれを要約します。
RAG 取り込みバースト — トピック検索から小規模なナレッジベースを 1 回でブートストラップします。

すでに読み込む URL が決まっているなら /distill（または /batch/distill）のままにしてください — /search は結果ごとに追加コストがかかります。

Quickstart

import httpx

API = "https://openapi.thunderbit.co/openapi/v1"
H = {"Authorization": "Bearer YOUR_API_KEY"}

resp = httpx.post(
    f"{API}/search",
    headers=H,
    json={
        "query":   "best web scraping tools 2026",
        "limit":   5,
        "formats": ["markdown", {"type": "summary"}],
    },
    timeout=120.0,
).json()

for r in resp["data"]["results"]:
    if r["success"]:
        print(r["position"], r["title"])
        print(r["summary"])
        print("---")

print("credits used:", resp["data"]["credits_used"])

コスト

Distill ステージが成功した結果ごとに 1 クレジット。
成功した結果ごとに LLM フォーマット 1 つあたり +4 クレジット（summary、question、highlights）。
検索リクエストごとに +1 ベースクレジット（0 件成功でも課金されます）。
結果単位で失敗した Distill は課金されません。

上記のリクエスト（5 件の結果、summary リクエスト）では、すべての結果が成功した場合 5 × (1 + 4) + 1 = 26 クレジットを支払います。

ヒント

limit は実際に必要な件数までに抑えてください。1 件あたり最低 1 クレジットかかります。
キュレーション済みのソースが欲しいときは site を使って検索範囲を 1 つのドメインに絞ります（例：site: "techcrunch.com"）。
ダイジェスト用の引用句を取得したい場合は {"type":"highlights","query":"…"} と組み合わせます。
バックグラウンドジョブでは、API の結果ごとの timeout パラメータをデフォルト（30 秒）のままにしておきましょう。最も遅い結果が全体のレイテンシを決めます。

検索とディスティル

使いどころ

Quickstart

コスト

ヒント

目次