レシピ
検索とディスティル
Thunderbit web scraping API で Google 検索と Distill を 1 回の呼び出しで実行。Markdown と AI 要約・Q&A・ハイライトを取得。
/search は Google クエリを実行し、各上位結果を単一のリクエスト内で Distill にパイプします。リサーチエージェントに、検索 API と N 回の Distill 呼び出しを組み合わせることなく、上位 N ページに直接アクセスさせたい場合に使用します。
使いどころ
- リサーチエージェント — 検索と読み込みを 1 つで行う単一のツールをエージェントに提供します。
- ニュース/モニタリングスキャナー — トピックに関する最新 5 件の記事を取得し、それぞれを要約します。
- RAG 取り込みバースト — トピック検索から小規模なナレッジベースを 1 回でブートストラップします。
すでに読み込む URL が決まっているなら /distill(または /batch/distill)のままにしてください — /search は結果ごとに追加コストがかかります。
Quickstart
import httpx
API = "https://openapi.thunderbit.co/openapi/v1"
H = {"Authorization": "Bearer YOUR_API_KEY"}
resp = httpx.post(
f"{API}/search",
headers=H,
json={
"query": "best web scraping tools 2026",
"limit": 5,
"formats": ["markdown", {"type": "summary"}],
},
timeout=120.0,
).json()
for r in resp["data"]["results"]:
if r["success"]:
print(r["position"], r["title"])
print(r["summary"])
print("---")
print("credits used:", resp["data"]["credits_used"])コスト
- Distill ステージが成功した結果ごとに 1 クレジット。
- 成功した結果ごとに LLM フォーマット 1 つあたり +4 クレジット(
summary、question、highlights)。 - 検索リクエストごとに +1 ベースクレジット(0 件成功でも課金されます)。
- 結果単位で失敗した Distill は課金されません。
上記のリクエスト(5 件の結果、summary リクエスト)では、すべての結果が成功した場合 5 × (1 + 4) + 1 = 26 クレジットを支払います。
ヒント
limitは実際に必要な件数までに抑えてください。1 件あたり最低 1 クレジットかかります。- キュレーション済みのソースが欲しいときは
siteを使って検索範囲を 1 つのドメインに絞ります(例:site: "techcrunch.com")。 - ダイジェスト用の引用句を取得したい場合は
{"type":"highlights","query":"…"}と組み合わせます。 - バックグラウンドジョブでは、API の結果ごとの
timeoutパラメータをデフォルト(30 秒)のままにしておきましょう。最も遅い結果が全体のレイテンシを決めます。