레시피

검색 및 디스틸

Thunderbit web scraping API로 Google 검색과 Distill을 한 번의 호출로 처리. Markdown과 AI 요약, Q&A, 하이라이트를 반환합니다.

/search는 Google 쿼리를 실행하고 각 상위 결과를 단일 요청 안에서 Distill로 흘려보냅니다. 리서치 에이전트가 검색 API와 N번의 Distill 호출을 조합하지 않고도 상위 N개 페이지에 바로 도달하게 만들고 싶을 때 사용하세요.

언제 사용하나

  • 리서치 에이전트 — 검색과 읽기를 한꺼번에 수행하는 단일 도구를 에이전트에 제공합니다.
  • 뉴스 / 모니터링 스캐너 — 특정 주제의 최신 다섯 개 기사를 가져와 각각 요약합니다.
  • RAG 인제스트 버스트 — 주제 검색을 통해 작은 지식 베이스를 한 번에 부트스트랩합니다.

이미 읽을 URL이 있다면 /distill(또는 /batch/distill)에 머무세요 — /search는 결과당 비용이 추가됩니다.

Quickstart

import httpx

API = "https://openapi.thunderbit.co/openapi/v1"
H = {"Authorization": "Bearer YOUR_API_KEY"}

resp = httpx.post(
    f"{API}/search",
    headers=H,
    json={
        "query":   "best web scraping tools 2026",
        "limit":   5,
        "formats": ["markdown", {"type": "summary"}],
    },
    timeout=120.0,
).json()

for r in resp["data"]["results"]:
    if r["success"]:
        print(r["position"], r["title"])
        print(r["summary"])
        print("---")

print("credits used:", resp["data"]["credits_used"])

비용

  • Distill 단계가 성공한 결과당 1 크레딧.
  • 성공한 결과당 LLM 포맷마다 +4 크레딧 (summary, question, highlights).
  • 검색 요청당 +1 기본 크레딧 (성공 결과가 0개여도 부과됩니다).
  • 결과 단위의 실패한 Distill은 과금되지 않습니다.

위 요청(5개 결과, summary 요청)의 경우 모든 결과가 성공하면 5 × (1 + 4) + 1 = 26 크레딧을 지불합니다.

  • limit은 실제로 필요한 개수로 제한하세요. 결과당 최소 1 크레딧이 듭니다.
  • 큐레이팅된 소스를 원할 때는 site로 검색을 한 도메인으로 좁히세요 (예: site: "techcrunch.com").
  • 다이제스트에 보여줄 풀-인용을 얻으려면 {"type":"highlights","query":"…"}와 결합하세요.
  • 백그라운드 작업에서는 API의 결과별 timeout 파라미터를 기본값(30초) 그대로 두세요 — 가장 느린 결과가 전체 지연 시간을 결정합니다.