Rezepte

Suchen und destillieren

Führe eine Google-Suche und Distill der Top-Ergebnisse mit der Thunderbit web scraping API in einem Aufruf aus. Markdown, KI-Zusammenfassung, Q&A und Highlights.

/search führt eine Google-Anfrage aus und schickt jedes Top-Ergebnis in einem einzigen Request durch Distill. Nutze es, wenn ein Research-Agent direkt auf die Top-N-Seiten zugreifen soll, ohne eine Such-API plus N Distill-Aufrufe zu jonglieren.

Wann einsetzen

  • Research-Agents — gib dem Agent ein einziges Tool, das Suchen und Lesen übernimmt.
  • News- / Monitoring-Scanner — hol dir die fünf neuesten Artikel zu einem Thema und fasse jeden zusammen.
  • RAG-Ingestion-Bursts — boote eine kleine Wissensdatenbank aus einer thematischen Suche in einem Schritt.

Wenn du bereits URLs zum Lesen hast, bleib bei /distill (oder /batch/distill) — /search verursacht zusätzliche Kosten pro Ergebnis.

Quickstart

import httpx

API = "https://openapi.thunderbit.co/openapi/v1"
H = {"Authorization": "Bearer YOUR_API_KEY"}

resp = httpx.post(
    f"{API}/search",
    headers=H,
    json={
        "query":   "best web scraping tools 2026",
        "limit":   5,
        "formats": ["markdown", {"type": "summary"}],
    },
    timeout=120.0,
).json()

for r in resp["data"]["results"]:
    if r["success"]:
        print(r["position"], r["title"])
        print(r["summary"])
        print("---")

print("credits used:", resp["data"]["credits_used"])

Kosten

  • 1 Credit pro Ergebnis, dessen Distill-Schritt erfolgreich ist.
  • +4 Credits pro LLM-Format pro erfolgreichem Ergebnis (summary, question, highlights).
  • +1 Basis-Credit pro Suchanfrage (wird auch berechnet, wenn 0 Ergebnisse erfolgreich sind).
  • Fehlgeschlagene Pro-Ergebnis-Distills werden nicht berechnet.

Für den obigen Request (5 Ergebnisse, summary angefordert) zahlst du 5 × (1 + 4) + 1 = 26 Credits, wenn jedes Ergebnis erfolgreich ist.

Tipps

  • Setze limit so niedrig wie nötig. Jedes Ergebnis kostet mindestens 1 Credit.
  • Nutze site, um die Suche auf eine Domain zu beschränken (z. B. site: "techcrunch.com"), wenn du kuratierte Quellen willst.
  • Kombiniere mit {"type":"highlights","query":"…"}, um Pull-Quotes für ein Digest zu erhalten.
  • Bei Hintergrundjobs den API-seitigen timeout pro Ergebnis beim Standardwert (30 s) belassen — das langsamste Ergebnis bestimmt die Gesamtlatenz.