Rezepte
Suchen und destillieren
Führe eine Google-Suche und Distill der Top-Ergebnisse mit der Thunderbit web scraping API in einem Aufruf aus. Markdown, KI-Zusammenfassung, Q&A und Highlights.
/search führt eine Google-Anfrage aus und schickt jedes Top-Ergebnis in einem einzigen Request durch Distill. Nutze es, wenn ein Research-Agent direkt auf die Top-N-Seiten zugreifen soll, ohne eine Such-API plus N Distill-Aufrufe zu jonglieren.
Wann einsetzen
- Research-Agents — gib dem Agent ein einziges Tool, das Suchen und Lesen übernimmt.
- News- / Monitoring-Scanner — hol dir die fünf neuesten Artikel zu einem Thema und fasse jeden zusammen.
- RAG-Ingestion-Bursts — boote eine kleine Wissensdatenbank aus einer thematischen Suche in einem Schritt.
Wenn du bereits URLs zum Lesen hast, bleib bei /distill (oder /batch/distill) — /search verursacht zusätzliche Kosten pro Ergebnis.
Quickstart
import httpx
API = "https://openapi.thunderbit.co/openapi/v1"
H = {"Authorization": "Bearer YOUR_API_KEY"}
resp = httpx.post(
f"{API}/search",
headers=H,
json={
"query": "best web scraping tools 2026",
"limit": 5,
"formats": ["markdown", {"type": "summary"}],
},
timeout=120.0,
).json()
for r in resp["data"]["results"]:
if r["success"]:
print(r["position"], r["title"])
print(r["summary"])
print("---")
print("credits used:", resp["data"]["credits_used"])Kosten
- 1 Credit pro Ergebnis, dessen Distill-Schritt erfolgreich ist.
- +4 Credits pro LLM-Format pro erfolgreichem Ergebnis (
summary,question,highlights). - +1 Basis-Credit pro Suchanfrage (wird auch berechnet, wenn 0 Ergebnisse erfolgreich sind).
- Fehlgeschlagene Pro-Ergebnis-Distills werden nicht berechnet.
Für den obigen Request (5 Ergebnisse, summary angefordert) zahlst du 5 × (1 + 4) + 1 = 26 Credits, wenn jedes Ergebnis erfolgreich ist.
Tipps
- Setze
limitso niedrig wie nötig. Jedes Ergebnis kostet mindestens 1 Credit. - Nutze
site, um die Suche auf eine Domain zu beschränken (z. B.site: "techcrunch.com"), wenn du kuratierte Quellen willst. - Kombiniere mit
{"type":"highlights","query":"…"}, um Pull-Quotes für ein Digest zu erhalten. - Bei Hintergrundjobs den API-seitigen
timeoutpro Ergebnis beim Standardwert (30 s) belassen — das langsamste Ergebnis bestimmt die Gesamtlatenz.