KI-gestützte Web Scraper API

Null Wartung. Für immer.

Ein API-Aufruf, um jede Webseite in Markdown oder Tabellen zu verwandeln. Versorgen Sie Ihren Agenten mit Live-Webdaten, bauen Sie RAG auf und reichern Sie Datenbanken an — wir übernehmen die Infrastruktur.

Vertraut von über 100.000 Nutzern weltweit

ktm logoadidas logolindt_sprungli logored_bull_technology logobryter logokuppinger_cole logouniversity_of_st_gallen logoharvard_university logobcg logowix logozooom_productions logoktm logoadidas logolindt_sprungli logored_bull_technology logobryter logokuppinger_cole logouniversity_of_st_gallen logoharvard_university logobcg logowix logozooom_productions logoktm logoadidas logolindt_sprungli logored_bull_technology logobryter logokuppinger_cole logouniversity_of_st_gallen logoharvard_university logobcg logowix logozooom_productions logoktm logoadidas logolindt_sprungli logored_bull_technology logobryter logokuppinger_cole logouniversity_of_st_gallen logoharvard_university logobcg logowix logozooom_productions logoktm logoadidas logolindt_sprungli logored_bull_technology logobryter logokuppinger_cole logouniversity_of_st_gallen logoharvard_university logobcg logowix logozooom_productions logoktm logoadidas logolindt_sprungli logored_bull_technology logobryter logokuppinger_cole logouniversity_of_st_gallen logoharvard_university logobcg logowix logozooom_productions logo

In wenigen Minuten startklar

Probieren Sie es jetzt in Ihrem Terminal aus.

>_
URL zu Markdown
1import requests
2
3resp = requests.post(
4 "https://open.thunderbit.com/v1/distill",
5 headers={"Authorization": f"Bearer {API_KEY}"},
6 json={"url": "https://example.com/article"}
7)
8
9markdown = resp.json()["data"]["markdown"]
Core API

Zwei Kernfunktionen

Distill für saubere Inhalte, Extract für strukturierte Daten

Distill
URLMarkdown
Entfernt Werbung, Navigation und störende Elemente — behält nur den relevanten Inhalt
Vollständiges JS-Rendering und Anti-Bot-Bypass integriert
Bis zu 100 URLs pro Anfrage im Batch verarbeiten
Extract
URL + SchemaJSON / CSV
Ein Schema funktioniert auf allen Websites — keine Wartung pro Website
Übersteht Website-Relaunches automatisch
Bis zu 50 URLs pro Anfrage im Batch verarbeiten
Vorteile

Warum Thunderbit nutzen

Die Scraping-/Datenextraktions-Infrastruktur, die Ihr KI-Agent verdient

Definieren, was, nicht wie
Keine CSS-Selektoren, kein XPath, keine website-spezifischen Regeln. Beschreiben Sie die benötigten Daten mit einem JSON Schema — die KI findet heraus, wo sie sich befinden und wie sie abgerufen werden.
Ein Schema, jede Website
Dasselbe Schema funktioniert für E-Commerce-Seiten, Verkaufsanzeigen oder jede beliebige URL. Das Hinzufügen einer neuen Datenquelle ist eine Konfigurationsänderung, kein Engineering-Sprint.
Funktioniert weiter, wenn Websites sich ändern
Klassische Scraper scheitern bei jedem Relaunch. Thunderbit liest die Bedeutung, nicht die DOM-Struktur — daher funktioniert die Extraktion weiter, selbst wenn sich das HTML darunter ändert.
Branchen

Anwendungsfälle

Was Sie mit Thunderbit bauen können

KI-Agenten mit Webzugriff
Geben Sie Ihrem Agenten die Fähigkeit, jede Webseite zu lesen und zu verstehen. Ein API-Aufruf liefert strukturierten Kontext, bereit für den nächsten Schritt Ihres Agenten.
RAG & Wissensdatenbanken
Verwandeln Sie jede URL in sauberes Markdown und speisen Sie es direkt in Ihre Vektordatenbank ein. Kein HTML-Parsing, keine Skripte zur Inhaltsbereinigung.
Jede Website in eine API verwandeln
Definieren Sie ein Schema, geben Sie eine URL an und erhalten Sie JSON zurück. Erstellen Sie eine Produktpreis-API, eine Jobbörsen-API oder eine Newsfeed-API — ohne einen einzigen Scraper zu schreiben.
Datenbank-Anreicherung
Halten Sie Ihre Datenbank mit Live-Webdaten aktuell. Rufen Sie Firmenprofile, Kontaktdaten oder Angebotsdetails planmäßig ab — das Schema bleibt gleich, auch wenn sich Quellen ändern.
Wettbewerbs-Monitoring
Verfolgen Sie Preise, Lagerbestände, Bewertungen oder Inhaltsänderungen über Hunderte von Seiten hinweg. Dasselbe Schema, dieselbe Pipeline, neue Quellen in Sekunden hinzufügen.
Datensatz-Erstellung
Erstellen Sie Trainingsdatensätze, Evaluierungs-Benchmarks oder Forschungsdatensätze aus dem offenen Web. Verarbeiten Sie Tausende von URLs im Batch zu konsistent strukturierten Ausgaben.

Wir entwickeln Thunderbit auf Basis dieser API

Dieselbe API, die Sie hier sehen, treibt Thunderbits Chrome-Erweiterung und Web-App an — genutzt von über 100.000 Nutzern, um jeden Monat zig Millionen Seiten zu extrahieren. Das ist kein Nebenprojekt. Es ist die Infrastruktur, auf die wir unser eigenes Produkt setzen.

0M+
Monatlich verarbeitete Seiten und weiter wachsend
0K+
Nutzer der Thunderbit-Erweiterung
0%
Verfügbarkeit
Plan

Preise

Kostenlos starten, mit dem Wachstum zahlen

Kostenlos
Eine leichte Möglichkeit, Scraping auszuprobieren. Keine Kosten, keine Karte, kein Aufwand.
600 Einheiten / einmalig
$0einmalig
 
Distill 600 Seiten
Extract 30 Seiten
2 gleichzeitige Anfragen
Starter
Ideal für Nebenprojekte und kleine Tools. Schnell, einfach, ohne Overkill.
60,000 API-Einheiten / Jahr
$16/Monat
Jährliche Abrechnung. Alle Einheiten im Voraus.
Distill 60,000 Seiten
Extract 3,000 Seiten
30 gleichzeitige Anfragen
Basis-Support
Pro1Am beliebtesten
Für hohe Volumina und Geschwindigkeit gebaut. Thunderbit in voller Stärke.
600,000 API-Einheiten / Jahr
$40/Monat
Jährliche Abrechnung. Alle Einheiten im Voraus.
600K1200K2400K4800K
Distill 600,000 Seiten
Extract 30,000 Seiten
50 gleichzeitige Anfragen
Prioritäts-Support

Häufig gestellte Fragen

Alles, was Sie über das Produkt und die Abrechnung wissen müssen.