KI-gestützte Web Scraper API

Kein Wartungsaufwand. Niemals.

Ein API-Aufruf, um jede Webseite in Markdown oder Tabellen umzuwandeln. Versorgen Sie Ihren Agenten mit Live-Webdaten, bauen Sie RAG auf und reichern Sie Datenbanken an — wir übernehmen die Infrastruktur.

Vertraut von über 100.000+ Nutzern weltweit

ktm logoadidas logolindt_sprungli logored_bull_technology logobryter logokuppinger_cole logouniversity_of_st_gallen logoharvard_university logobcg logowix logozooom_productions logoktm logoadidas logolindt_sprungli logored_bull_technology logobryter logokuppinger_cole logouniversity_of_st_gallen logoharvard_university logobcg logowix logozooom_productions logoktm logoadidas logolindt_sprungli logored_bull_technology logobryter logokuppinger_cole logouniversity_of_st_gallen logoharvard_university logobcg logowix logozooom_productions logoktm logoadidas logolindt_sprungli logored_bull_technology logobryter logokuppinger_cole logouniversity_of_st_gallen logoharvard_university logobcg logowix logozooom_productions logoktm logoadidas logolindt_sprungli logored_bull_technology logobryter logokuppinger_cole logouniversity_of_st_gallen logoharvard_university logobcg logowix logozooom_productions logoktm logoadidas logolindt_sprungli logored_bull_technology logobryter logokuppinger_cole logouniversity_of_st_gallen logoharvard_university logobcg logowix logozooom_productions logo

In wenigen Minuten startklar

Probieren Sie es jetzt in Ihrem Terminal aus.

>_
URL zu Markdown
1import requests
2
3resp = requests.post(
4 "https://open.thunderbit.com/v1/distill",
5 headers={"Authorization": f"Bearer {API_KEY}"},
6 json={"url": "https://example.com/article"}
7)
8
9markdown = resp.json()["data"]["markdown"]
Core API

Zwei Kernfunktionen

Distill für saubere Inhalte, Extract für strukturierte Daten

Distill
URLMarkdown
Entfernt Anzeigen, Navigation und Störendes — behält nur den wichtigen Inhalt
Vollständiges JS-Rendering und integrierter Anti-Bot-Bypass
Bis zu 100 URLs pro Anfrage im Batch verarbeiten
Extract
URL + SchemaJSON / CSV
Ein Schema funktioniert auf allen Websites — keine wartungsaufwändigen Einzelseiten-Lösungen
Übersteht Website-Redesigns automatisch
Bis zu 50 URLs pro Anfrage im Batch verarbeiten
Vorteile

Warum Thunderbit verwenden

Die Scraping-/Datenextraktions-Infrastruktur, die Ihr KI-Agent verdient

Definieren Sie das Was, nicht das Wie
Keine CSS-Selektoren, kein XPath, keine regelspezifischen Vorgaben pro Website. Beschreiben Sie die benötigten Daten mit einem JSON Schema — die KI erkennt, wo sie sich befinden und wie man sie erhält.
Ein Schema, jede Website
Dasselbe Schema funktioniert für E-Commerce-Websites, Verkaufsangebote oder jede beliebige URL. Das Hinzufügen einer neuen Datenquelle ist eine Konfigurationsänderung, kein Engineering-Sprint.
Funktioniert weiter, wenn Websites sich ändern
Traditionelle Scraper scheitern bei jedem Redesign. Thunderbit liest die Bedeutung, nicht die DOM-Struktur — daher funktioniert die Extraktion weiter, selbst wenn sich das HTML im Hintergrund ändert.
Branchen

Anwendungsfälle

Was Sie mit Thunderbit bauen können

KI-Agenten mit Webzugriff
Geben Sie Ihrem Agenten die Fähigkeit, jede Webseite zu lesen und zu verstehen. Ein API-Aufruf liefert strukturierten Kontext, bereit für den nächsten Schritt Ihres Agenten.
RAG & Wissensdatenbanken
Wandeln Sie jede URL in sauberes Markdown um und speisen Sie es direkt in Ihre Vektordatenbank ein. Kein HTML-Parsing, keine Skripte zur Inhaltsbereinigung.
Jede Website in eine API verwandeln
Definieren Sie ein Schema, geben Sie eine URL an und erhalten Sie JSON zurück. Erstellen Sie eine Produktpreis-API, eine Joblisten-API oder eine News-Feed-API — ohne einen einzigen Scraper zu schreiben.
Datenbank-Anreicherung
Halten Sie Ihre Datenbank mit Live-Webdaten aktuell. Rufen Sie Unternehmensprofile, Kontaktinformationen oder Angebotsdetails nach Zeitplan ab — das Schema bleibt gleich, auch wenn sich die Quellen ändern.
Wettbewerbsbeobachtung
Verfolgen Sie Preise, Bestände, Bewertungen oder Inhaltsänderungen über Hunderte von Seiten hinweg. Gleiches Schema, gleiche Pipeline, neue Quellen in Sekunden hinzufügen.
Datensatz-Erstellung
Erstellen Sie Trainingsdatensätze, Evaluierungs-Benchmarks oder Forschungsdatensätze aus dem offenen Web. Verarbeiten Sie Tausende von URLs im Batch zu konsistent strukturierten Ausgaben.

Wir bauen Thunderbit auf dieser API auf

Dieselbe API, die Sie sich gerade ansehen, betreibt Thunderbits Chrome-Erweiterung und Web-App — genutzt von 100.000+ Nutzern, um jeden Monat zig Millionen Seiten zu extrahieren. Das ist kein Nebenprojekt. Es ist die Infrastruktur, auf die wir unser eigenes Produkt setzen.

0M+
Monatlich verarbeitete Seiten und weiter wachsend
0K+
Nutzer der Thunderbit-Erweiterung
0%
Verfügbarkeit
Plan

Preise

Kostenlos starten, mit Ihrem Wachstum zahlen

Kostenlos
Eine unkomplizierte Möglichkeit, Scraping auszuprobieren. Kostenlos, ohne Karte, ohne Aufwand.
600 Einheiten / einmalig
$0einmalig
 
Distill 600 Seiten
Extract 30 Seiten
2 gleichzeitige Anfragen
Starter
Ideal für Nebenprojekte und kleine Tools. Schnell, einfach, ohne Overkill.
60,000 API-Einheiten / Jahr
$16/Monat
Jährliche Abrechnung. Alle Einheiten im Voraus.
Distill 60,000 Seiten
Extract 3,000 Seiten
30 gleichzeitige Anfragen
Basis-Support
Pro1Am beliebtesten
Für hohes Volumen und hohe Geschwindigkeit entwickelt. Thunderbit in Höchstform.
600,000 API-Einheiten / Jahr
$40/Monat
Jährliche Abrechnung. Alle Einheiten im Voraus.
600K1200K2400K4800K
Distill 600,000 Seiten
Extract 30,000 Seiten
50 gleichzeitige Anfragen
Prioritäts-Support

Häufig gestellte Fragen

Alles, was Sie über das Produkt und die Abrechnung wissen müssen.