AI-aangedreven Web Scraper API

Geen onderhoud. Nooit.

Eén API-aanroep om elke webpagina om te zetten in Markdown of tabellen. Voorzie je agent van live webdata, bouw RAG en verrijk databases — wij regelen de infrastructuur.

Vertrouwd door meer dan 100.000+ gebruikers wereldwijd

harvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logo

Binnen enkele minuten operationeel

Probeer het nu direct in je terminal.

>_
URL naar Markdown
1import requests
2
3resp = requests.post(
4 "https://open.thunderbit.com/v1/distill",
5 headers={"Authorization": f"Bearer {API_KEY}"},
6 json={"url": "https://example.com/article"}
7)
8
9markdown = resp.json()["data"]["markdown"]
Core API

Twee kernfunctionaliteiten

Distill voor schone content, Extract voor gestructureerde data

Distill
URLMarkdown
Haalt advertenties, navigatie en ruis weg — behoudt alleen de inhoud die ertoe doet
Volledige JS-rendering en anti-bot omzeiling ingebouwd
Verwerk tot 100 URL's per aanvraag
Extract
URL + schemaJSON / CSV
Eén schema werkt op alle websites — geen onderhoud per site
Overleeft automatisch siteherontwerpen
Verwerk tot 50 URL's per aanvraag
Voordelen

Waarom Thunderbit gebruiken

De scraping- / data-extractie-infrastructuur die je AI-agent verdient

Bepaal wat, niet hoe
Geen CSS-selectors, geen XPath, geen regels per site. Beschrijf de data die je nodig hebt met een JSON Schema — AI bedenkt waar die staat en hoe je die krijgt.
Eén schema, elke website
Hetzelfde schema werkt op e-commercesites, verkoopaanbiedingen of elke URL die je erop loslaat. Een nieuwe databron toevoegen is een configuratiewijziging, geen engineering-sprint.
Blijft werken als websites veranderen
Traditionele scrapers vallen uit bij elk herontwerp. Thunderbit leest betekenis, niet de DOM-structuur — dus extractie blijft werken, zelfs als de HTML eronder verandert.
Sectoren

Toepassingen

Wat je met Thunderbit kunt bouwen

AI-agents met webtoegang
Geef je agent de mogelijkheid om elke webpagina te lezen en te begrijpen. Eén API-aanroep levert gestructureerde context op, klaar voor de volgende stap van je agent.
RAG & kennisbanken
Zet elke URL om in schone Markdown en voer die rechtstreeks in je vector database in. Geen HTML-analyse, geen scripts voor contentopschoning.
Zet elke website om in een API
Definieer een schema, wijs naar een URL en ontvang JSON terug. Bouw een API voor productprijzen, vacatures of nieuwsfeeds — zonder één scraper te schrijven.
Databaseverrijking
Houd je database up-to-date met live webdata. Haal bedrijfprofielen, contactgegevens of listingdetails op volgens een schema — het schema blijft hetzelfde, zelfs als bronnen veranderen.
Concurrentiemonitoring
Volg prijzen, voorraad, reviews of contentwijzigingen op honderden pagina's. Zelfde schema, zelfde pipeline, nieuwe bronnen toevoegen in enkele seconden.
Dataset opbouwen
Bouw trainingssets, evaluatiebenchmarks of onderzoeksdatasets uit het open web. Verwerk duizenden URL's in batches tot consistent gestructureerde output.

We bouwen Thunderbit op deze API

Dezelfde API die je hier ziet, drijft Thunderbit's Chrome-extensie en webapp aan — gebruikt door 100.000+ gebruikers om elke maand tientallen miljoenen pagina's te extraheren. Dit is geen side-project. Dit is de infrastructuur waarop we ons eigen product inzetten.

0M+
Maandelijks verwerkte pagina's en groeiend
0K+
Gebruikers van de Thunderbit-extensie
0%
Beschikbaarheid
Abonnement

Prijzen

Begin gratis, betaal naarmate je groeit

Gratis
Een eenvoudige manier om scrapen uit te proberen. Geen kosten, geen creditcard, geen gedoe.
600 eenheden / eenmalig
$0eenmalig
 
Distill 600 pagina's
Extract 30 pagina's
2 gelijktijdige aanvragen
Starter
Ideaal voor side-projects en kleine tools. Snel, simpel, zonder overkill.
60,000 API-eenheden / jaar
$16/maand
Jaarlijkse facturatie. Alle eenheden vooraf.
Distill 60,000 pagina's
Extract 3,000 pagina's
30 gelijktijdige aanvragen
Basisondersteuning
Pro1Meest populair
Gebouwd voor hoge volumes en snelheid. Thunderbit op volle kracht.
600,000 API-eenheden / jaar
$40/maand
Jaarlijkse facturatie. Alle eenheden vooraf.
600K1200K2400K4800K
Distill 600,000 pagina's
Extract 30,000 pagina's
50 gelijktijdige aanvragen
Prioriteitsondersteuning

Veelgestelde vraagstukken

Alles wat je moet weten over het product en de facturatie.