AI-gestuurde Web Scraper API

Geen onderhoud. Echt niet.

Eén API-aanroep om elke webpagina om te zetten in Markdown of tabellen. Voorzie je agent van live webdata, bouw RAG en verrijk databases — wij verzorgen de infrastructuur.

Vertrouwd door meer dan 100.000 gebruikers wereldwijd

harvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logo

Binnen enkele minuten operationeel

Probeer het nu direct in je terminal.

>_
URL naar Markdown
1import requests
2
3resp = requests.post(
4 "https://open.thunderbit.com/v1/distill",
5 headers={"Authorization": f"Bearer {API_KEY}"},
6 json={"url": "https://example.com/article"}
7)
8
9markdown = resp.json()["data"]["markdown"]
Core API

Twee kernmogelijkheden

Distill voor schone content, Extract voor gestructureerde data

Distill
URLMarkdown
Verwijdert advertenties, navigatie en ruis — behoudt alleen de content die ertoe doet
Volledige JS-rendering en ingebouwde anti-botomzeiling
Verwerk tot 100 URL's per verzoek
Extract
URL + schemaJSON / CSV
Eén schema werkt op alle websites — geen onderhoud per site
Overleeft automatisch site-herontwerpen
Verwerk tot 50 URL's per verzoek
Voordelen

Waarom Thunderbit gebruiken

De scraping- en data-extractie-infrastructuur die je AI-agent verdient

Bepaal wat, niet hoe
Geen CSS-selectors, geen XPath, geen regels per site. Beschrijf de data die je nodig hebt met een JSON Schema — AI bepaalt waar het staat en hoe je het krijgt.
Eén schema, elke website
Hetzelfde schema werkt op e-commercesites, verkoopoverzichten of elke URL die je erop loslaat. Een nieuwe databron toevoegen is een configuratiewijziging, geen engineering sprint.
Blijft werken wanneer sites veranderen
Traditionele scrapers gaan kapot bij elke redesign. Thunderbit leest betekenis, niet de DOM-structuur — dus extractie blijft werken, zelfs als de HTML onderliggend verandert.
Sectoren

Toepassingen

Wat je met Thunderbit kunt bouwen

AI-agents met webtoegang
Geef je agent de mogelijkheid om elke webpagina te lezen en te begrijpen. Eén API-aanroep levert gestructureerde context op, klaar voor de volgende stap van je agent.
RAG & kennisbanken
Zet elke URL om in schone Markdown en stuur het direct naar je vectordatabase. Geen HTML-parsing, geen scripts voor contentopschoning.
Zet elke website om in een API
Definieer een schema, wijs naar een URL en ontvang JSON terug. Bouw een productprijs-API, een vacatures-API of een nieuwsfeed-API — zonder ook maar één scraper te schrijven.
Databaseverrijking
Houd je database actueel met live webdata. Haal bedrijfsprofielen, contactgegevens of listingdetails op volgens een schema — het schema blijft gelijk, zelfs als bronnen veranderen.
Concurrentiemonitoring
Volg prijzen, voorraad, reviews of contentwijzigingen over honderden pagina's. Zelfde schema, zelfde pipeline, nieuwe bronnen in enkele seconden toevoegen.
Dataset opbouwen
Bouw trainingssets, evaluatiebenchmarks of onderzoeksdatasets op basis van het open web. Verwerk duizenden URL's in batches naar consistent gestructureerde output.

Wij bouwen Thunderbit op deze API

Dezelfde API die je hier ziet, ondersteunt Thunderbit's Chrome-extensie en webapp — gebruikt door 100.000+ gebruikers om elke maand tientallen miljoenen pagina's te extraheren. Dit is geen side-project. Het is de infrastructuur waarop we ons eigen product inzetten.

0M+
Pagina's die maandelijks worden verwerkt en blijven groeien
0K+
Gebruikers van de Thunderbit-extensie
0%
Uptime
Abonnement

Prijzen

Begin gratis, betaal naarmate je groeit

Gratis
Een lichte manier om scrapen uit te proberen. Geen kosten, geen kaart, geen gedoe.
600 credits / eenmalig
$0eenmalig
 
Distill 600 pagina's
Extract 30 pagina's
2 gelijktijdige verzoeken
Starter
Ideaal voor side-projects en kleine tools. Snel, simpel, zonder overkill.
60,000 API-credits / jaar
$16/maand
Jaarlijkse facturering. Alle credits vooraf.
Distill 60,000 pagina's
Extract 3,000 pagina's
30 gelijktijdige verzoeken
Basisondersteuning
Pro1Meest populair
Gebouwd voor hoge volumes en snelheid. Thunderbit op volle kracht.
600,000 API-credits / jaar
$40/maand
Jaarlijkse facturering. Alle credits vooraf.
600K1200K2400K4800K
Distill 600,000 pagina's
Extract 30,000 pagina's
50 gelijktijdige verzoeken
Prioriteitsondersteuning

Veelgestelde vragen

Alles wat je moet weten over het product en de facturering.