What's the difference between Distill and Extract?

Distill converts any URL into clean Markdown, stripping ads, navigation, and noise. Extract takes a URL plus a JSON Schema and returns structured JSON or CSV data. Use Distill for content ingestion (RAG, knowledge bases) and Extract for structured data collection (prices, listings, contacts).

Does it work with JavaScript-heavy sites?

Yes. Thunderbit's API includes full JavaScript rendering and anti-bot bypass built in. It handles SPAs, dynamic content, and pages that require JS execution to load data.

Will extraction break when a site redesigns?

No. Thunderbit reads meaning, not DOM structure. Traditional scrapers rely on CSS selectors and XPath that break on every redesign. Thunderbit's AI understands the semantic content of the page, so extraction keeps working even when the HTML changes underneath.

What is the confidence score?

The confidence score indicates how certain Thunderbit's AI is about the extracted data. It helps you programmatically decide whether to trust a result or flag it for review.

How long do batch jobs take?

Batch processing times depend on the number of URLs and complexity. Distill supports up to 100 URLs per request and Extract supports up to 50 URLs per request. Most batch jobs complete within minutes.

AI-drevet Web Scraper API

Ingen vedligeholdelse. Nogensinde.

Ét API-kald for at gøre enhver webside til Markdown eller tabeller. Forsyn din agent med live webdata, byg RAG, og berig databaser — vi håndterer infrastrukturen.

Få gratis API-nøgle Læs dokumentation

Chrome Store Rating

G2 Rating

Capterra Rating

Software Advice Rating

GetApp Rating

PRODUCT HUNT#1 Product of the Week

Users Worldwide200K+

Klar på få minutter

Prøv det i din terminal lige nu.

URL til Markdown

1import requests

3resp = requests.post(

4 "https://openapi.thunderbit.com/openapi/v1/distill",

5 headers={"Authorization": f"Bearer {API_KEY}"},

6 json={"url": "https://example.com/article"}

9markdown = resp.json()["data"]["markdown"]

Core API

To kernefunktioner

Distill til rent indhold, Extract til strukturerede data

Distill

URL→Markdown

Fjerner annoncer, navigation og støj — beholder kun det indhold, der betyder noget

Fuld JS-rendering og indbygget anti-bot-bypass

Batch op til 100 URL'er pr. forespørgsel

Extract

URL + skema→JSON / CSV

Ét skema virker på tværs af alle websteder — ingen vedligeholdelse per websted

Overlever websteds-redesigns automatisk

Batch op til 50 URL'er pr. forespørgsel

Fordele

Hvorfor bruge Thunderbit

Scraping-/dataudtræksinfrastrukturen, din AI-agent fortjener

Definér hvad, ikke hvordan

Ingen CSS-selektorer, ingen XPath, ingen regler pr. websted. Beskriv de data, du har brug for, med et JSON-skema — AI finder selv ud af, hvor de ligger, og hvordan de hentes.

Ét skema, alle websteder

Det samme skema virker på tværs af e-handelswebsteder, salgsopslag eller enhver URL, du kaster efter det. At tilføje en ny datakilde er en konfigurationsændring, ikke et udviklingsprojekt.

Fungerer stadig, når websteder ændrer sig

Traditionelle scrapers dør ved hver redesign. Thunderbit læser betydning, ikke DOM-struktur — så udtrækningen bliver ved med at virke, selv når HTML'en ændrer sig under overfladen.

Brancher

Anvendelser

Hvad du kan bygge med Thunderbit

AI-agenter med webadgang

Giv din agent mulighed for at læse og forstå enhver webside. Ét API-kald returnerer struktureret kontekst, klar til din agents næste skridt.

RAG & vidensbaser

Distill enhver URL til ren Markdown og send den direkte til din vektordatabase. Ingen HTML-parsing, ingen scripts til rengøring af indhold.

Gør ethvert websted til en API

Definér et skema, peg på en URL, og få JSON tilbage. Byg en API til produktpriser, jobopslag eller nyhedsfeeds — uden at skrive en eneste scraper.

Databas berigelse

Hold din database opdateret med live webdata. Hent virksomhedsprofiler, kontaktoplysninger eller annoncespecifikationer efter en tidsplan — skemaet forbliver det samme, selv når kilder ændrer sig.

Konkurrenceovervågning

Spor priser, lager, anmeldelser eller indholdsændringer på tværs af hundredvis af sider. Samme skema, samme pipeline, tilføj nye kilder på få sekunder.

Datasætbygning

Byg træningssæt, evalueringsbenchmarks eller forskningsdatasæt fra det åbne web. Batchbehandl tusindvis af URL'er til konsekvent struktureret output.

Vi bygger Thunderbit på denne API

Den samme API, du kigger på, driver Thunderbits Chrome-udvidelse og webapp — brugt af 200.000+ brugere til at udtrække titusindvis af millioner sider hver måned. Det er ikke et sideprojekt. Det er infrastrukturen vi selv satser vores produkt på.

0M+

Sider behandlet månedligt og voksende

0K+

Brugere af Thunderbit-udvidelsen

Oppetid

Plan

Priser

Start gratis, betal efterhånden som du vokser

Gratis

En enkel måde at prøve scraping på. Ingen omkostninger, intet kort, intet besvær.

600 enheder / engangs

$0engangs

Kom i gang

Distill 600 sider

Distill: 1 Page = 1 API Unit
Extract: 1 Page = 20 API Unit

Extract 30 sider

Distill: 1 Page = 1 API Unit
Extract: 1 Page = 20 API Unit

2 samtidige forespørgsler

Starter

Perfekt til sideprojekter og små værktøjer. Hurtigt, enkelt, uden overkill.

60,000 API-enheder / år

$16/måned

Faktureres årligt. Alle enheder forudbetales.

Abonner

Distill 60,000 sider

Distill: 1 Page = 1 API Unit
Extract: 1 Page = 20 API Unit

Extract 3,000 sider

Distill: 1 Page = 1 API Unit
Extract: 1 Page = 20 API Unit

30 samtidige forespørgsler

Basis support

Pro1Mest populære

Bygget til højt volumen og høj hastighed. Thunderbit for fuld kraft.

600,000 API-enheder / år

$40/måned

Faktureres årligt. Alle enheder forudbetales.

600K1200K2400K4800K

Abonner

Distill 600,000 sider

Distill: 1 Page = 1 API Unit
Extract: 1 Page = 20 API Unit

Extract 30,000 sider

Distill: 1 Page = 1 API Unit
Extract: 1 Page = 20 API Unit

50 samtidige forespørgsler

Prioriteret support

Ofte stillede spørgsmål

Alt, hvad du behøver at vide om produktet og fakturering.

Capterra

Edge Add-ons

AI-drevet Web Scraper API

Ingen vedligeholdelse. Nogensinde.

Klar på få minutter

To kernefunktioner

Hvorfor bruge Thunderbit

Anvendelser

Vi bygger Thunderbit på denne API

Priser

Ofte stillede spørgsmål

Hvad er forskellen mellem Distill og Extract?

Virker det med JavaScript-tunge websteder?

Vil udtrækning gå i stykker, når et websted redesignes?

Hvad er tillidsscoren?

Hvor lang tid tager batchjobs?