AI-Powered Web Scraper API

Žádná údržba. Vůbec.

Jediný API požadavek promění libovolnou webovou stránku v Markdown nebo tabulky. Naplňte svého agenta živými webovými daty, budujte RAG a obohacujte databáze — infrastrukturu zajistíme my.

Důvěřuje mu více než 100 000+ uživatelů po celém světě

harvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logo

Spuštěno během minut

Vyzkoušejte si to hned ve svém terminálu.

>_
URL na Markdown
1import requests
2
3resp = requests.post(
4 "https://open.thunderbit.com/v1/distill",
5 headers={"Authorization": f"Bearer {API_KEY}"},
6 json={"url": "https://example.com/article"}
7)
8
9markdown = resp.json()["data"]["markdown"]
Core API

Dvě klíčové funkce

Distill pro čistý obsah, Extract pro strukturovaná data

Distill
URLMarkdown
Odstraní reklamy, navigaci a rušivé prvky — ponechá jen důležitý obsah
Vestavěné plné vykreslování JS a obcházení anti-bot ochrany
Dávkově až 100 URL na požadavek
Extract
URL + schémaJSON / CSV
Jedno schéma funguje napříč všemi weby — bez údržby pro každý web zvlášť
Automaticky přežije redesign webu
Dávkově až 50 URL na požadavek
Výhody

Proč používat Thunderbit

Infrastruktura pro scraping / extrakci dat, kterou si váš AI agent zaslouží

Definujte co, ne jak
Žádné CSS selektory, žádné XPath, žádná pravidla pro jednotlivé weby. Popište data, která potřebujete, pomocí JSON schématu — AI zjistí, kde jsou a jak je získat.
Jedno schéma, všechny weby
Stejné schéma funguje napříč e-commerce weby, inzeráty nebo jakoukoli URL, kterou na něj hodíte. Přidání nového zdroje dat je změna konfigurace, ne několikadenní vývoj.
Funguje i když se weby rozbijí
Tradiční scrapery při každém redesignu selžou. Thunderbit čte význam, ne strukturu DOM — takže extrakce funguje dál i tehdy, když se HTML pod tím změní.
Odvětví

Případy použití

Co můžete vytvořit s Thunderbit

AI agenti s přístupem k webu
Dejte svému agentovi schopnost číst a rozumět jakékoli webové stránce. Jediný API požadavek vrátí strukturovaný kontext připravený pro další krok agenta.
RAG a znalostní báze
Přeměňte libovolnou URL na čistý Markdown a rovnou ji pošlete do své vektorové databáze. Žádné parsování HTML, žádné skripty na čištění obsahu.
Proměňte jakýkoli web v API
Definujte schéma, zadejte URL a získejte JSON zpět. Vytvořte API pro ceny produktů, nabídky práce nebo zpravodajský feed — bez napsání jediného scrapovacího skriptu.
Obohacování databází
Udržujte svou databázi čerstvou díky živým webovým datům. Podle plánu stahujte profily firem, kontaktní údaje nebo detaily nabídek — schéma zůstává stejné i při změně zdrojů.
Sledování konkurence
Sledujte ceny, zásoby, recenze nebo změny obsahu na stovkách stránek. Stejné schéma, stejný pipeline, nové zdroje přidáte během sekund.
Tvorba datových sad
Vytvářejte trénovací sady, hodnoticí benchmarky nebo výzkumné datové sady z otevřeného webu. Dávkově zpracujte tisíce URL do konzistentně strukturovaného výstupu.

Na tomto API stavíme Thunderbit

Stejné API, na které se právě díváte, pohání rozšíření Chrome i webovou aplikaci Thunderbit — používá ho více než 100 000 uživatelů k extrakci desítek milionů stránek každý měsíc. Tohle není vedlejší projekt. Je to infrastruktura, na kterou sázíme vlastní produkt.

0M+
Měsíčně zpracované stránky a další růst
0K+
Uživatelé rozšíření Thunderbit
0%
Doba provozu
Plán

Ceník

Začněte zdarma, plaťte s růstem

Zdarma
Lehký způsob, jak si scraping vyzkoušet. Bez nákladů, bez karty, bez starostí.
600 jednotek / jednorázově
$0jednorázově
 
Distill 600 stránek
Extract 30 stránek
2 souběžné požadavky
Starter
Skvělé pro vedlejší projekty a malé nástroje. Rychlé, jednoduché, bez zbytečností.
60,000 API jednotek / rok
$16/měsíc
Účtováno ročně. Všechny jednotky předem.
Distill 60,000 stránek
Extract 3,000 stránek
30 souběžných požadavků
Základní podpora
Pro1Nejpopulárnější
Navrženo pro vysoký objem a rychlost. Thunderbit v plné síle.
600,000 API jednotek / rok
$40/měsíc
Účtováno ročně. Všechny jednotky předem.
600K1200K2400K4800K
Distill 600,000 stránek
Extract 30,000 stránek
50 souběžných požadavků
Přednostní podpora

Často kladené dotazy

Vše, co potřebujete vědět o produktu a fakturaci.