Jedním API voláním proměníte jakoukoli webovou stránku na Markdown nebo tabulky. Zásobte svého agenta živými webovými daty, vytvářejte RAG a obohacujte databáze — o infrastrukturu se postaráme my.
Důvěřuje mu více než 100 000+ uživatelů po celém světě
Spuštěno během několika minut
Vyzkoušejte to teď ve svém terminálu.
>_
URL na Markdown
1importrequests
2
3resp=requests.post(
4"https://open.thunderbit.com/v1/distill",
5headers={"Authorization":f"Bearer {API_KEY}"},
6json={"url":"https://example.com/article"}
7)
8
9markdown=resp.json()["data"]["markdown"]
Core API
Dvě klíčové schopnosti
Distill pro čistý obsah, Extract pro strukturovaná data
Distill
URL→Markdown
Odstraní reklamy, navigaci i rušivé prvky — ponechá jen důležitý obsah
Vestavěné plné vykreslování JS a obcházení anti-bot ochran
Dávkově až 100 URL na požadavek
Extract
URL + Schema→JSON / CSV
Jedno schéma funguje na všech webech — bez údržby pro jednotlivé weby
Automaticky přežije redesign webu
Dávkově až 50 URL na požadavek
Výhody
Proč používat Thunderbit
Infrastruktura pro scrapování / extrakci dat, kterou si váš AI agent zaslouží
Definujte co, ne jak
Žádné CSS selektory, žádný XPath, žádná pravidla pro jednotlivé weby. Popište data, která potřebujete, pomocí JSON Schema — AI zjistí, kde jsou a jak je získat.
Jedno schéma, každý web
Stejné schéma funguje napříč e-commerce weby, nabídkami k prodeji nebo jakoukoli URL, kterou mu předložíte. Přidání nového zdroje dat je změna konfigurace, ne inženýrský sprint.
Funguje i když se weby rozbijí
Tradiční scrapery při každém redesignu selžou. Thunderbit čte význam, ne strukturu DOM — takže extrakce funguje i tehdy, když se HTML pod ní změní.
Odvětví
Případy použití
Co můžete s Thunderbit vytvořit
AI agenti s přístupem na web
Dejte svému agentovi schopnost číst a chápat jakoukoli webovou stránku. Jediný API požadavek vrátí strukturovaný kontext připravený pro další krok vašeho agenta.
RAG a znalostní báze
Přeměňte libovolnou URL na čistý Markdown a rovnou jej odešlete do své vektorové databáze. Žádné parsování HTML, žádné skripty na čištění obsahu.
Proměňte jakýkoli web na API
Definujte schéma, zadejte URL a získejte JSON zpět. Vytvořte API pro ceny produktů, nabídky práce nebo zpravodajský feed — bez napsání jediného scrapera.
Obohacování databází
Udržujte svou databázi aktuální pomocí živých webových dat. Na plánované bázi stahujte profily firem, kontaktní údaje nebo detaily nabídek — schéma zůstává stejné, i když se zdroje změní.
Sledování konkurence
Sledujte ceny, zásoby, recenze nebo změny obsahu na stovkách stránek. Stejné schéma, stejný proces, nové zdroje přidáte během několika sekund.
Tvorba datových sad
Vytvářejte trénovací sady, evaluační benchmarky nebo výzkumné datové sady z otevřeného webu. Dávkově zpracujte tisíce URL do konzistentně strukturovaného výstupu.
Thunderbit stavíme na tomto API
Stejné API, na které se právě díváte, pohání rozšíření pro Chrome Thunderbit i webovou aplikaci — používá jej více než 100 000 uživatelů k extrakci desítek milionů stránek každý měsíc.
Tohle není vedlejší projekt. Je to infrastruktura, na kterou vsazujeme vlastní produkt.
0M+
Stránek zpracovaných měsíčně a stále přibývajících
0K+
Uživatelé rozšíření Thunderbit
0%
Dostupnost
Plán
Ceník
Začněte zdarma, plaťte podle růstu
Zdarma
Lehký způsob, jak si vyzkoušet scrapování. Bez nákladů, bez karty, bez starostí.