AI-Powered Web Scraper API

Žádná údržba. Vůbec nikdy.

Jedním API voláním proměníte jakoukoli webovou stránku na Markdown nebo tabulky. Zásobte svého agenta živými webovými daty, vytvářejte RAG a obohacujte databáze — o infrastrukturu se postaráme my.

Důvěřuje mu více než 100 000+ uživatelů po celém světě

harvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logo

Spuštěno během několika minut

Vyzkoušejte to teď ve svém terminálu.

>_
URL na Markdown
1import requests
2
3resp = requests.post(
4 "https://open.thunderbit.com/v1/distill",
5 headers={"Authorization": f"Bearer {API_KEY}"},
6 json={"url": "https://example.com/article"}
7)
8
9markdown = resp.json()["data"]["markdown"]
Core API

Dvě klíčové schopnosti

Distill pro čistý obsah, Extract pro strukturovaná data

Distill
URLMarkdown
Odstraní reklamy, navigaci i rušivé prvky — ponechá jen důležitý obsah
Vestavěné plné vykreslování JS a obcházení anti-bot ochran
Dávkově až 100 URL na požadavek
Extract
URL + SchemaJSON / CSV
Jedno schéma funguje na všech webech — bez údržby pro jednotlivé weby
Automaticky přežije redesign webu
Dávkově až 50 URL na požadavek
Výhody

Proč používat Thunderbit

Infrastruktura pro scrapování / extrakci dat, kterou si váš AI agent zaslouží

Definujte co, ne jak
Žádné CSS selektory, žádný XPath, žádná pravidla pro jednotlivé weby. Popište data, která potřebujete, pomocí JSON Schema — AI zjistí, kde jsou a jak je získat.
Jedno schéma, každý web
Stejné schéma funguje napříč e-commerce weby, nabídkami k prodeji nebo jakoukoli URL, kterou mu předložíte. Přidání nového zdroje dat je změna konfigurace, ne inženýrský sprint.
Funguje i když se weby rozbijí
Tradiční scrapery při každém redesignu selžou. Thunderbit čte význam, ne strukturu DOM — takže extrakce funguje i tehdy, když se HTML pod ní změní.
Odvětví

Případy použití

Co můžete s Thunderbit vytvořit

AI agenti s přístupem na web
Dejte svému agentovi schopnost číst a chápat jakoukoli webovou stránku. Jediný API požadavek vrátí strukturovaný kontext připravený pro další krok vašeho agenta.
RAG a znalostní báze
Přeměňte libovolnou URL na čistý Markdown a rovnou jej odešlete do své vektorové databáze. Žádné parsování HTML, žádné skripty na čištění obsahu.
Proměňte jakýkoli web na API
Definujte schéma, zadejte URL a získejte JSON zpět. Vytvořte API pro ceny produktů, nabídky práce nebo zpravodajský feed — bez napsání jediného scrapera.
Obohacování databází
Udržujte svou databázi aktuální pomocí živých webových dat. Na plánované bázi stahujte profily firem, kontaktní údaje nebo detaily nabídek — schéma zůstává stejné, i když se zdroje změní.
Sledování konkurence
Sledujte ceny, zásoby, recenze nebo změny obsahu na stovkách stránek. Stejné schéma, stejný proces, nové zdroje přidáte během několika sekund.
Tvorba datových sad
Vytvářejte trénovací sady, evaluační benchmarky nebo výzkumné datové sady z otevřeného webu. Dávkově zpracujte tisíce URL do konzistentně strukturovaného výstupu.

Thunderbit stavíme na tomto API

Stejné API, na které se právě díváte, pohání rozšíření pro Chrome Thunderbit i webovou aplikaci — používá jej více než 100 000 uživatelů k extrakci desítek milionů stránek každý měsíc. Tohle není vedlejší projekt. Je to infrastruktura, na kterou vsazujeme vlastní produkt.

0M+
Stránek zpracovaných měsíčně a stále přibývajících
0K+
Uživatelé rozšíření Thunderbit
0%
Dostupnost
Plán

Ceník

Začněte zdarma, plaťte podle růstu

Zdarma
Lehký způsob, jak si vyzkoušet scrapování. Bez nákladů, bez karty, bez starostí.
600 jednotek / jednorázově
$0jednorázově
 
Distill 600 stránek
Extract 30 stránek
2 souběžné požadavky
Starter
Skvělé pro vedlejší projekty a malé nástroje. Rychlé, jednoduché, bez zbytečností.
60,000 API jednotek / rok
$16/měsíc
Účtováno ročně. Všechny jednotky předem.
Distill 60,000 stránek
Extract 3,000 stránek
30 souběžných požadavků
Základní podpora
Pro1Nejoblíbenější
Vytvořeno pro vysoký objem a rychlost. Thunderbit v plné síle.
600,000 API jednotek / rok
$40/měsíc
Účtováno ročně. Všechny jednotky předem.
600K1200K2400K4800K
Distill 600,000 stránek
Extract 30,000 stránek
50 souběžných požadavků
Prioritní podpora

Často kladené otázky

Vše, co potřebujete vědět o produktu a fakturaci.