Jedno wywołanie API, aby zamienić dowolną stronę w Markdown lub tabelę. Zasil swojego agenta aktualnymi danymi z sieci, buduj RAG i wzbogacaj bazy danych — infrastrukturą zajmiemy się my.
Zaufało nam ponad 100 000 użytkowników na całym świecie
Gotowe w kilka minut
Wypróbuj to teraz w swoim terminalu.
>_
URL do Markdown
1importrequests
2
3resp=requests.post(
4"https://open.thunderbit.com/v1/distill",
5headers={"Authorization":f"Bearer {API_KEY}"},
6json={"url":"https://example.com/article"}
7)
8
9markdown=resp.json()["data"]["markdown"]
Core API
Dwie kluczowe możliwości
Distill do czystej treści, Extract do danych strukturalnych
Distill
URL→Markdown
Usuwa reklamy, nawigację i szum — zostawia tylko treści, które mają znaczenie
Pełne renderowanie JS i wbudowane omijanie zabezpieczeń anty-bot
Przetwarzaj wsadowo do 100 adresów URL na żądanie
Extract
URL + schemat→JSON / CSV
Jeden schemat działa na wszystkich stronach — bez utrzymania dla każdej z osobna
Automatycznie przetrwa zmiany w wyglądzie strony
Przetwarzaj wsadowo do 50 adresów URL na żądanie
Zalety
Dlaczego warto używać Thunderbit
Infrastruktura do scrapingu i ekstrakcji danych, na którą zasługuje Twój agent AI
Określ, co chcesz, nie jak
Bez selektorów CSS, bez XPath, bez reguł dla każdej strony. Opisz potrzebne dane za pomocą JSON Schema — AI ustali, gdzie się znajdują i jak je pobrać.
Jeden schemat, każda strona
Ten sam schemat działa w serwisach e-commerce, ogłoszeniach sprzedaży i dowolnym URL, który podasz. Dodanie nowego źródła danych to zmiana konfiguracji, a nie sprint inżynieryjny.
Działa dalej, gdy strony się zmieniają
Tradycyjne scrapery zawodzą przy każdej przebudowie. Thunderbit odczytuje znaczenie, nie strukturę DOM — więc ekstrakcja działa dalej, nawet gdy HTML się zmienia.
Branże
Przykłady użycia
Co możesz zbudować z Thunderbit
Agenci AI z dostępem do sieci
Daj swojemu agentowi możliwość czytania i rozumienia dowolnej strony. Jedno wywołanie API zwraca uporządkowany kontekst, gotowy na kolejny krok agenta.
RAG i bazy wiedzy
Przekształć dowolny URL w czysty Markdown i podaj go bezpośrednio do swojej bazy wektorowej. Bez parsowania HTML, bez skryptów do czyszczenia treści.
Zamień dowolną stronę w API
Zdefiniuj schemat, wskaż URL i otrzymaj JSON. Zbuduj API cen produktów, API ofert pracy lub API newsów — bez pisania ani jednego scrapera.
Wzbogacanie baz danych
Utrzymuj świeżość swojej bazy danych dzięki aktualnym danym z sieci. Pobieraj profile firm, dane kontaktowe lub szczegóły ofert według harmonogramu — schemat pozostaje taki sam, nawet gdy źródła się zmieniają.
Monitorowanie konkurencji
Śledź ceny, stany magazynowe, opinie lub zmiany treści na setkach stron. Ten sam schemat, ten sam pipeline, nowe źródła dodasz w kilka sekund.
Tworzenie zbiorów danych
Twórz zbiory treningowe, benchmarki ewaluacyjne lub zestawy danych badawczych z otwartej sieci. Przetwarzaj wsadowo tysiące adresów URL do spójnie ustrukturyzowanego wyniku.
Budujemy Thunderbit na tym API
To samo API, które właśnie oglądasz, napędza rozszerzenie Chrome i aplikację webową Thunderbit — używaną przez ponad 100 000 użytkowników do استخراجania dziesiątek milionów stron każdego miesiąca.
To nie jest projekt poboczny. To infrastruktura, na którą postawiliśmy nasz własny produkt.
0M+
Strony przetwarzane miesięcznie i rosnąca liczba
0K+
Użytkownicy rozszerzenia Thunderbit
0%
Dostępność
Plan
Cennik
Zacznij za darmo, płać wraz z rozwojem
Darmowy
Lekki sposób na wypróbowanie scrapingu. Bez kosztów, bez karty, bez problemów.