O singură apelare API pentru a transforma orice pagină web în Markdown sau tabele. Oferă-i agentului tău date web live, construiește RAG și îmbogățește baze de date — noi ne ocupăm de infrastructură.
De încredere pentru peste 100.000 de utilizatori din întreaga lume
Funcțional în câteva minute
Încearcă-l chiar acum în terminalul tău.
>_
URL către Markdown
1importrequests
2
3resp=requests.post(
4"https://open.thunderbit.com/v1/distill",
5headers={"Authorization":f"Bearer {API_KEY}"},
6json={"url":"https://example.com/article"}
7)
8
9markdown=resp.json()["data"]["markdown"]
Core API
Două capabilități de bază
Distill pentru conținut curat, Extract pentru date structurate
Distill
URL→Markdown
Elimină reclamele, navigarea și zgomotul — păstrează doar conținutul important
Randare completă JS și ocolire anti-bot integrate
Procesează în lot până la 100 de URL-uri per cerere
Extract
URL + schemă→JSON / CSV
O singură schemă funcționează pe toate site-urile — fără întreținere per site
Rezistă automat la redesignurile site-urilor
Procesează în lot până la 50 de URL-uri per cerere
Avantaje
De ce să folosești Thunderbit
Infrastructura de scraping / extragere de date pe care o merită agentul tău AI
Definește ce, nu cum
Fără selectori CSS, fără XPath, fără reguli specifice fiecărui site. Descrie datele de care ai nevoie cu un JSON Schema — AI își dă seama unde se află și cum să le obțină.
O singură schemă, orice site
Aceeași schemă funcționează pe site-uri de e-commerce, anunțuri de vânzare sau orice URL îi dai. Adăugarea unei noi surse de date este o schimbare de configurare, nu un sprint de inginerie.
Rămâne funcțional chiar și când site-urile se strică
Scraper-ele tradiționale cedează la fiecare redesign. Thunderbit citește sensul, nu structura DOM — așa că extragerea continuă să funcționeze chiar și când HTML-ul se schimbă în fundal.
Industrii
Cazuri de utilizare
Ce poți construi cu Thunderbit
Agenți AI cu acces la web
Oferă agentului tău capacitatea de a citi și înțelege orice pagină web. O singură apelare API returnează context structurat, pregătit pentru următorul pas al agentului.
RAG și baze de cunoștințe
Transformă orice URL în Markdown curat și trimite-l direct în baza ta de date vectorială. Fără parsare HTML, fără scripturi de curățare a conținutului.
Transformă orice site într-un API
Definește o schemă, indică un URL și primește JSON înapoi. Creează un API de prețuri produse, un API de anunțuri de joburi sau un API de știri — fără să scrii niciun scraper.
Îmbogățirea bazei de date
Păstrează-ți baza de date actualizată cu date web live. Extrage profiluri de companii, informații de contact sau detalii de listare după un program — schema rămâne aceeași chiar și când sursele se schimbă.
Monitorizarea concurenței
Urmărește prețurile, stocurile, recenziile sau modificările de conținut pe sute de pagini. Aceeași schemă, același flux, adaugi noi surse în câteva secunde.
Construirea seturilor de date
Construiește seturi de antrenament, benchmark-uri de evaluare sau seturi de date de cercetare din web-ul deschis. Procesează în lot mii de URL-uri într-un rezultat structurat consecvent.
Construim Thunderbit pe acest API
Același API pe care îl vezi acum alimentează extensia Chrome și aplicația web Thunderbit — folosit de peste 100.000 de utilizatori pentru a extrage zeci de milioane de pagini în fiecare lună.
Nu este un proiect secundar. Este infrastructura pe care ne-am bazat propriul produs.
0M+
Pagini procesate lunar și în creștere
0K+
Utilizatori ai extensiei Thunderbit
0%
Timp de funcționare
Plan
Prețuri
Începe gratuit, plătești pe măsură ce crești
Gratuit
O modalitate simplă de a încerca extragerea. Fără costuri, fără card, fără bătăi de cap.