AI-Powered Web Scraper API

Zero manutenzione. Sempre.

Una sola chiamata API per trasformare qualsiasi pagina web in Markdown o tabelle. Alimenta il tuo agente con dati web in tempo reale, crea RAG e arricchisci database — noi gestiamo l'infrastruttura.

Scelto da oltre 100.000 utenti in tutto il mondo

harvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logo

Operativo in pochi minuti

Provalo subito nel tuo terminale.

>_
Da URL a Markdown
1import requests
2
3resp = requests.post(
4 "https://open.thunderbit.com/v1/distill",
5 headers={"Authorization": f"Bearer {API_KEY}"},
6 json={"url": "https://example.com/article"}
7)
8
9markdown = resp.json()["data"]["markdown"]
Core API

Due funzionalità principali

Distill per contenuti puliti, Extract per dati strutturati

Distill
URLMarkdown
Rimuove annunci, navigazione e rumore — mantiene solo i contenuti importanti
Rendering JS completo e bypass anti-bot integrati
Elabora fino a 100 URL per richiesta
Extract
URL + SchemaJSON / CSV
Un solo schema funziona su tutti i siti web — nessuna manutenzione per singolo sito
Resiste automaticamente ai redesign dei siti
Elabora fino a 50 URL per richiesta
Vantaggi

Perché usare Thunderbit

L'infrastruttura di scraping / estrazione dati che il tuo agente AI merita

Definisci cosa, non come
Nessun selettore CSS, nessun XPath, nessuna regola per sito. Descrivi i dati di cui hai bisogno con uno JSON Schema — l'AI capisce dove si trovano e come recuperarli.
Uno schema, tutti i siti web
Lo stesso schema funziona su siti di e-commerce, annunci di vendita o qualsiasi URL gli passi. Aggiungere una nuova fonte dati è una modifica di configurazione, non uno sprint di sviluppo.
Continua a funzionare quando i siti cambiano
Gli scraper tradizionali smettono di funzionare a ogni redesign. Thunderbit legge il significato, non la struttura del DOM — quindi l'estrazione continua a funzionare anche quando l'HTML cambia sotto.
Settori

Casi d'uso

Cosa puoi creare con Thunderbit

Agenti AI con accesso al web
Dai al tuo agente la capacità di leggere e comprendere ნებისმიერი pagina web. Una chiamata API restituisce un contesto strutturato, pronto per il passo successivo del tuo agente.
RAG e basi di conoscenza
Trasforma qualsiasi URL in Markdown pulito e invialo direttamente al tuo database vettoriale. Niente parsing HTML, niente script di pulizia dei contenuti.
Trasforma qualsiasi sito web in un'API
Definisci uno schema, indica un URL e ricevi JSON in risposta. Crea un'API per i prezzi dei prodotti, un'API per le offerte di lavoro o un'API per i feed di notizie — senza scrivere neppure uno scraper.
Arricchimento database
Mantieni il tuo database aggiornato con dati web in tempo reale. Recupera profili aziendali, informazioni di contatto o dettagli degli annunci secondo una pianificazione — lo schema resta lo stesso anche quando le fonti cambiano.
Monitoraggio della concorrenza
Monitora prezzi, inventario, recensioni o modifiche ai contenuti su centinaia di pagine. Stesso schema, stesso flusso, aggiungi nuove fonti in pochi secondi.
Creazione di dataset
Crea set di addestramento, benchmark di valutazione o dataset di ricerca dal web aperto. Elabora in batch migliaia di URL in output strutturati in modo coerente.

Costruiamo Thunderbit su questa API

La stessa API che stai consultando alimenta l'estensione Chrome e l'app web di Thunderbit — usata da oltre 100.000 utenti per estrarre decine di milioni di pagine ogni mese. Non è un progetto secondario. È l'infrastruttura su cui puntiamo il nostro stesso prodotto.

0M+
Pagine elaborate ogni mese e in crescita
0K+
Utenti dell'estensione Thunderbit
0%
Disponibilità
Piano

Prezzi

Inizia gratis, paga man mano che cresci

Gratis
Un modo semplice per provare lo scraping. Nessun costo, nessuna carta, nessuna complicazione.
600 unità / una tantum
$0una tantum
 
Distilla 600 pagine
Estrai 30 pagine
2 richieste simultanee
Starter
Ottimo per progetti paralleli e piccoli strumenti. Veloce, semplice, senza eccessi.
60,000 unità API / anno
$16/mese
Fatturato annualmente. Tutte le unità in anticipo.
Distilla 60,000 pagine
Estrai 3,000 pagine
30 richieste simultanee
Supporto base
Pro1Più popolare
Progettato per grandi volumi e alta velocità. Thunderbit al massimo delle prestazioni.
600,000 unità API / anno
$40/mese
Fatturato annualmente. Tutte le unità in anticipo.
600K1200K2400K4800K
Distilla 600,000 pagine
Estrai 30,000 pagine
50 richieste simultanee
Supporto prioritario

Domande frequenti

Tutto ciò che devi sapere sul prodotto e sulla fatturazione.