AI-Powered Web Scraper API

Nessuna manutenzione. Mai.

Una chiamata API per trasformare qualsiasi pagina web in Markdown o tabelle. Alimenta il tuo agente con dati web in tempo reale, crea RAG e arricchisci database — noi gestiamo l'infrastruttura.

Scelto da oltre 100.000+ utenti in tutto il mondo

harvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logo

Operativo in pochi minuti

Provalo subito nel tuo terminale.

>_
Da URL a Markdown
1import requests
2
3resp = requests.post(
4 "https://open.thunderbit.com/v1/distill",
5 headers={"Authorization": f"Bearer {API_KEY}"},
6 json={"url": "https://example.com/article"}
7)
8
9markdown = resp.json()["data"]["markdown"]
Core API

Due funzionalità principali

Distill per contenuti puliti, Extract per dati strutturati

Distill
URLMarkdown
Rimuove annunci, navigazione e rumore — mantiene solo i contenuti che contano
Rendering JS completo e bypass anti-bot integrati
Elabora fino a 100 URL per richiesta
Extract
URL + SchemaJSON / CSV
Uno schema funziona su tutti i siti web — nessuna manutenzione per singolo sito
Resiste automaticamente ai redesign dei siti
Elabora fino a 50 URL per richiesta
Vantaggi

Perché usare Thunderbit

L'infrastruttura di scraping / estrazione dati che il tuo agente AI merita

Definisci cosa, non come
Nessun selettore CSS, nessun XPath, nessuna regola per sito. Descrivi i dati che ti servono con uno schema JSON — l'AI capisce dove si trovano e come ottenerli.
Uno schema, ogni sito web
Lo stesso schema funziona su siti di e-commerce, annunci di vendita o qualsiasi URL gli passi. Aggiungere una nuova fonte dati è una modifica di configurazione, non uno sprint di sviluppo.
Continua a funzionare quando i siti cambiano
I tradizionali scraper si rompono a ogni redesign. Thunderbit legge il significato, non la struttura DOM — quindi l'estrazione continua a funzionare anche quando l'HTML cambia sotto il cofano.
Settori

Casi d'uso

Cosa puoi creare con Thunderbit

Agenti AI con accesso al web
Dai al tuo agente la capacità di leggere e comprendere qualsiasi pagina web. Una chiamata API restituisce un contesto strutturato, pronto per il passo successivo del tuo agente.
RAG e knowledge base
Trasforma ցանկացած URL in Markdown pulito e invialo direttamente al tuo database vettoriale. Nessun parsing HTML, nessuno script di pulizia dei contenuti.
Trasforma qualsiasi sito web in una API
Definisci uno schema, indica un URL e ottieni JSON indietro. Crea una API dei prezzi dei prodotti, una API di annunci di lavoro o una API di news — senza scrivere nemmeno uno scraper.
Arricchimento del database
Mantieni aggiornato il tuo database con dati web in tempo reale. Recupera profili aziendali, informazioni di contatto o dettagli degli annunci secondo una pianificazione — lo schema resta invariato anche quando le fonti cambiano.
Monitoraggio della concorrenza
Monitora prezzi, inventario, recensioni o modifiche ai contenuti su centinaia di pagine. Stesso schema, stesso flusso, aggiungi nuove fonti in pochi secondi.
Creazione di dataset
Crea set di addestramento, benchmark di valutazione o dataset di ricerca dal web aperto. Elabora in batch migliaia di URL in output strutturati in modo coerente.

Costruiamo Thunderbit su questa API

La stessa API che stai guardando alimenta l'estensione Chrome e l'app web di Thunderbit — usata da oltre 100.000 utenti per estrarre decine di milioni di pagine ogni mese. Questo non è un progetto secondario. È l'infrastruttura su cui puntiamo il nostro stesso prodotto.

0M+
Pagine elaborate ogni mese e in crescita
0K+
Utenti dell'estensione Thunderbit
0%
Uptime
Piano

Prezzi

Inizia gratis, paga man mano che cresci

Gratis
Un modo semplice per provare lo scraping. Nessun costo, nessuna carta, nessun problema.
600 unità / una tantum
$0una tantum
 
Distill 600 pagine
Extract 30 pagine
2 richieste simultanee
Starter
Perfetto per progetti secondari e piccoli strumenti. Veloce, semplice, senza complicazioni.
60,000 unità API / anno
$16/mese
Fatturato annualmente. Tutte le unità in anticipo.
Distill 60,000 pagine
Extract 3,000 pagine
30 richieste simultanee
Supporto base
Pro1Più popolare
Progettato per volumi elevati e velocità. Thunderbit al massimo delle prestazioni.
600,000 unità API / anno
$40/mese
Fatturato annualmente. Tutte le unità in anticipo.
600K1200K2400K4800K
Distill 600,000 pagine
Extract 30,000 pagine
50 richieste simultanee
Supporto prioritario

Domande frequenti

Tutto quello che devi sapere sul prodotto e sulla fatturazione.