Un seul appel API pour transformer n’importe quelle page web en Markdown ou en tableaux. Alimentez votre agent avec des données web en direct, construisez du RAG et enrichissez vos bases de données — nous gérons l’infrastructure.
Plébiscité par plus de 100 000 utilisateurs dans le monde
Prêt en quelques minutes
Essayez-le dès maintenant dans votre terminal.
>_
URL vers Markdown
1importrequests
2
3resp=requests.post(
4"https://open.thunderbit.com/v1/distill",
5headers={"Authorization":f"Bearer {API_KEY}"},
6json={"url":"https://example.com/article"}
7)
8
9markdown=resp.json()["data"]["markdown"]
API principale
Deux fonctionnalités principales
Distill pour le contenu propre, Extract pour les données structurées
Distill
URL→Markdown
Supprime les publicités, la navigation et le bruit — ne garde que le contenu utile
Rendu JS complet et contournement anti-bot intégrés
Traitez jusqu’à 100 URL par requête
Extract
URL + schéma→JSON / CSV
Un seul schéma fonctionne sur tous les sites — aucune maintenance par site
Résiste automatiquement aux refontes de site
Traitez jusqu’à 50 URL par requête
Avantages
Pourquoi utiliser Thunderbit
L’infrastructure d’extraction de données que votre agent IA mérite
Définissez le quoi, pas le comment
Pas de sélecteurs CSS, pas de XPath, pas de règles par site. Décrivez les données dont vous avez besoin avec un schéma JSON — l’IA détermine où elles se trouvent et comment les obtenir.
Un seul schéma, tous les sites
Le même schéma fonctionne sur les sites e-commerce, les annonces commerciales ou toute URL que vous lui soumettez. Ajouter une nouvelle source de données relève d’un changement de configuration, pas d’un chantier d’ingénierie.
Continue de fonctionner quand les sites changent
Les scrapers traditionnels échouent à chaque refonte. Thunderbit lit le sens, pas la structure du DOM — l’extraction continue donc de fonctionner même si le HTML change en arrière-plan.
Secteurs
Cas d’usage
Ce que vous pouvez créer avec Thunderbit
Agents IA avec accès au web
Donnez à votre agent la capacité de lire et comprendre n’importe quelle page web. Un appel API renvoie un contexte structuré, prêt pour l’étape suivante de votre agent.
RAG et bases de connaissances
Convertissez n’importe quelle URL en Markdown propre et alimentez directement votre base vectorielle. Pas d’analyse HTML, pas de scripts de nettoyage de contenu.
Transformez n’importe quel site web en API
Définissez un schéma, indiquez une URL, et recevez du JSON. Créez une API de prix produits, une API d’offres d’emploi ou une API de flux d’actualités — sans écrire le moindre scraper.
Enrichissement de base de données
Gardez votre base de données à jour avec des données web en direct. Récupérez des profils d’entreprise, des coordonnées ou des détails d’annonces selon un calendrier — le schéma reste identique même si les sources changent.
Veille concurrentielle
Suivez les prix, les stocks, les avis ou les changements de contenu sur des centaines de pages. Même schéma, même pipeline, ajoutez de nouvelles sources en quelques secondes.
Création de jeux de données
Créez des jeux d’entraînement, des benchmarks d’évaluation ou des ensembles de données de recherche à partir du web ouvert. Traitez par lot des milliers d’URL en sorties au format cohérent.
Nous avons construit Thunderbit sur cette API
La même API que vous consultez alimente l’extension Chrome et l’application web de Thunderbit — utilisée par plus de 100 000 utilisateurs pour extraire des dizaines de millions de pages chaque mois.
Ce n’est pas un projet annexe. C’est l’infrastructure sur laquelle nous avons misé notre propre produit.
0M+
Pages traitées chaque mois et en croissance
0K+
Utilisateurs de l’extension Thunderbit
0%
Disponibilité
Forfait
Tarifs
Commencez gratuitement, payez au fur et à mesure
Gratuit
Une façon simple d’essayer l’extraction. Sans frais, sans carte, sans tracas.