AI-Powered Web Scraper API

Cero mantenimiento. Siempre.

Una sola llamada a la API para convertir cualquier página web en Markdown o tablas. Aliménta tu agente con datos web en vivo, crea RAG y enriquece bases de datos — nosotros nos encargamos de la infraestructura.

Con la confianza de más de 100,000 usuarios en todo el mundo

harvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logo

En marcha en minutos

Pruébalo ahora mismo en tu terminal.

>_
URL a Markdown
1import requests
2
3resp = requests.post(
4 "https://open.thunderbit.com/v1/distill",
5 headers={"Authorization": f"Bearer {API_KEY}"},
6 json={"url": "https://example.com/article"}
7)
8
9markdown = resp.json()["data"]["markdown"]
API principal

Dos capacidades principales

Distill para contenido limpio, Extract para datos estructurados

Distill
URLMarkdown
Elimina anuncios, navegación y ruido — conserva solo el contenido que importa
Renderizado completo de JS y evasión anti-bot integrados
Procesa hasta 100 URLs por solicitud
Extract
URL + esquemaJSON / CSV
Un solo esquema funciona en todos los sitios web — sin mantenimiento por sitio
Sobrevive automáticamente a rediseños del sitio
Procesa hasta 50 URLs por solicitud
Ventajas

Por qué usar Thunderbit

La infraestructura de extracción de datos que tu agente de IA merece

Define qué, no cómo
Sin selectores CSS, sin XPath, sin reglas por sitio. Describe los datos que necesitas con un esquema JSON — la IA determina dónde están y cómo obtenerlos.
Un esquema, todos los sitios web
El mismo esquema funciona en sitios de comercio electrónico, listados de ventas o cualquier URL que le pongas. Añadir una nueva fuente de datos es un cambio de configuración, no una iniciativa de ingeniería.
Sigue funcionando cuando los sitios cambian
Los scrapers tradicionales fallan con cada rediseño. Thunderbit lee el significado, no la estructura del DOM — así que la extracción sigue funcionando incluso cuando el HTML cambia por debajo.
Sectores

Casos de uso

Lo que puedes construir con Thunderbit

Agentes de IA con acceso web
Dale a tu agente la capacidad de leer y entender cualquier página web. Una llamada a la API devuelve contexto estructurado, listo para el siguiente paso de tu agente.
RAG y bases de conocimiento
Convierte cualquier URL en Markdown limpio y envíalo directamente a tu base de datos vectorial. Sin análisis de HTML, sin scripts de limpieza de contenido.
Convierte cualquier sitio web en una API
Define un esquema, apunta a una URL y recibe JSON. Crea una API de precios de productos, una API de ofertas de empleo o una API de noticias — sin escribir ni un solo scraper.
Enriquecimiento de bases de datos
Mantén tu base de datos actualizada con datos web en vivo. Obtén perfiles de empresas, información de contacto o detalles de listados según un programa — el esquema se mantiene igual aunque cambien las fuentes.
Monitoreo de la competencia
Seguimiento de precios, inventario, reseñas o cambios de contenido en cientos de páginas. Mismo esquema, mismo flujo; añade nuevas fuentes en segundos.
Creación de conjuntos de datos
Crea conjuntos de entrenamiento, benchmarks de evaluación o datasets de investigación a partir de la web abierta. Procesa por lotes miles de URLs en una salida estructurada de forma consistente.

Construimos Thunderbit sobre esta API

La misma API que estás viendo impulsa la extensión de Chrome y la app web de Thunderbit — utilizada por más de 100,000 usuarios para extraer decenas de millones de páginas cada mes. Esto no es un proyecto secundario. Es la infraestructura en la que apostamos nuestro propio producto.

0M+
Páginas procesadas mensualmente y en crecimiento
0K+
Usuarios de la extensión Thunderbit
0%
Tiempo de actividad
Plan

Precios

Empieza gratis, paga a medida que creces

Gratis
Una forma sencilla de probar la extracción. Sin coste, sin tarjeta, sin complicaciones.
600 unidades / único
$0único
 
Distill 600 páginas
Extract 30 páginas
2 solicitudes concurrentes
Inicial
Ideal para proyectos paralelos y herramientas pequeñas. Rápido, simple, sin excesos.
60,000 unidades de API / año
$16/mes
Facturado anualmente. Todas las unidades por adelantado.
Distill 60,000 páginas
Extract 3,000 páginas
30 solicitudes concurrentes
Soporte básico
Pro1Más popular
Creado para alto volumen y velocidad. Thunderbit a máxima potencia.
600,000 unidades de API / año
$40/mes
Facturado anualmente. Todas las unidades por adelantado.
600K1200K2400K4800K
Distill 600,000 páginas
Extract 30,000 páginas
50 solicitudes concurrentes
Soporte prioritario

Preguntas frecuentes

Todo lo que necesitas saber sobre el producto y la facturación.