Una llamada a la API para convertir cualquier página web en Markdown o tablas. Alimenta a tu agente con datos web en vivo, crea RAG y enriquece bases de datos; nosotros nos encargamos de la infraestructura.
Con la confianza de más de 100,000 usuarios en todo el mundo
Listo y funcionando en minutos
Pruébalo ahora mismo en tu terminal.
>_
De URL a Markdown
1importrequests
2
3resp=requests.post(
4"https://open.thunderbit.com/v1/distill",
5headers={"Authorization":f"Bearer {API_KEY}"},
6json={"url":"https://example.com/article"}
7)
8
9markdown=resp.json()["data"]["markdown"]
Core API
Dos capacidades principales
Distill para contenido limpio, Extract para datos estructurados
Distill
URL→Markdown
Elimina anuncios, navegación y ruido; conserva solo el contenido importante
Renderizado completo de JS y evasión anti-bot integrados
Procesa hasta 100 URL por solicitud
Extract
URL + esquema→JSON / CSV
Un solo esquema funciona en todos los sitios web: sin mantenimiento por sitio
Sobrevive automáticamente a rediseños del sitio
Procesa hasta 50 URL por solicitud
Ventajas
Por qué usar Thunderbit
La infraestructura de scraping / extracción de datos que tu agente de IA merece
Define qué, no cómo
Sin selectores CSS, sin XPath, sin reglas por sitio. Describe los datos que necesitas con un JSON Schema: la IA descubre dónde están y cómo obtenerlos.
Un solo esquema, todos los sitios web
El mismo esquema funciona en sitios de comercio electrónico, listados de ventas o cualquier URL que le pongas. Añadir una nueva fuente de datos es un cambio de configuración, no un sprint de ingeniería.
Sigue funcionando cuando los sitios cambian
Los scrapers tradicionales fallan con cada rediseño. Thunderbit lee el significado, no la estructura del DOM, así que la extracción sigue funcionando aunque cambie el HTML por debajo.
Sectores
Casos de uso
Lo que puedes crear con Thunderbit
Agentes de IA con acceso web
Dale a tu agente la capacidad de leer y entender cualquier página web. Una llamada a la API devuelve contexto estructurado, listo para el siguiente paso de tu agente.
RAG y bases de conocimiento
Convierte cualquier URL en Markdown limpio y llévalo directamente a tu base de datos vectorial. Sin analizar HTML, sin scripts de limpieza de contenido.
Convierte cualquier sitio web en una API
Define un esquema, apunta a una URL y recibe JSON. Crea una API de precios de productos, una API de ofertas de empleo o una API de noticias, sin escribir un solo scraper.
Enriquecimiento de bases de datos
Mantén tu base de datos actualizada con datos web en vivo. Obtén perfiles de empresa, información de contacto o detalles de listados según un horario; el esquema permanece igual aunque cambien las fuentes.
Monitoreo de la competencia
Haz seguimiento de precios, inventario, reseñas o cambios de contenido en cientos de páginas. Mismo esquema, mismo flujo; añade nuevas fuentes en segundos.
Creación de conjuntos de datos
Crea conjuntos de entrenamiento, benchmarks de evaluación o datasets de investigación a partir de la web abierta. Procesa por lotes miles de URL con una salida estructurada de forma consistente.
Construimos Thunderbit sobre esta API
La misma API que estás viendo impulsa la extensión de Chrome y la app web de Thunderbit, utilizada por más de 100,000 usuarios para extraer decenas de millones de páginas cada mes.
Esto no es un proyecto secundario. Es la infraestructura en la que apostamos nuestro propio producto.
0M+
Páginas procesadas mensualmente y en crecimiento
0K+
Usuarios de la extensión de Thunderbit
0%
Tiempo de actividad
Plan
Precios
Empieza gratis, paga a medida que creces
Gratis
Una forma sencilla de probar la extracción. Sin coste, sin tarjeta, sin complicaciones.