La semana pasada, uno de nuestros usuarios me contó que se había pasado toda una tarde copiando listados de plomeros de SuperPages a una hoja de cálculo: 47 filas en tres horas. Le dolían las muñecas, sus datos tenían errores tipográficos y, aun así, seguía sin tener emails. La historia me pegó de cerca porque yo he estado ahí, y precisamente ese es el tipo de problema que construimos para resolver.
SuperPages es uno de los directorios locales de negocios más veteranos de Estados Unidos, operado por Thryv, con amplia cobertura en grandes ciudades y categorías: plomeros, dentistas, abogados, técnicos HVAC, lo que se te ocurra. La documentación técnica antigua lo describía como una base de datos nacional tipo yellow pages con más de 11 millones de listados, y hoy el sitio sigue mostrando categorías locales muy densas. El reto no es encontrar listados. Es convertirlos en una lista de leads limpia y enriquecida sin volverte loco (ni perder la tarde).
Según el informe Sales Trends 2024 de HubSpot, los representantes de ventas solo dedican unas 2 horas al día a vender de verdad; el resto se va en tareas como la captura de datos y la investigación. Y el 81% de los profesionales de ventas dice que la IA podría ayudarles a pasar menos tiempo en trabajo manual. Esta guía cubre tres formas de extraer leads de SuperPages —desde IA sin código hasta Python— para que elijas el método que encaje con tu nivel y vuelvas a lo que realmente mueve la aguja.
Qué es SuperPages (y por qué a los equipos de ventas les encanta para generar leads)
SuperPages es un directorio de negocios online centrado en EE. UU. donde se listan empresas locales con datos de contacto, categorías, valoraciones y más. Piensa en él como la evolución digital de la vieja guía telefónica de yellow pages, pero ahora con búsqueda por categoría y ubicación, y con más información por ficha.

Esto es lo que puede incluir un listado típico de SuperPages:
- Nombre del negocio
- Número de teléfono
- Dirección
- URL del sitio web (cuando está disponible)
- Categoría (por ejemplo, Plumbing, Family Law, HVAC)
- Valoraciones y reseñas
- Horario de atención (normalmente en la página de detalle)
- Descripción (página de detalle)
La página principal de SuperPages destaca categorías populares como Home Services, Plumbers, Electricians, Dentists, Legal Services, Auto Repair, Restaurants y Pet Services, que casualmente son los mismos verticales a los que apuntan equipos de ventas, agencias y proveedores de servicios locales para su prospección.
En resumen, SuperPages es una mina de oro para cualquiera que busque prospectos locales en EE. UU. Los datos están estructurados, la cobertura es amplia y las categorías encajan muy bien con campañas reales de outbound.
Por qué extraer leads de SuperPages (casos de uso principales)
Navegar SuperPages manualmente y copiar datos a una hoja de cálculo es un agujero negro de productividad. La extracción automatiza ese proceso y te entrega una lista estructurada y segmentada en minutos, no en horas. Y como tú controlas la búsqueda (categoría + ciudad + palabra clave), el resultado suele ser más relevante que una lista genérica comprada.
Estos son los usos más comunes que veo entre nuestros usuarios:
| Caso de uso | Quién se beneficia | Ejemplo |
|---|---|---|
| Generación de leads locales | Equipos de ventas, agencias | Crear una lista de plomeros en Dallas para prospección en frío |
| Investigación de la competencia | Operaciones, marketing | Comparar valoraciones y servicios entre competidores en un mercado |
| Mapeo de mercado | Desarrollo de negocio | Identificar todos los dentistas de un código postal para lanzar un nuevo producto |
| Búsqueda de proveedores | Compras, operaciones | Encontrar proveedores en una región con teléfono y sitio web |
| Prospección para SEO local | Agencias | Encontrar negocios sin sitio web o con datos de ficha débiles |
| Planificación territorial | Ventas de campo | Agrupar contratistas por ciudad, código postal o zona de servicio |
El mercado estadounidense de generación de leads B2B se estimó en USD 8.5 mil millones en 2024 y se proyecta que llegue a USD 18.2 mil millones para 2034, así que la demanda de este tipo de datos no va a frenarse. Una lista recién extraída, específica por categoría y ubicación, puede ser más precisa que una lista comprada genérica, aunque aun así conviene verificarla y eliminar duplicados antes de hacer outreach (más sobre eso luego).
Cómo se ve el resultado final: ejemplo de datos extraídos de SuperPages
Antes de ver el cómo, quiero enseñarte qué es lo que realmente vas a obtener. Esta es la parte que la mayoría de las guías se salta, pero si vas a invertir tiempo, conviene saber cuál es el retorno.
Aquí tienes una tabla de ejemplo del resultado (datos ficticios, formato realista):
| Nombre del negocio | Teléfono | Dirección | Sitio web | Categoría | Valoración | Horario | Email (enriquecido) |
|---|---|---|---|---|---|---|---|
| Sunset Pipe & Drain Co. | +1 213-555-0148 | 1842 W 7th St, Los Angeles, CA 90057 | sunsetpipe.example | Plumbing | 4.6 | Lun-Vie 7:00-18:00 | service@sunsetpipe.example |
| Arroyo HVAC Pros | +1 626-555-0182 | 72 N Fair Oaks Ave, Pasadena, CA 91103 | arroyohvac.example | HVAC | 4.8 | Lun-Sáb 8:00-19:00 | hello@arroyohvac.example |
| Wilshire Family Dental | +1 323-555-0119 | 4100 Wilshire Blvd, Los Angeles, CA 90010 | wilshiredental.example | Dentists | 4.4 | Lun-Jue 9:00-17:00 | appointments@wilshiredental.example |
| Pacific Legal Aid Group | +1 310-555-0173 | 11845 W Olympic Blvd, Los Angeles, CA 90064 | Legal Services | 4.2 | Lun-Vie 8:30-17:30 | intake@pacificlegal.example | |
| Valley Auto Repair Center | +1 818-555-0198 | 14422 Ventura Blvd, Sherman Oaks, CA 91423 | valleyautorepair.example | Auto Repair | 4.7 | Lun-Sáb 8:00-18:00 | info@valleyautorepair.example |
| Echo Park Pet Grooming | +1 213-555-0166 | 1511 Sunset Blvd, Los Angeles, CA 90026 | echoparkpets.example | Pet Grooming | 4.9 | Mar-Dom 9:00-17:00 | booking@echoparkpets.example |
Algunas cosas a tener en cuenta:
- Desde la página de resultados: nombre del negocio, teléfono, dirección parcial, categoría, valoración, URL del listado.
- Desde la página de detalle del negocio (subpágina): dirección completa, horario, descripción, reseñas, y a veces sitio web.
- Desde el enriquecimiento: email (a menudo solo aparece en el sitio del negocio o mediante herramientas de enriquecimiento).
- Desde la limpieza: teléfono con formato E.164, estado/Código postal normalizados, claves para deduplicar, URL de origen y fecha de extracción.
Este es el tipo de salida que puedes llevar directamente a un CRM, a Google Sheets o a una base de Airtable y empezar a trabajar de inmediato.
3 formas de extraer leads de SuperPages: comparación rápida

No todo el mundo tiene el mismo nivel técnico ni la misma paciencia. Por eso te dejo los tres métodos, uno al lado del otro, para que elijas el que mejor te encaje:
| Criterio | Thunderbit (IA sin código) | Extractor visual (por ejemplo, Octoparse) | Python (Requests + BS4) |
|---|---|---|---|
| Tiempo de configuración | ~2 min (instalar extensión) | ~15 min (crear flujo) | ~30 min (instalar librerías, escribir código) |
| Requiere programar | No | No | Sí (Python) |
| Manejo de paginación | Integrado (clic o scroll) | Requiere configuración | Código manual |
| Enriquecimiento de subpáginas | Extracción de subpáginas con 1 clic | Hace falta otro flujo o bucle | Script aparte |
| Antibloqueo | Cloud Scraping lo gestiona | Depende del plan / proxy add-on | Lo haces tú (proxies, headers, límites) |
| Opciones de exportación | Excel, Google Sheets, Airtable, Notion, CSV, JSON | CSV, Excel, base de datos | Lo que programes |
| Ideal para | Equipos de ventas, agencias, no técnicos | Usuarios semitécnicos | Desarrolladores que quieren control total |
Mi recomendación: si quieres empezar a extraer en los próximos 2 minutos, ve al Método 1. Si prefieres flujos visuales y no te molesta configurar algunas cosas, prueba el Método 2. Si quieres control total y sabes Python, salta al Método 3.
Método 1: extraer leads de SuperPages con Thunderbit (IA, sin código)
Este es el camino más rápido de "tengo una búsqueda en SuperPages" a "tengo una lista de leads". Sin programar, sin constructores de flujos, sin configurar proxies. Soy parcial — construimos Thunderbit — pero te explicaré exactamente qué pasa para que lo juzgues por ti mismo.
Dificultad: Principiante
Tiempo necesario: ~5 minutos para una extracción completa por categoría/ciudad
Lo que necesitas: navegador Chrome, extensión Chrome de Thunderbit (el plan gratis funciona)
Paso 1: instala Thunderbit y abre SuperPages
Ve a la e instala la extensión. Tarda cerca de un minuto. Una vez instalada, abre una página de resultados de búsqueda en SuperPages; por ejemplo, busca "Plumbers in Los Angeles, CA" en superpages.com.
Deberías ver el ícono de Thunderbit en la barra del navegador y un panel lateral listo para usar.
Paso 2: haz clic en "AI Suggest Fields" para detectar automáticamente las columnas
Abre la barra lateral de Thunderbit y haz clic en "AI Suggest Fields." La IA de Thunderbit lee la página y recomienda automáticamente columnas según lo que encuentra: normalmente nombre del negocio, teléfono, dirección, sitio web, categoría, valoración y URL del listado.
Antes de extraer, puedes ajustar, añadir o quitar columnas. ¿Quieres agregar una columna personalizada como "¿Tiene sitio web?" o "¿Área de servicio?" Solo escribe una descripción en lenguaje natural usando el Field AI Prompt. Por ejemplo, puedes indicar que una columna "formatee el teléfono como +1XXXXXXXXXX" o que "clasifique si es residencial o comercial".
Ahora deberías ver una vista previa de tabla con tus columnas configuradas en el panel de Thunderbit.
Paso 3: haz clic en "Scrape" y mira cómo se completa la información
Pulsa el botón azul "Scrape". Thunderbit extrae todos los listados de la página actual y rellena tu tabla fila por fila. En una página típica de resultados de SuperPages, esto tarda unos 30 a 45 segundos.
Thunderbit gestiona automáticamente la paginación: detecta botones de "Next" o scroll infinito y sigue hasta que se acaban las páginas o alcanzas tu límite. Si estás extrayendo un volumen grande de resultados (por ejemplo, todos los plomeros de un área metropolitana), cambia al modo Cloud Scraping, que puede procesar hasta 50 páginas a la vez sin ocupar tu navegador.
Paso 4: usa la extracción de subpáginas para enriquecer cada ficha

La página de resultados te da lo básico, pero el verdadero valor —horario, descripciones completas, reseñas y, a veces, email— vive en la página de detalle de cada negocio. Haz clic en "Scrape Subpages" y Thunderbit visitará la página de detalle de cada listado, extrayendo columnas enriquecidas como horario, descripción, URL del sitio web y cualquier dato de contacto visible.
Esto se hace con un clic. Sin flujos separados, sin configuración. Los datos enriquecidos se añaden directamente a tu tabla existente.
Paso 5: exporta tus leads a Excel, Google Sheets, Airtable o Notion
Cuando estés conforme con los datos, haz clic en Export. Thunderbit te permite enviar tus leads directamente a:
- Google Sheets (ideal para preparar CRM y compartir)
- Airtable (tablas de pipeline ligeras)
- Notion (bases de datos para investigación)
- Excel / CSV (importación a CRM)
- JSON (para pasar a desarrollo)

Todas las opciones de exportación son gratuitas. Si vas a llevar leads a HubSpot o Salesforce, exportar a CSV o Google Sheets suele ser la ruta más rápida.
Consejo: extrae por categoría + ciudad, no con búsquedas demasiado amplias a nivel estatal. "Emergency plumbers Dallas TX" te dará una lista mucho más precisa y accionable que "plumbers Texas." Añade una columna "Source URL" y otra "Scraped At" para trazabilidad.
Método 2: extraer SuperPages con una herramienta visual de scraping (ejemplo: Octoparse)
Las herramientas visuales como Octoparse están en un punto intermedio: no requieren código, pero sí más configuración que Thunderbit. Octoparse incluso tiene una plantilla preconstruida para SuperPages para casos más sencillos.
Dificultad: Intermedia
Tiempo necesario: ~20–30 minutos entre configuración y extracción
Lo que necesitas: cuenta de Octoparse (hay plan gratis, con limitaciones)
Paso 1: crea una nueva tarea y carga la URL de SuperPages
Abre Octoparse, haz clic en "New Task" y pega la URL de búsqueda de SuperPages (por ejemplo, "https://www.superpages.com/los-angeles-ca/plumbers"). El navegador integrado carga la página.
Paso 2: detecta automáticamente o selecciona manualmente los campos
Haz clic en "Auto-detect" — Octoparse analiza la página y resalta los campos de datos que cree relevantes. Revisa el panel Data Preview. Por experiencia, la detección automática suele captar la mayoría de los campos, pero puede incluir extras (como etiquetas de anuncios o texto de navegación) o pasar por alto algunos. Es probable que tengas que añadir o quitar manualmente algunos campos.
Según la documentación de ayuda de Octoparse, la detección automática crea un flujo básico con paginación y pasos de extracción, pero el usuario puede necesitar añadir los datos que faltan manualmente.
Paso 3: construye el flujo y configura la paginación
Haz clic en "Create workflow." Octoparse genera una secuencia de acciones paso a paso. Revisa el paso de paginación: asegúrate de que hace clic en "Next" o carga correctamente más resultados. Si quieres datos de la página de detalle de cada negocio (horario, email, descripción), tendrás que añadir un bucle de página de detalle o una acción de subpágina dentro del flujo. Eso añade complejidad en comparación con el enfoque de subpáginas con un clic de Thunderbit.
Paso 4: ejecuta la tarea y exporta los datos
Ejecuta la tarea localmente (para trabajos pequeños) o en la nube de Octoparse (para trabajos programados o más grandes; la nube es una función de pago). Cuando termine, exporta a CSV, Excel o JSON.
Limitaciones que conviene conocer: el plan gratis de Octoparse incluye 10 tareas, hasta 50,000 filas al mes y solo extracción local. Las ejecuciones en la nube, rotación de IP, resolución de CAPTCHA y algunas integraciones de exportación requieren un plan de pago (desde unos $69/mes con facturación anual).
Método 3: extraer SuperPages con Python (Requests + BeautifulSoup)
Este es el camino para desarrolladores. Control total, responsabilidad total. Si te sientes cómodo escribiendo y manteniendo scripts de Python, tendrás la máxima flexibilidad, pero también más dolores de cabeza.
Dificultad: Avanzada
Tiempo necesario: ~30–60 minutos (configuración + código + depuración)
Lo que necesitas: Python 3.x, pip, requests, beautifulsoup4, lxml, un editor de código
Paso 1: prepara tu entorno de Python
1python -m venv .venv
2source .venv/bin/activate
3pip install requests beautifulsoup4 lxml pandas
Paso 2: inspecciona la estructura HTML de SuperPages
Abre las herramientas de desarrollador (F12) en una página de resultados de SuperPages. Identifica selectores CSS para nombre del negocio, dirección, teléfono, sitio web y enlace a la página de detalle. Ten en cuenta que la estructura HTML puede cambiar sin aviso, lo que significa que tus selectores pueden romperse en cualquier momento.
Paso 3: escribe el scraper de listados y maneja la paginación
Aquí tienes un ejemplo simplificado. Advertencia importante: en mis pruebas, una solicitud directa a SuperPages devolvió una página de bloqueo de Cloudflare con el mensaje "Attention Required". Un script ingenuo con Requests puede fallar a escala, así que quizá necesites contexto de sesión del navegador, limitación de velocidad, reintentos o alternativas autorizadas.
1import csv, time
2from urllib.parse import urljoin
3import requests
4from bs4 import BeautifulSoup
5BASE_URL = "https://www.superpages.com"
6HEADERS = {
7 "User-Agent": (
8 "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) "
9 "AppleWebKit/537.36 (KHTML, like Gecko) "
10 "Chrome/125.0 Safari/537.36"
11 )
12}
13def fetch(url):
14 resp = requests.get(url, headers=HEADERS, timeout=20)
15 resp.raise_for_status()
16 if "Attention Required" in resp.text or "Cloudflare" in resp.text:
17 raise RuntimeError("Bloqueado. Reduce la velocidad o cambia a scraping con navegador/nube.")
18 return BeautifulSoup(resp.text, "lxml")
19def parse_listing(card):
20 name_el = card.select_one(".business-name, a.business-name, h2 a, h3 a")
21 phone_el = card.select_one(".phones, .phone, [class*=phone]")
22 address_el = card.select_one(".street-address, .adr, [class*=address]")
23 website_el = card.select_one("a.track-visit-website, a[href*='http']")
24 rating_el = card.select_one(".rating, [class*=rating]")
25 detail_url = urljoin(BASE_URL, name_el.get("href")) if name_el and name_el.get("href") else ""
26 return {
27 "business_name": name_el.get_text(" ", strip=True) if name_el else "",
28 "phone": phone_el.get_text(" ", strip=True) if phone_el else "",
29 "address": address_el.get_text(" ", strip=True) if address_el else "",
30 "website": website_el.get("href", "") if website_el else "",
31 "rating": rating_el.get_text(" ", strip=True) if rating_el else "",
32 "detail_url": detail_url,
33 }
34def scrape_search(search_url, pages=3):
35 all_rows = []
36 for page in range(1, pages + 1):
37 page_url = f"\{search_url\}?page=\{page\}"
38 soup = fetch(page_url)
39 cards = soup.select(".result, .organic, [class*=result]")
40 if not cards:
41 break
42 for card in cards:
43 all_rows.append(parse_listing(card))
44 time.sleep(5)
45 return all_rows
46if __name__ == "__main__":
47 rows = scrape_search("https://www.superpages.com/los-angeles-ca/plumbers", pages=2)
48 with open("superpages_leads.csv", "w", newline="", encoding="utf-8") as f:
49 writer = csv.DictWriter(f, fieldnames=sorted({k for row in rows for k in row}))
50 writer.writeheader()
51 writer.writerows(rows)
Paso 4: extrae subpáginas para enriquecer los datos
Escribe una función aparte para visitar la URL de cada página de detalle y extraer horario, email, descripción y reseñas. Eso implica gestionar límites de velocidad, errores y posiblemente proxies — todo por tu cuenta.
Paso 5: guarda los datos en CSV o JSON
Usa los módulos csv o json de Python. También tendrás que escribir tu propia lógica de deduplicación, limpieza y exportación.
Errores comunes:
- SuperPages puede bloquear solicitudes con Cloudflare u otros sistemas anti-bot (confirmado en mis pruebas).
- Los selectores de arriba son amplios a propósito, porque el marcado de SuperPages puede cambiar.
- No asumas que las páginas de resultados contienen emails. Casi nunca los contienen.
- Un scraper de producción necesita revisión de robots/TOS, limitación de velocidad, reintentos/backoff, logging estructurado y captura de errores.
Si quieres profundizar en scraping con Python, consulta nuestra guía sobre web scraping con Python o el tutorial de BeautifulSoup.
De datos crudos a leads reales: el flujo completo (extraer → limpiar → verificar → CRM)
Aquí es donde la mayoría de las guías de scraping se detienen, y donde empieza el valor real. Extraer te da materia prima. Convertirla en una lista de leads útil requiere algunos pasos más.

El flujo se ve así:
Búsqueda en SuperPages → Extraer listados → Extraer páginas de detalle/sitios web → Exportar a Google Sheets o CSV → Limpiar teléfonos, direcciones y categorías → Eliminar duplicados → Verificar emails/teléfonos → Enriquecer contactos faltantes → Importar al CRM → Outreach conforme a normativa
Deduplicación: eliminar listados repetidos
SuperPages suele mostrar el mismo negocio en varias categorías. Si extraes "plumbers" y "drain cleaning" en la misma ciudad, tendrás cruces.
- Clave principal para deduplicar: número de teléfono normalizado + dirección normalizada.
- Secundaria: dominio + ciudad.
- Recurso final: nombre del negocio + código postal (revisar manualmente en el caso de franquicias).
En Google Sheets, usa =UNIQUE(A:H) para coincidencias exactas de fila o crea una columna auxiliar como =LOWER(REGEXREPLACE(B2&C2,"[^a-zA-Z0-9]","")) para detectar casi duplicados. En Excel, usa Datos > Quitar duplicados.
Limpieza de datos: estandarizar teléfonos, direcciones y formato
- Formatea los teléfonos como E.164 (para EE. UU.: +1 seguido de 10 dígitos). Este es el formato que esperan la mayoría de los CRM y marcadores. Puedes usar un Field AI Prompt en Thunderbit para autoformatear durante la extracción.
- Normaliza direcciones: amplía abreviaturas, completa códigos postales faltantes, divide en columnas de calle/ciudad/estado/código postal si hace falta.
- Elimina restos HTML, espacios en blanco extra y parámetros de seguimiento de las URLs.
- Añade columnas
source_directory,source_urlyscraped_atpara trazabilidad.
Verificación de emails y teléfonos antes del outreach
No envíes correos fríos masivos a todas las direcciones que extraigas. La verificación protege la reputación de tu remitente y mantiene bajos los rebotes.
- Verificación de emails: ZeroBounce (desde unos $39 por 2,000 créditos, más 100 créditos mensuales gratis) o Bouncer ($8 por 1,000 créditos, los créditos no caducan) son opciones sólidas.
- Validación de teléfonos: Twilio Lookup ofrece formato y validación gratis; el caller ID cuesta $0.01 por solicitud.
- El Email Extractor y el Phone Number Extractor gratis de Thunderbit pueden sacar datos de contacto que no aparezcan en las páginas de listado.
Enriquecimiento: encontrar contactos cuando SuperPages no muestra emails
Muchos listados de SuperPages no muestran ningún email, especialmente en la página de resultados. Esto es lo que puedes hacer:
- Extrae las páginas de Contacto, About o footer del sitio web del negocio. La extracción de subpáginas o el Email Extractor de Thunderbit pueden hacerlo en lote.
- Usa herramientas de enriquecimiento como Apollo, BetterContact, Icypeas o Prospeo. Advertencia: para pequeños negocios locales (una plomería de dos personas, un dentista independiente), las grandes bases de datos B2B suelen quedarse vacías. La extracción primero desde el sitio web suele funcionar mejor en estos casos.
- Combina varios directorios. Extrae SuperPages, Yellow Pages y Google Maps para la misma categoría/ciudad, y luego fusiona y deduplica. El solapamiento te da registros más completos.
Si alguna vez intentaste pasar una lista de pymes locales por Apollo y casi todo salió en blanco, no eres el único. Por eso el enfoque centrado primero en el sitio web importa para este público.
Importación al CRM: llevar leads a HubSpot, Salesforce o Google Sheets
- HubSpot: ve a Data Management > Data Integration > Import data > Quick import (contacts only). Sube tu
.csvo.xlsx. La guía de importación de HubSpot explica cómo asignar campos. - Salesforce: usa Data Import Wizard. Prepara un CSV, asigna los campos de origen a los campos de Salesforce y ejecuta la importación.
- Google Sheets / Airtable / Notion: Thunderbit exporta directamente a los tres, sin necesidad de pasar por CSV.
Consejo: asigna tus columnas extraídas a los campos del CRM antes de importar. Unos minutos de mapeo te ahorran horas de limpieza manual después.
SuperPages vs. otros directorios de negocios locales: dónde encontrar los mejores leads
SuperPages es un punto de partida sólido, pero no es el único directorio que merece la pena extraer. Así se compara:
| Directorio | Volumen de leads | Campos disponibles | Actualización de datos | Dificultad anti-scraping | Ideal para |
|---|---|---|---|---|---|
| SuperPages | Alto (enfocado en EE. UU.) | Nombre, teléfono, dirección, sitio web, categorías, valoraciones | Media | Media | Servicios para el hogar, contratistas, pymes |
| Yellow Pages | Alto (enfocado en EE. UU.) | Similar a SuperPages | Media | Media | Outreach general a negocios locales |
| Google Maps | Muy alto (global) | Nombre, teléfono, dirección, sitio web, reseñas, horario, fotos | Alta (actualizado por el propietario) | Alta (anti-bot agresivo) | Datos locales más recientes |
| Yelp | Alto (enfocado en EE. UU.) | Nombre, teléfono, dirección, reseñas, rango de precios | Alta | Alta | Restaurantes, retail, negocios de servicios |
| Manta | Medio | Nombre, teléfono, dirección, estimación de ingresos, número de empleados | Media | Baja | Prospección B2B (datos de ingresos/empleados) |
| BBB | Medio | Nombre, teléfono, dirección, acreditación, quejas | Media | Baja | Negocios confiables / verificados |
Fuentes: página principal de SuperPages, artículo de SuperPages en VLDB, documentación de Google Places API, documentación de Yelp Places API, página principal de Manta, guía de BBB.
Thunderbit funciona en todos ellos —incluidas plantillas instantáneas para sitios populares como Google Maps y SuperPages—, así que puedes aplicar el mismo flujo a varias fuentes y unir tus listas de leads. En mi experiencia, el mejor enfoque suele ser extraer dos o tres directorios para la misma categoría/ciudad y luego deduplicar. El solapamiento rellena huecos y te da una visión más completa.
Para más información sobre extracción en otros directorios, consulta nuestras guías sobre , y .
Consejos legales y éticos para extraer leads de SuperPages

No soy abogado, y esto no es asesoría legal, pero he pasado suficiente tiempo en este sector como para saber que ignorar el compliance es una forma rápida de meterte en problemas. Aquí va el resumen práctico.
Datos comerciales públicos vs. datos personales
Los listados de negocios —nombre de la empresa, teléfono comercial, dirección comercial, sitio web comercial— suelen considerarse datos comerciales públicos. Eso es distinto de los datos personales de consumidores bajo GDPR o CCPA. Pero que algo sea “público” no significa que “todo vale”. Revisa siempre los Términos de Servicio del sitio.
Los Términos de Uso de SuperPages (actualizados en julio de 2019) incluyen una cláusula de "Data Mining Prohibited": los usuarios no pueden usar bots, crawlers, spiders ni herramientas similares para recopilar o extraer datos sin el consentimiento previo de Thryv. El artículo explica métodos y flujos de trabajo, pero deberías revisar estos términos y pedir permiso cuando corresponda antes de extraer a gran escala.
Cumplimiento para outreach: nociones básicas de CAN-SPAM y TCPA
Si vas a usar emails extraídos para outreach en frío, la guía de la FTC sobre CAN-SPAM dice que debes:
- No usar encabezados falsos o engañosos
- No usar asuntos engañosos
- Identificar el mensaje como publicidad cuando corresponda
- Incluir una dirección postal física válida
- Ofrecer un mecanismo claro para darse de baja y respetarlo rápidamente
Si vas a usar teléfonos extraídos para llamadas en frío, revisa el National Do Not Call Registry y cumple las normas TCPA, especialmente en lo relativo a llamadas automáticas, mensajes pregrabados y SMS. La FTC anunció cambios en 2024 para reforzar la protección contra el telemarketing B2B engañoso y las llamadas fraudulentas con IA.
Lista rápida de cumplimiento
- ✅ Extrae solo datos comerciales publicados públicamente
- ✅ Revisa los Términos de Uso de SuperPages y obtén permiso cuando sea necesario
- ✅ Verifica los contactos antes del outreach
- ✅ Incluye opción de baja en los emails
- ✅ Respeta robots.txt y los límites de velocidad
- ✅ Mantén listas de supresión de DNC y email
- ⚠️ Evita extraer datos personales/de consumidores
- ⚠️ No revendas datos crudos extraídos sin revisión legal
Elige tu método y empieza a construir tu lista de leads
Extraer leads de SuperPages no consiste solo en sacar filas de una página web. El valor real viene del flujo completo: extraer, limpiar, deduplicar, verificar, enriquecer, importar y hacer outreach cumpliendo la normativa.
Aquí va el resumen rápido:
- Thunderbit es la ruta más rápida para equipos de ventas, agencias y personas no técnicas. Dos clics para extraer, un clic para enriquecer con subpáginas, exportación gratis a Google Sheets, Airtable, Notion o Excel. Pruébalo gratis.
- Octoparse es una buena herramienta visual para usuarios semitécnicos que quieren más control de configuración.
- Python les da a los desarrolladores flexibilidad total, pero también mantenimiento, dolores de cabeza con bloqueos y sin enriquecimiento integrado.
- Y recuerda: el mismo flujo aplica a Yellow Pages, Google Maps, Yelp, Manta y BBB. Extrae varias fuentes, fusiona, deduplica y tendrás la lista local de leads más completa posible.
Si quieres ver Thunderbit en acción, visita nuestro para ver tutoriales, o explora para ver qué encaja mejor con tu equipo.
Ahora ve y convierte esas páginas de directorios en pipeline — y que tus teléfonos siempre estén bien formateados y tus emails siempre verificados.
Preguntas frecuentes
¿Es legal extraer leads de SuperPages?
Extraer datos comerciales disponibles públicamente para investigación B2B es una práctica común, pero los Términos de Uso de SuperPages prohíben el data mining sin el consentimiento previo de Thryv. Revisa siempre los términos del sitio, obtiene permiso cuando haga falta y cumple con normas de outreach como CAN-SPAM y TCPA. Este artículo cubre métodos y flujos con fines educativos; es tu responsabilidad usarlos de forma conforme a la ley.
¿Qué datos puedo obtener de SuperPages?
Una extracción típica devuelve nombre del negocio, teléfono, dirección, sitio web, categoría, valoraciones, horario y descripciones. Los emails rara vez aparecen en la página de resultados; normalmente tendrás que visitar la página de detalle del negocio o el propio sitio web de la empresa (usando extracción de subpáginas o un extractor de emails) para encontrarlos.
¿Puedo extraer SuperPages sin programar?
Sí. Herramientas como Thunderbit (extensión de Chrome con IA) y Octoparse (extractor visual) te permiten extraer SuperPages sin escribir una sola línea de código. Thunderbit es la opción más rápida: instala la extensión, abre una búsqueda en SuperPages, haz clic en "AI Suggest Fields" y luego en "Scrape."
¿Cómo manejo la paginación al extraer SuperPages?
Thunderbit maneja la paginación automáticamente: detecta botones de "Next" o scroll infinito y sigue avanzando. Octoparse requiere configurar un paso de paginación en el flujo. En Python, tienes que programar manualmente el bucle de páginas (incrementando números de página y detectando la última página).
¿Cómo consigo emails de los listados de SuperPages?
La mayoría de los listados de SuperPages no muestran emails en la página de resultados. Usa la extracción de subpáginas de Thunderbit para visitar cada página de detalle, o el Email Extractor gratuito en el sitio web del negocio. Para los huecos restantes, prueba herramientas de enriquecimiento como Apollo, BetterContact o Prospeo, aunque para pequeños negocios locales, la extracción primero desde el sitio web suele funcionar mejor que las grandes bases de datos B2B.
Más información
