La scorsa settimana, uno dei nostri utenti mi ha raccontato di aver passato un intero pomeriggio a copiare elenchi di idraulici da SuperPages in un foglio di calcolo: 47 righe in tre ore. I polsi gli facevano male, i dati erano pieni di errori e, alla fine, non aveva ancora gli indirizzi email. La storia mi è rimasta impressa perché ci sono passato anch’io, ed è esattamente il tipo di problema che abbiamo creato per risolvere.
SuperPages è una delle directory locali statunitensi più longeve, gestita da Thryv, con una copertura ampia nelle principali città e in molte categorie: idraulici, dentisti, avvocati, tecnici HVAC e via dicendo. La documentazione tecnica più datata la descriveva come un database nazionale tipo Pagine Gialle con oltre 11 milioni di schede, e ancora oggi il sito mostra categorie locali molto dense. Il problema non è trovare le schede. È trasformarle in una lista di lead pulita e arricchita, senza perdere la testa (o il pomeriggio).
Secondo il report HubSpot 2024 Sales Trends, i commerciali dedicano solo circa 2 ore al giorno alla vendita vera e propria: il resto viene assorbito da attività come inserimento dati e ricerca. Inoltre, l’81% dei professionisti sales sostiene che l’AI potrebbe aiutarli a passare meno tempo sul lavoro manuale. Questa guida illustra tre modi per estrarre lead da SuperPages — dall’AI senza codice fino a Python — così puoi scegliere il metodo più adatto al tuo livello e tornare a fare ciò che conta davvero.
Cos’è SuperPages (e perché i team sales lo adorano per i lead)
SuperPages è una directory online focalizzata sugli Stati Uniti, dove le attività locali vengono elencate con contatti, categorie, valutazioni e altro ancora. Pensalo come l’evoluzione digitale della vecchia rubrica delle Pagine Gialle — con la differenza che oggi puoi cercare per categoria e località, e ogni scheda contiene più dati.

Una scheda SuperPages tipica può includere:
- Nome dell’attività
- Numero di telefono
- Indirizzo
- URL del sito web (se disponibile)
- Categoria (ad esempio: idraulica, diritto di famiglia, HVAC)
- Valutazioni e recensioni
- Orari di apertura (di solito nella pagina dettaglio)
- Descrizione (pagina dettaglio)
La homepage di SuperPages mette in evidenza categorie popolari come Home Services, Plumbers, Electricians, Dentists, Legal Services, Auto Repair, Restaurants e Pet Services — cioè proprio i settori che team commerciali, agenzie e fornitori di servizi locali puntano nelle campagne outbound.
In breve, SuperPages è una miniera d’oro per chi prospecta attività locali negli Stati Uniti. I dati sono strutturati, la copertura è ampia e le categorie si adattano perfettamente a campagne di outreach reali.
Perché estrarre lead da SuperPages (casi d’uso principali)
Navigare manualmente su SuperPages e copiare i dati in un foglio di calcolo è un buco nero di produttività. Lo scraping automatizza il processo e ti restituisce una lista strutturata e mirata in pochi minuti, non in ore. E poiché controlli tu la ricerca (categoria + città + parola chiave), il risultato è spesso più rilevante di una generica lista lead acquistata.
Ecco i casi d’uso più comuni che vedo tra i nostri utenti:
| Caso d’uso | Chi ne beneficia | Esempio |
|---|---|---|
| Generazione lead locali | Team sales, agenzie | Creare una lista di idraulici a Dallas per un’attività di cold outreach |
| Analisi della concorrenza | Operations, marketing | Confrontare valutazioni e servizi dei competitor in un mercato |
| Mappatura del mercato | Business development | Individuare tutti i dentisti in un CAP per il lancio di un nuovo prodotto |
| Ricerca fornitori | Procurement, operations | Trovare fornitori in una zona con telefono e sito web |
| Prospecting SEO locale | Agenzie | Trovare attività senza sito o con schede poco complete |
| Pianificazione territoriale | Vendite sul campo | Raggruppare i contractor per città, CAP o area di servizio |
Il mercato statunitense della lead generation B2B è stato stimato a 8,5 miliardi di dollari nel 2024 e potrebbe arrivare a 18,2 miliardi entro il 2034 — quindi la domanda di questo tipo di dati non sta rallentando. Una lista appena estratta, mirata per categoria e località, può essere più precisa di una lista generica acquistata, ma va comunque verificata e deduplicata prima dell’outreach (torneremo su questo più avanti).
Come appare il risultato finale: esempio di dati estratti da SuperPages
Prima di spiegare il “come”, voglio mostrarti cosa otterrai davvero. È la parte che molte guide saltano — ma se investi tempo, è giusto sapere che ritorno aspettarti.
Ecco una tabella di output di esempio (dati fittizi, forma realistica):
| Nome attività | Telefono | Indirizzo | Sito web | Categoria | Valutazione | Orari | Email (arricchita) |
|---|---|---|---|---|---|---|---|
| Sunset Pipe & Drain Co. | +1 213-555-0148 | 1842 W 7th St, Los Angeles, CA 90057 | sunsetpipe.example | Idraulica | 4.6 | Lun-Ven 7:00-18:00 | service@sunsetpipe.example |
| Arroyo HVAC Pros | +1 626-555-0182 | 72 N Fair Oaks Ave, Pasadena, CA 91103 | arroyohvac.example | HVAC | 4.8 | Lun-Sab 8:00-19:00 | hello@arroyohvac.example |
| Wilshire Family Dental | +1 323-555-0119 | 4100 Wilshire Blvd, Los Angeles, CA 90010 | wilshiredental.example | Dentisti | 4.4 | Lun-Gio 9:00-17:00 | appointments@wilshiredental.example |
| Pacific Legal Aid Group | +1 310-555-0173 | 11845 W Olympic Blvd, Los Angeles, CA 90064 | Servizi legali | 4.2 | Lun-Ven 8:30-17:30 | intake@pacificlegal.example | |
| Valley Auto Repair Center | +1 818-555-0198 | 14422 Ventura Blvd, Sherman Oaks, CA 91423 | valleyautorepair.example | Riparazioni auto | 4.7 | Lun-Sab 8:00-18:00 | info@valleyautorepair.example |
| Echo Park Pet Grooming | +1 213-555-0166 | 1511 Sunset Blvd, Los Angeles, CA 90026 | echoparkpets.example | Toelettatura animali | 4.9 | Mar-Dom 9:00-17:00 | booking@echoparkpets.example |
Alcuni punti da tenere a mente:
- Dalla pagina dei risultati: nome attività, telefono, indirizzo parziale, categoria, valutazione, URL della scheda.
- Dalla pagina dettaglio attività (sottopagina): indirizzo completo, orari, descrizione, recensioni, a volte sito web.
- Dall’arricchimento: email (spesso disponibile solo sul sito dell’attività o tramite strumenti di enrichment).
- Dalla pulizia: telefono formattato in E.164, stato/CAP normalizzati, chiavi di deduplica, URL sorgente e data di estrazione.
Questo è il tipo di output che puoi importare subito in un CRM, in Google Sheets o in una base Airtable e iniziare a lavorarci immediatamente.
3 modi per estrarre lead da SuperPages: confronto rapido

Non tutti hanno lo stesso livello di dimestichezza tecnica — né la stessa pazienza. Ecco quindi tre metodi affiancati, così puoi scegliere quello più adatto:
| Criterio | Thunderbit (AI senza codice) | Estrattore visuale (es. Octoparse) | Python (Requests + BS4) |
|---|---|---|---|
| Tempo di configurazione | ~2 min (installa l’estensione) | ~15 min (crea il workflow) | ~30 min (installa librerie, scrivi codice) |
| Serve programmare? | No | No | Sì (Python) |
| Gestione paginazione | Integrata (clic o scroll) | Richiede configurazione | Codice manuale |
| Arricchimento delle sottopagine | Scraping sottopagine con 1 clic | Serve workflow/loop separato | Serve script separato |
| Anti-blocco | Cloud Scraping gestisce il problema | Dipende dal piano/add-on proxy | Fai-da-te (proxy, header, rate limit) |
| Opzioni di export | Excel, Google Sheets, Airtable, Notion, CSV, JSON | CSV, Excel, database | Quello che programmi |
| Ideale per | Team sales, agenzie, non sviluppatori | Utenti semi-tecnici | Developer che vogliono controllo totale |
Il mio consiglio: se vuoi iniziare a estrarre dati tra 2 minuti, vai al Metodo 1. Se preferisci flussi visivi e non ti dispiace configurare qualcosa, prova il Metodo 2. Se vuoi il controllo totale e sai usare Python, salta al Metodo 3.
Metodo 1: estrarre lead da SuperPages con Thunderbit (AI, senza codice)
Questo è il percorso più veloce da “ho una ricerca su SuperPages” a “ho una lista lead”. Niente codice, niente builder di workflow, niente configurazione proxy. Sono di parte — abbiamo creato Thunderbit — ma ti spiegherò esattamente cosa succede così puoi valutare da solo.
Difficoltà: Principiante
Tempo richiesto: ~5 minuti per una scansione completa di categoria/città
Cosa serve: browser Chrome, estensione Chrome di Thunderbit (il piano gratuito funziona)
Passo 1: installa Thunderbit e apri SuperPages
Vai alla e installa l’estensione Thunderbit. Ci vuole circa un minuto. Una volta installata, apri una pagina dei risultati di ricerca su SuperPages — ad esempio cerca “Plumbers in Los Angeles, CA” su superpages.com.
Dovresti vedere l’icona di Thunderbit nella toolbar del browser e un pannello laterale pronto all’uso.
Passo 2: clicca su “AI Suggest Fields” per rilevare automaticamente le colonne
Apri la sidebar di Thunderbit e clicca su “AI Suggest Fields”. L’AI di Thunderbit legge la pagina e suggerisce automaticamente le colonne in base a ciò che trova — di solito nome attività, telefono, indirizzo, sito web, categoria, valutazione e URL della scheda.
Puoi modificare, aggiungere o rimuovere colonne prima di avviare lo scraping. Vuoi aggiungere una colonna personalizzata come “Ha un sito web?” o “Area di servizio?” Ti basta scrivere una descrizione in inglese semplice usando il Field AI Prompt. Per esempio, puoi chiedere a una colonna di “format phone as +1XXXXXXXXXX” oppure di “classify as residential vs. commercial”.
Ora dovresti vedere un’anteprima tabellare con le colonne configurate nel pannello Thunderbit.
Passo 3: clicca “Scrape” e guarda i dati riempirsi
Premi il pulsante blu “Scrape”. Thunderbit estrae tutte le schede della pagina corrente e riempie la tabella riga per riga. Su una tipica pagina risultati di SuperPages, questa operazione richiede circa 30–45 secondi.
Thunderbit gestisce automaticamente la paginazione: rileva i pulsanti “Next” o lo scroll infinito e continua finché non finiscono le pagine o non raggiungi il limite. Se stai estraendo un set grande (per esempio tutti gli idraulici di un’area metropolitana), passa alla modalità Cloud Scraping, che può elaborare fino a 50 pagine alla volta senza occupare il browser.
Passo 4: usa lo Scraping delle sottopagine per arricchire ogni scheda

La pagina dei risultati ti dà le basi, ma il vero valore — orari, descrizioni complete, recensioni, a volte email — si trova nella pagina dettaglio di ciascuna attività. Clicca su “Scrape Subpages” e Thunderbit visita la pagina dettaglio di ogni scheda, aggiungendo colonne arricchite come orari, descrizione, URL del sito e tutte le informazioni di contatto visibili.
È un processo con un solo clic. Nessun workflow separato, nessuna configurazione. I dati arricchiti vengono aggiunti direttamente alla tua tabella esistente.
Passo 5: esporta i lead in Excel, Google Sheets, Airtable o Notion
Quando sei soddisfatto dei dati, clicca Export. Thunderbit ti permette di inviare i lead direttamente a:
- Google Sheets (ottimo per preparare un CRM e condividere)
- Airtable (tabelle pipeline leggere)
- Notion (database di ricerca)
- Excel / CSV (importazione CRM)
- JSON (passaggio agli sviluppatori)

Tutte le opzioni di export sono gratuite. Se devi inserire i lead in HubSpot o Salesforce, esportare in CSV o Google Sheets è di solito la strada più veloce.
Consiglio utile: estrai per categoria + città, non con ricerche troppo ampie a livello di stato. “Emergency plumbers Dallas TX” ti darà una lista più precisa e utile di “plumbers Texas”. Aggiungi una colonna “Source URL” e “Scraped At” per avere tracciabilità.
Metodo 2: estrarre lead da SuperPages con uno strumento di scraping visuale (esempio Octoparse)
Gli strumenti di scraping visuale come Octoparse si collocano a metà strada: niente codice, ma più configurazione rispetto a Thunderbit. Octoparse ha persino un template SuperPages già pronto per i casi d’uso più semplici.
Difficoltà: Intermedio
Tempo richiesto: ~20–30 minuti tra setup ed estrazione
Cosa serve: account Octoparse (piano gratuito disponibile, con limitazioni)
Passo 1: crea una nuova task e carica l’URL di SuperPages
Apri Octoparse, clicca “New Task” e incolla l’URL della ricerca SuperPages (ad esempio “https://www.superpages.com/los-angeles-ca/plumbers”). Il browser integrato carica la pagina.
Passo 2: rileva automaticamente o seleziona manualmente i campi dati
Clicca “Auto-detect” — Octoparse analizza la pagina e evidenzia i campi che ritiene rilevanti. Controlla il pannello Data Preview. Per esperienza, il rilevamento automatico prende spesso la maggior parte dei campi, ma può includere elementi extra (come etichette pubblicitarie o testo di navigazione) oppure perdere alcuni dati. Probabilmente dovrai aggiungere o rimuovere manualmente qualche campo.
Secondo la documentazione di Octoparse, l’autodetect crea un workflow base con passaggi di paginazione ed estrazione dati, ma gli utenti potrebbero dover aggiungere i dati mancanti manualmente.
Passo 3: costruisci il workflow e configura la paginazione
Clicca “Create workflow”. Octoparse genera una sequenza di azioni passo passo. Controlla il passaggio di paginazione — verifica che clicchi correttamente “Next” o carichi altri risultati. Se vuoi i dati dalla pagina dettaglio di ogni attività (orari, email, descrizione), dovrai aggiungere un loop per la detail page o un’azione subpage dentro il workflow. Questo introduce più complessità rispetto all’approccio Thunderbit con un clic.
Passo 4: esegui la task ed esporta i dati
Avvia la task in locale (per lavori piccoli) oppure nel cloud di Octoparse (per lavori pianificati o più grandi — il cloud è una funzione a pagamento). Quando termina, esporta in CSV, Excel o JSON.
Limiti da conoscere: il piano gratuito di Octoparse include 10 task, fino a 50.000 righe al mese e solo estrazione locale. Esecuzioni cloud, rotazione IP, solving CAPTCHA e alcune integrazioni di export richiedono un piano a pagamento (a partire da circa 69 $/mese con fatturazione annuale).
Metodo 3: estrarre lead da SuperPages con Python (Requests + BeautifulSoup)
Questo è il percorso da sviluppatore. Massimo controllo, massima responsabilità. Se sai scrivere e mantenere script Python, avrai la massima flessibilità — ma anche più grattacapi.
Difficoltà: Avanzato
Tempo richiesto: ~30–60 minuti (setup + codice + debug)
Cosa serve: Python 3.x, pip, requests, beautifulsoup4, lxml, un editor di codice
Passo 1: prepara l’ambiente Python
1python -m venv .venv
2source .venv/bin/activate
3pip install requests beautifulsoup4 lxml pandas
Passo 2: ispeziona la struttura HTML di SuperPages
Apri gli Strumenti per sviluppatori (F12) su una pagina risultati di SuperPages. Individua i selettori CSS per nome attività, indirizzo, telefono, sito web e link alla pagina dettaglio. Tieni presente che la struttura HTML può cambiare senza preavviso, quindi i selettori possono rompersi in qualsiasi momento.
Passo 3: scrivi lo scraper delle schede e gestisci la paginazione
Ecco un esempio semplificato. Nota importante: nei miei test, una richiesta diretta a SuperPages restituiva una pagina di blocco Cloudflare “Attention Required”. Uno script Requests ingenuo può fallire su larga scala — potresti aver bisogno di contesto di sessione browser, rate limiting, retry o alternative autorizzate.
1import csv, time
2from urllib.parse import urljoin
3import requests
4from bs4 import BeautifulSoup
5BASE_URL = "https://www.superpages.com"
6HEADERS = {
7 "User-Agent": (
8 "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) "
9 "AppleWebKit/537.36 (KHTML, like Gecko) "
10 "Chrome/125.0 Safari/537.36"
11 )
12}
13def fetch(url):
14 resp = requests.get(url, headers=HEADERS, timeout=20)
15 resp.raise_for_status()
16 if "Attention Required" in resp.text or "Cloudflare" in resp.text:
17 raise RuntimeError("Bloccato. Rallenta o passa a browser/cloud scraping.")
18 return BeautifulSoup(resp.text, "lxml")
19def parse_listing(card):
20 name_el = card.select_one(".business-name, a.business-name, h2 a, h3 a")
21 phone_el = card.select_one(".phones, .phone, [class*=phone]")
22 address_el = card.select_one(".street-address, .adr, [class*=address]")
23 website_el = card.select_one("a.track-visit-website, a[href*='http']")
24 rating_el = card.select_one(".rating, [class*=rating]")
25 detail_url = urljoin(BASE_URL, name_el.get("href")) if name_el and name_el.get("href") else ""
26 return {
27 "business_name": name_el.get_text(" ", strip=True) if name_el else "",
28 "phone": phone_el.get_text(" ", strip=True) if phone_el else "",
29 "address": address_el.get_text(" ", strip=True) if address_el else "",
30 "website": website_el.get("href", "") if website_el else "",
31 "rating": rating_el.get_text(" ", strip=True) if rating_el else "",
32 "detail_url": detail_url,
33 }
34def scrape_search(search_url, pages=3):
35 all_rows = []
36 for page in range(1, pages + 1):
37 page_url = f"\{search_url\}?page=\{page\}"
38 soup = fetch(page_url)
39 cards = soup.select(".result, .organic, [class*=result]")
40 if not cards:
41 break
42 for card in cards:
43 all_rows.append(parse_listing(card))
44 time.sleep(5)
45 return all_rows
46if __name__ == "__main__":
47 rows = scrape_search("https://www.superpages.com/los-angeles-ca/plumbers", pages=2)
48 with open("superpages_leads.csv", "w", newline="", encoding="utf-8") as f:
49 writer = csv.DictWriter(f, fieldnames=sorted({k for row in rows for k in row}))
50 writer.writeheader()
51 writer.writerows(rows)
Passo 4: estrai le pagine dettaglio per arricchire i dati
Scrivi una funzione separata per visitare ogni URL della pagina dettaglio ed estrarre orari, email, descrizione e recensioni. Questo significa gestire limiti di frequenza, error handling ed eventualmente proxy — tutto a tuo carico.
Passo 5: salva i dati in CSV o JSON
Usa i moduli csv o json di Python. Dovrai anche scrivere da solo la logica di deduplicazione, pulizia ed esportazione.
Problemi comuni:
- SuperPages può bloccare le richieste con Cloudflare o sistemi anti-bot simili (confermato nei miei test).
- Qui i selettori sono volutamente generici perché il markup di SuperPages può cambiare.
- Non dare per scontato che le pagine dei risultati contengano email. Quasi mai è così.
- Uno scraper in produzione richiede revisione di robots/TOS, rate limiting, retry/backoff, logging strutturato e gestione degli errori.
Se vuoi approfondire lo scraping con Python, dai un’occhiata alla nostra guida sul web scraping con Python o al tutorial su BeautifulSoup.
Dai dati grezzi ai lead reali: il flusso completo (estrai → pulisci → verifica → CRM)
Qui è dove la maggior parte delle guide si ferma — e dove inizia il vero valore. Lo scraping ti fornisce materia grezza. Trasformarla in una lista lead utilizzabile richiede ancora qualche passaggio.

Il flusso è questo:
Ricerca SuperPages → Estrai le schede → Estrai le pagine dettaglio/siti web → Esporta in Google Sheets o CSV → Pulisci telefoni, indirizzi, categorie → Deduplica → Verifica email/telefoni → Arricchisci i contatti mancanti → Importa nel CRM → Outreach conforme
Deduplicazione: rimuovere le schede duplicate
SuperPages mostra spesso la stessa attività in più categorie. Se estrai “plumbers” e “drain cleaning” nella stessa città, avrai sovrapposizioni.
- Chiave primaria di deduplica: numero di telefono normalizzato + indirizzo normalizzato.
- Secondaria: dominio + città.
- Fallback: nome attività + CAP (da controllare manualmente per i franchising).
In Google Sheets, usa =UNIQUE(A:H) per corrispondenze esatte di riga, oppure crea una colonna di supporto come =LOWER(REGEXREPLACE(B2&C2,"[^a-zA-Z0-9]","")) per intercettare duplicati quasi identici. In Excel, usa Dati > Rimuovi duplicati.
Pulizia dati: standardizzare telefoni, indirizzi e formattazione
- Formatta i numeri di telefono in E.164 (per gli USA: +1 seguito da 10 cifre). È il formato che la maggior parte dei CRM e dialer si aspetta. Puoi usare un Field AI Prompt in Thunderbit per formattarlo automaticamente durante lo scraping.
- Normalizza gli indirizzi: espandi le abbreviazioni, completa i CAP mancanti, separa in colonne via/città/stato/CAP se serve.
- Rimuovi artefatti HTML, spazi extra e parametri di tracking dagli URL.
- Aggiungi le colonne
source_directory,source_urlescraped_atper la tracciabilità.
Verifica di email e telefono prima dell’outreach
Non inviare una cold email a ogni indirizzo che hai estratto. La verifica protegge la reputazione del mittente e mantiene basse le bounce rate.
- Verifica email: ZeroBounce (a partire da circa 39 $ per 2.000 crediti, più 100 crediti gratuiti al mese) o Bouncer (8 $ per 1.000 crediti, crediti senza scadenza) sono opzioni solide.
- Validazione telefono: Twilio Lookup offre formattazione e validazione gratuite; il caller ID costa 0,01 $ per richiesta.
- Gli strumenti gratuiti Email Extractor e Phone Number Extractor di Thunderbit possono recuperare contatti mancanti nelle pagine delle schede.
Arricchimento: trovare contatti quando SuperPages non mostra email
Molte schede SuperPages non mostrano alcuna email — soprattutto nella pagina risultati. Ecco cosa fare:
- Estrai le pagine Contatti, Chi siamo o il footer del sito dell’attività. Lo Scraping delle sottopagine di Thunderbit o l’Email Extractor possono farlo in blocco.
- Usa strumenti di enrichment come Apollo, BetterContact, Icypeas o Prospeo. Avvertenza: per le piccole attività locali (una piccola idraulica di due persone, uno studio dentistico individuale), i grandi database B2B spesso non restituiscono nulla. Per questo il metodo website-first funziona meglio.
- Combina più directory. Estrai SuperPages, Yellow Pages e Google Maps per la stessa categoria/città, poi unisci e deduplica. La sovrapposizione ti darà record più completi.
Se hai mai provato a passare una lista di piccole attività locali dentro Apollo e hai trovato quasi solo campi vuoti, non sei il solo. Ecco perché l’approccio basato sul sito web è così importante per questo pubblico.
Importazione nel CRM: portare i lead in HubSpot, Salesforce o Google Sheets
- HubSpot: vai su Data Management > Data Integration > Import data > Quick import (solo contatti). Carica il tuo
.csvo.xlsx. La guida all’import di HubSpot ti aiuta con il mapping dei campi. - Salesforce: usa il Data Import Wizard. Prepara un CSV, mappa i campi sorgente sui campi Salesforce ed esegui l’import.
- Google Sheets / Airtable / Notion: Thunderbit esporta direttamente in tutti e tre — senza bisogno di un CSV intermedio.
Consiglio: mappa le colonne estratte sui campi del CRM prima di importare. Bastano pochi minuti di mapping per risparmiare ore di pulizia manuale dopo.
SuperPages vs altre directory di attività locali: dove trovare i lead migliori
SuperPages è un ottimo punto di partenza, ma non è l’unica directory degna di essere estratta. Ecco il confronto:
| Directory | Volume lead | Campi disponibili | Aggiornamento dati | Difficoltà anti-scraping | Ideale per |
|---|---|---|---|---|---|
| SuperPages | Elevato (focus USA) | Nome, telefono, indirizzo, sito web, categorie, valutazioni | Medio | Medio | Home services, contractor, PMI |
| Yellow Pages | Elevato (focus USA) | Simile a SuperPages | Medio | Medio | Outreach locale generico |
| Google Maps | Molto elevato (globale) | Nome, telefono, indirizzo, sito web, recensioni, orari, foto | Alto (aggiornato dal proprietario) | Alto (anti-bot aggressivo) | Dati locali più attuali |
| Yelp | Elevato (focus USA) | Nome, telefono, indirizzo, recensioni, fascia prezzo | Alto | Alto | Ristoranti, retail, servizi |
| Manta | Medio | Nome, telefono, indirizzo, stime di fatturato, numero dipendenti | Medio | Basso | Prospecting B2B (dati su fatturato/dipendenti) |
| BBB | Medio | Nome, telefono, indirizzo, accreditamento, reclami | Medio | Basso | Attività affidabili/verificate |
Fonti: homepage SuperPages, paper VLDB su SuperPages, documentazione Google Places API, documentazione Yelp Places API, homepage Manta, guida BBB.
Thunderbit funziona su tutte queste fonti — incluse le Instant Template per siti popolari come Google Maps e SuperPages — così puoi applicare lo stesso flusso a più sorgenti e unire le liste lead. Per esperienza, l’approccio migliore è spesso estrarre due o tre directory per la stessa categoria/città e poi deduplicare. Le sovrapposizioni riempiono i vuoti e ti danno un quadro più completo.
Per approfondire lo scraping di altre directory, consulta le nostre guide su , e .
Consigli legali ed etici per lo scraping dei lead di SuperPages

Non sono un avvocato, e questo non è un consiglio legale — ma passo abbastanza tempo in questo settore da sapere che ignorare la compliance è il modo più rapido per avere problemi. Ecco il quadro pratico.
Dati aziendali pubblici vs dati personali
Le schede business — nome azienda, telefono dell’attività, indirizzo dell’attività, sito web aziendale — sono generalmente considerate dati commerciali pubblici. È diverso dai dati personali dei consumatori ai sensi di GDPR o CCPA. Ma “pubblico” non significa “senza regole”. Controlla sempre i Termini di servizio del sito.
I Termini d’uso di SuperPages (aggiornati a luglio 2019) includono una clausola “Data Mining Prohibited”: gli utenti non possono usare bot, crawler, spider o strumenti simili per raccogliere o estrarre dati senza il previo consenso di Thryv. L’articolo parla di metodi e workflow, ma dovresti comunque rivedere questi termini e ottenere l’autorizzazione quando necessario prima di fare scraping su larga scala.
Compliance nell’outreach: basi di CAN-SPAM e TCPA
Se usi email estratte per cold outreach, la guida FTC al CAN-SPAM dice che devi:
- Non usare header falsi o fuorvianti
- Non usare oggetti ingannevoli
- Identificare il messaggio come pubblicità quando richiesto
- Includere un indirizzo postale fisico valido
- Fornire un meccanismo chiaro di opt-out e rispettarlo tempestivamente
Se usi numeri di telefono estratti per chiamate a freddo, controlla il National Do Not Call Registry e rispetta le regole TCPA — soprattutto per chiamate automatiche, messaggi preregistrati e SMS. La FTC ha annunciato cambiamenti nel 2024 per rafforzare la protezione contro il telemarketing B2B ingannevole e le chiamate truffa abilitate dall’AI.
Checklist rapida di conformità
- ✅ Estrai solo dati aziendali pubblicamente elencati
- ✅ Rivedi i Termini di servizio di SuperPages e ottieni il permesso quando richiesto
- ✅ Verifica i contatti prima dell’outreach
- ✅ Inserisci l’opt-out nelle email
- ✅ Rispetta robots.txt e i rate limit
- ✅ Mantieni liste di soppressione per DNC ed email
- ⚠️ Evita di estrarre dati personali/consumer
- ⚠️ Non rivendere dati grezzi estratti senza revisione legale
Scegli il metodo e inizia a costruire la tua lista lead
Estrarre lead da SuperPages non significa soltanto prelevare righe da una pagina web. Il vero valore nasce dall’intero flusso: estrai, pulisci, deduplica, verifica, arricchisci, importa e fai outreach in modo conforme.
Ecco il riassunto veloce:
- Thunderbit è il percorso più rapido per team sales, agenzie e non sviluppatori. Due clic per estrarre, un clic per arricchire con le sottopagine, export gratuito su Google Sheets, Airtable, Notion o Excel. Provalo gratis.
- Octoparse è uno strumento visuale solido per utenti semi-tecnici che vogliono più controllo nella configurazione.
- Python offre agli sviluppatori massima flessibilità — ma comporta manutenzione, problemi di anti-blocco e nessun arricchimento integrato.
- E ricorda: lo stesso flusso vale per Yellow Pages, Google Maps, Yelp, Manta e BBB. Estrai più fonti, unisci, deduplica e avrai la lista lead locale più completa possibile.
Se vuoi vedere Thunderbit in azione, visita il nostro per le guide passo passo oppure esplora i per capire cosa si adatta meglio al tuo team.
Ora trasforma quelle pagine di directory in pipeline — e che i tuoi numeri di telefono siano sempre formattati e le tue email sempre verificate.
FAQ
È legale estrarre lead da SuperPages?
Estrarre dati aziendali pubblicamente disponibili per ricerche B2B è una pratica comune, ma i Termini di servizio di SuperPages vietano il data mining senza il previo consenso di Thryv. Controlla sempre i termini del sito, ottieni il permesso quando serve e rispetta le regole di outreach come CAN-SPAM e TCPA. Questo articolo descrive metodi e workflow a scopo educativo: è tua responsabilità usarli in modo conforme.
Quali dati posso ottenere da SuperPages?
Una scansione tipica restituisce nome attività, telefono, indirizzo, sito web, categoria, valutazioni, orari e descrizioni. Le email raramente compaiono nella pagina dei risultati: di solito devi visitare la pagina dettaglio dell’attività o il sito web dell’azienda (usando lo scraping delle sottopagine o un estrattore email) per trovarle.
Posso estrarre dati da SuperPages senza programmare?
Sì. Strumenti come Thunderbit (estensione Chrome AI) e Octoparse (estrattore visuale) ti consentono di estrarre dati da SuperPages senza scrivere una sola riga di codice. Thunderbit è l’opzione più rapida: installa l’estensione, apri una ricerca su SuperPages, clicca “AI Suggest Fields” e poi “Scrape”.
Come gestisco la paginazione quando estraggo SuperPages?
Thunderbit gestisce la paginazione automaticamente: rileva i pulsanti “Next” o lo scroll infinito e continua. Octoparse richiede di configurare un passaggio di paginazione nel workflow. In Python, devi scrivere una logica manuale di ciclo tra le pagine (incrementando i numeri di pagina, rilevando l’ultima pagina).
Come ottengo le email dalle schede SuperPages?
La maggior parte delle schede SuperPages non mostra email nella pagina risultati. Usa lo Scraping delle sottopagine di Thunderbit per visitare ogni pagina dettaglio, oppure usa l’Email Extractor gratuito sul sito dell’attività. Per i casi ancora scoperti, prova strumenti di enrichment come Apollo, BetterContact o Prospeo — anche se per le piccole attività locali, l’estrazione dal sito web spesso funziona meglio dei grandi database B2B.
Scopri di più
