substack-scraper

Substack Scraper

Substack Scraper od Thunderbit pomaga wydobywać uporządkowane dane z Substack Discover oraz stron publikacji z wykorzystaniem AI. Zbieraj listy newsletterów, kategorie, autorów i informacje o subskrybentach, a następnie wzbogacaj wyniki, skanując podstrony po bardziej szczegółowe dane o publikacjach. Wyeksportuj wszystko do Excel, Google Sheets, Airtable lub Notion w kilka minut.
4.8
Miesięczni użytkownicy8.2k
Wspierane przez AI
Wiadomości
chrome-web-store
Add to ChromeDostępna darmowa wersja
Dostępna darmowa wersja

Substack Scraper od Thunderbit pozwala zamieniać strony Substack w przejrzyste, ustrukturyzowane zestawy danych dzięki AI. Możesz wyciągać listy newsletterów, kategorie, autorów i szczegóły publikacji z Substack Discover oraz stron w stylu katalogów/leaderboardów, a następnie wzbogacać wyniki, skanując podstrony po dodatkowe informacje. Dane wyeksportujesz do Excel, Google Sheets, Airtable lub Notion w kilka minut dzięki AI Web Scraper (https://thunderbit.com/ai-web-scraper).

🧠 Czym jest Substack Scraper

Substack Scraper zasilany AI to , który umożliwia pobieranie danych z w prostym schemacie: otwierasz stronę, klikasz AI Suggest Columns, a potem Scrape. AI Thunderbit analizuje układ strony, podpowiada najlepsze pola do wyodrębnienia i układa dane w tabelę, którą możesz pobrać lub wysłać do swoich narzędzi.

Substack — A new economic engine for culture

🧾 Co można zbierać z Substack

Substack zawiera mnóstwo wartościowych, publicznie dostępnych informacji przydatnych w badaniach, partnerstwach, monitoringu mediów i rozwoju odbiorców. Z Thunderbit możesz skanować strony z listami (np. Discover), a potem użyć Subpage Scraping, aby odwiedzić stronę każdego newslettera/publikacji i wzbogacić zestaw danych o szczegóły niewidoczne w widoku listy.

Poniżej znajdziesz dwa popularne, szczególnie wartościowe scenariusze użycia Substack Scraper.

🗞️ Pobieranie newsletterów z Substack Discover

Ten wariant pozwala zbudować bazę newsletterów ze strony . Przydaje się, gdy chcesz wyszukiwać publikacje według tematu, oceniać potencjalnych partnerów sponsoringowych albo śledzić trendy w kategoriach.

Scrape Newsletters from Substack Discover

Kroki:

  1. Pobierz i załóż konto.
  2. Wejdź na stronę docelową, np.: .
  3. Kliknij AI Suggest Columns, aby AI zaproponowało nazwy kolumn i typy danych.
  4. Kliknij Scrape, uruchom skanowanie, a następnie wyeksportuj do Excel, Google Sheets, Airtable lub Notion.

Nazwy kolumn

KolumnaOpis
📰 Nazwa newslettera / publikacjiNazwa newslettera lub publikacji widoczna w Discover.
🔗 URL publikacjiLink do strony publikacji (świetny do wzbogacania przez podstrony).
✍️ Autor / twórcaAutor lub marka stojąca za publikacją (jeśli widoczne).
🏷️ Kategoria / tematTag(i) kategorii przypisane do wpisu (np. Tech, Politics, Culture).
📝 OpisKrótkie podsumowanie/pozycjonowanie widoczne na liście.
👥 Liczba subskrybentówLiczba subskrybentów, jeśli jest wyświetlana (albo zostaw puste i uzupełnij z podstron).
🖼️ Obraz publikacjiURL logo/okładki publikacji.
Wyróżnienie / etykieta rankinguOdznaka wyróżnienia, etykieta trendu lub informacja o pozycji widoczna na stronie.

🏆 Pobieranie top publikacji z Substack Leaderboard (Resources)

Ten workflow służy do wyciągania kuratorowanej listy publikacji ze strony w stylu zasobów/leaderboardu: . To dobre rozwiązanie do analizy konkurencji, działań partnerskich i budowania mapy mediów w danej niszy.

Scrape Top Publications from Substack Leaderboard

Kroki:

  1. Pobierz i załóż konto.
  2. Wejdź na stronę docelową, np.: .
  3. Kliknij AI Suggest Columns, aby wygenerować rekomendowane pola dla tego układu strony.
  4. Kliknij Scrape, aby wyciągnąć tabelę, a następnie pobierz lub wyeksportuj dane.

Nazwy kolumn

KolumnaOpis
🏷️ Nazwa publikacjiNazwa publikacji widoczna na stronie.
🔗 URL publikacjiBezpośredni link do publikacji (idealny do skanowania podstron).
🧑‍💼 Autor / zespółNazwisko(a) autora lub organizacja stojąca za publikacją (jeśli widoczne).
🗂️ Kategoria / kolekcjaSekcja lub grupa, w której pojawia się publikacja (jeśli dotyczy).
📝 PodsumowanieKrótki opis lub tekst pozycjonujący.
👥 Subskrybenci / odbiorcyWskaźnik wielkości audytorium widoczny na stronie.
🖼️ Logo / obrazURL logo lub miniatury publikacji.
🕒 Ostatnia aktualizacja / świeżośćSygnał aktualności widoczny na stronie (albo pobierz z podstron, jeśli dostępne).

🎯 Dlaczego warto używać narzędzia do Substack

Scrapowanie Substack wspiera realne procesy biznesowe — szczególnie gdy potrzebujesz danych w formie tabelarycznej do analizy, outreachu lub monitoringu.

Najczęstsze powody, by zbierać dane z Substack za pomocą :

  • Marketing i partnerstwa: Zbuduj listę newsletterów do działań sponsoringowych, cross-promocji lub partnerstw afiliacyjnych. Listę możesz wzbogacić, skanując podstrony po linki kontaktowe i szczegóły publikacji.
  • Sprzedaż i generowanie leadów: Wyszukuj twórców i niszowe publikacje pasujące do Twojego ICP, a potem eksportuj do Google Sheets lub Airtable, aby budować pipeline.
  • Badania medialne i analiza konkurencji: Śledź kategorie, pozycjonowanie i sygnały wzrostu, aby zrozumieć, co zyskuje na popularności.
  • Strategia treści: Mapuj tematy i opisy newsletterów, by znaleźć luki, nowe motywy i segmenty odbiorców.

Thunderbit jest szczególnie przydatny, gdy:

  • Układ strony często się zmienia i tradycyjne scrapery przestają działać
  • Chcesz użyć Subpage Scraping, aby wzbogacić każdy wiersz o głębsze informacje o publikacji
  • Chcesz szybko eksportować do narzędzi, z których już korzystasz (Sheets, Airtable, Notion)

Jeśli dopiero zaczynasz ze scrapingiem, te poradniki mogą pomóc:

🧩 Jak korzystać z Substack Chrome Extension

  1. Zainstaluj Thunderbit Chrome Extension: Pobierz z i utwórz konto.
  2. Przejdź do strony Substack, którą chcesz skanować: np. lub .
  3. Uruchom scraper zasilany AI: Kliknij AI Suggest Columns, aby wygenerować nazwy kolumn, dopasuj pola do swoich potrzeb, a następnie kliknij Scrape.

Wskazówka: Po pierwszym skanowaniu użyj Scrape Subpages, aby Thunderbit odwiedził każdy URL publikacji i dopisał do tabeli dodatkowe pola (np. rozszerzone opisy, dane autora, linki lub inne widoczne metadane).

💳 Cennik dla Substack

Thunderbit działa w oparciu o prosty system kredytów:

  • 1 kredyt = 1 wiersz wynikowy w tabeli.
  • Funkcje AI Powered Scraper (AI Suggest Columns + Scrape) są dostępne od razu, a eksport danych jest darmowy (CSV/JSON, Excel, Google Sheets, Airtable, Notion).

Thunderbit możesz przetestować bez opłat:

  • Darmowy plan: skanowanie 6 stron miesięcznie
  • Darmowy trial: skanowanie 10 stron za darmo przed wyborem płatnego planu

Jeśli zeskanujesz Substack Discover i uzyskasz 200 wierszy newsletterów, to będzie około 200 kredytów za to uruchomienie. Jeśli potem wzbogacisz te wiersze przez skanowanie podstron, łączna liczba kredytów zależy od tego, ile wzbogaconych wierszy finalnie zapiszesz.

Płatne plany (miesięczne i roczne) są dopasowane do różnych wolumenów, a plan roczny zwykle bardziej się opłaca, bo zawiera zniżkę względem płatności miesiąc do miesiąca. Szczegóły znajdziesz na stronie .

PlanCena (miesięcznie)Cena (rocznie)Łączna cena rocznaKredyty (miesięcznie)Kredyty (rocznie)
FreeFreeFreeFree6 stronN/A
Starter$15$9$1085005,000
Pro 1$38$16.5$1993,00030,000
Pro 2$75$33.8$3986,00060,000
Pro 3$125$68.4$79610,000120,000
Pro 4$249$137.5$1,59220,000240,000

Gotowy(-a), by skanować Substack z AI

  • Instalacja:
  • Produkt:

❓ FAQ

  1. Czym jest Substack Scraper zasilany AI?
    Substack Scraper zasilany AI to , który wyciąga ustrukturyzowane dane ze stron Substack, takich jak Discover i listy publikacji. Otwierasz stronę, klikasz AI Suggest Columns, a Thunderbit przygotowuje schemat pod tabelę i zapisuje dane w wierszach gotowych do eksportu.

  2. Czym jest Thunderbit?
    to rozszerzenie Chrome do web scrapingu i produktywności oparte na AI, które pomaga zbierać dane ze stron, PDF-ów i obrazów oraz zamieniać je w uporządkowane zestawy danych. Narzędzie jest tworzone pod procesy biznesowe, takie jak generowanie leadów, badania rynku, operacje ecommerce i nieruchomości, z szybkim eksportem do Google Sheets, Airtable i Notion.

  3. Jakie strony Substack mogę skanować w Thunderbit?
    Możesz skanować wiele publicznych stron Substack, w tym , kuratorowane strony zasobów oraz pojedyncze strony publikacji. Jeśli strona wymaga logowania, często sprawdzi się Browser Scraping, dzięki czemu Thunderbit działa w Twojej zalogowanej sesji Chrome.

  4. Czy Thunderbit potrafi skanować podstrony publikacji, aby zebrać więcej szczegółów?
    Tak. Funkcja Subpage Scraping w Thunderbit może odwiedzać każdy URL publikacji zebrany ze strony listy i dopisywać dodatkowe pola do tabeli. To przydatne, gdy na liście widać tylko krótki opis, a na stronie publikacji znajdują się bogatsze metadane.

  5. Jak dobrać właściwe kolumny do scrapowania Substack?
    Zacznij od AI Suggest Columns, a potem dopasuj nazwy pól i typy danych do swojego procesu. Możesz też dodać do kolumny Field AI Prompt, aby ukierunkować ekstrakcję lub formatowanie — np. ujednolicić kategorie albo wyciągnąć „czyste” imię i nazwisko autora.

  6. Czy mogę eksportować dane z Substack do Google Sheets, Airtable lub Notion?
    Tak — i eksport jest darmowy. Po skanowaniu możesz pobrać CSV/JSON albo wysłać zestaw danych bezpośrednio do Google Sheets, Airtable lub Notion, aby współpracować, filtrować i wzbogacać dane.

  7. Jaka jest różnica między Cloud Scraping a Browser Scraping dla Substack?
    Cloud Scraping działa szybciej i świetnie nadaje się do publicznych stron bez logowania. Browser Scraping działa w Twojej sesji Chrome i jest lepszy, gdy potrzebujesz dostępu do treści za logowaniem lub chcesz, aby scraper zachowywał się dokładnie jak Twoja przeglądarka.

  8. Ile wierszy mogę pobrać z Substack w jednym uruchomieniu?
    Praktyczny limit zależy od struktury strony, paginacji/infinite scroll oraz liczby kredytów w planie, ale wiele zastosowań obejmuje setki wierszy naraz (często do ok. 500 wierszy w typowym uruchomieniu). Jeśli strona używa infinite scroll lub wielu podstron, Thunderbit potrafi obsłużyć paginację i kontynuować zbieranie wierszy, gdy wczytujesz kolejne wyniki.

  9. Czy scrapowanie Substack jest w porządku?
    Warto robić to odpowiedzialnie i przestrzegać obowiązujących przepisów, oczekiwań dotyczących prywatności oraz warunków Substack. Thunderbit to narzędzie do porządkowania danych, do których masz dostęp w przeglądarce — a Ty decydujesz, co zbierasz i jak to wykorzystujesz.

📚 Dowiedz się więcej

  • Zacznij od produktu:
  • Zainstaluj rozszerzenie:
  • Przeczytaj poradniki na
  • Podstawy:
  • Koncepcje list scraping:
  • Workflow z Excel:
  • Ekstrakcja z PDF:
  • Dobre praktyki zbierania e-maili:
  • Porównania narzędzi: `
Wyciągaj dane z pomocą AI
Łatwo przenieś dane do Google Sheets, Airtable lub Notion
Chrome Store Rating
PRODUCT HUNT#1 Product of the Week