substack-scraper

Substack Scraper

Substack Scraper od Thunderbitu vám s pomocí AI umožní získat ze Substack Discover a stránek publikací přehledná, strukturovaná data. Vytěžte seznamy newsletterů, kategorie, autory i informace o odběratelích a výsledky pak obohaťte procházením podstránek pro detailnější údaje o publikacích. Data vyexportujete do Excelu, Google Sheets, Airtable nebo Notion během pár minut.
4.8
Měsíčních uživatelů8.2k
Poháněno AI
Zprávy
chrome-web-store
Add to ChromeDostupná bezplatná verze
Dostupná bezplatná verze

Thunderbit’s Substack Scraper vám pomůže proměnit stránky Substacku na čisté, strukturované datasety pomocí AI. Snadno vytěžíte seznamy newsletterů, kategorie, autory i detaily publikací ze Substack Discover a z přehledových stránek typu zdroje/žebříčky. Výsledky pak můžete obohatit tím, že necháte scraper projít podstránky a doplnit hlubší informace. Data vyexportujete do Excelu, Google Sheets, Airtable nebo Notion během pár minut s AI Web Scraper (https://thunderbit.com/ai-web-scraper).

🧠 Co je Substack Scraper

AI Powered Substack Scraper je , se kterým získáte data ze jednoduchým postupem: otevřete stránku, kliknete na AI Suggest Columns a potom na Scrape. AI od Thunderbitu rozpozná rozložení stránky, navrhne nejvhodnější pole k extrakci a data uspořádá do tabulky, kterou si můžete stáhnout nebo odeslat do svých nástrojů.

Substack — A new economic engine for culture

🧾 Co můžete ze Substacku vytěžit

Substack obsahuje spoustu veřejně dostupných informací užitečných pro výzkum, partnerství, monitoring médií i rozvoj publika. S Thunderbitem můžete nejdřív vytěžit listovací stránky (např. Discover) a pak použít Subpage Scraping, aby se navštívila stránka každého newsletteru/publikace a dataset se doplnil o detaily, které v seznamu nejsou vidět.

Níže jsou dva běžné a velmi hodnotné postupy, které se Substack Scraperem často dávají smysl.

🗞️ Vytěžení newsletterů ze Substack Discover

Tento postup využijete, když si chcete vytvořit databázi newsletterů ze stránky . Hodí se pro vyhledávání publikací podle tématu, posouzení potenciálních partnerů pro sponzoring nebo sledování trendů napříč kategoriemi.

Scrape Newsletters from Substack Discover

Postup:

  1. Nainstalujte si a zaregistrujte si účet.
  2. Otevřete cílovou stránku, například: .
  3. Klikněte na AI Suggest Columns a nechte AI navrhnout názvy sloupců i datové typy.
  4. Klikněte na Scrape, spusťte extrakci a poté exportujte do Excelu, Google Sheets, Airtable nebo Notion.

Názvy sloupců

SloupecPopis
📰 Název newsletteru / publikaceNázev newsletteru nebo publikace zobrazený v Discover.
🔗 URL publikaceOdkaz na stránku publikace (ideální pro obohacení přes podstránky).
✍️ Autor / tvůrceAutor nebo značka stojící za publikací, pokud je uvedeno.
🏷️ Kategorie / témaŠtítky kategorií spojené se záznamem (např. Tech, Politics, Culture).
📝 PopisKrátké shrnutí/pozicování zobrazené v seznamu.
👥 Počet odběratelůPočet odběratelů, pokud je zobrazen (nebo nechte prázdné a doplňte přes podstránky).
🖼️ Obrázek publikaceURL loga/cover obrázku publikace.
Označení „featured“ / pořadíBadge „featured“, štítek trendů nebo indikátor umístění zobrazený na stránce.

🏆 Vytěžení top publikací ze Substack Leaderboard (Resources)

Tento postup slouží k získání kurátorovaného seznamu publikací ze stránky typu zdroje/žebříček: . Využijete ho pro konkurenční analýzu, oslovování partnerů nebo tvorbu přehledu mediálního prostředí podle niche.

Scrape Top Publications from Substack Leaderboard

Postup:

  1. Nainstalujte si a zaregistrujte si účet.
  2. Otevřete cílovou stránku, například: .
  3. Klikněte na AI Suggest Columns a nechte vygenerovat doporučená pole pro dané rozložení stránky.
  4. Klikněte na Scrape, vytěžte tabulku a poté data stáhněte nebo vyexportujte.

Názvy sloupců

SloupecPopis
🏷️ Název publikaceNázev publikace uvedený na stránce.
🔗 URL publikacePřímý odkaz na publikaci (ideální pro scraping podstránek).
🧑‍💼 Autor / týmJméno autora(ů) nebo organizace za publikací, pokud je uvedeno.
🗂️ Kategorie / kolekceSekce nebo skupina, ve které se publikace nachází (pokud je relevantní).
📝 ShrnutíKrátký popis nebo pozicování.
👥 Odběratelé / publikumJakýkoli ukazatel velikosti publika zobrazený na stránce.
🖼️ Logo / obrázekURL loga nebo náhledu publikace.
🕒 Poslední aktualizace / aktuálnostSignál aktuálnosti zobrazený na stránce (nebo vytěžte z podstránek, pokud je k dispozici).

🎯 Proč používat nástroj pro Substack

Scraping Substacku může podpořit reálné business scénáře, zejména když potřebujete strukturovaná data pro analýzu, oslovování nebo monitoring.

Typické důvody, proč Substack vytěžovat pomocí :

  • Marketing a partnerství: Vytvořte si seznam newsletterů pro sponzorské oslovení, cross-promo nebo affiliate spolupráce. Seznam můžete obohatit scrapingem podstránek o kontaktní odkazy a detaily publikace.
  • Sales a lead generation: Najděte tvůrce a niche publikace, které odpovídají vašemu ICP, a exportujte do Google Sheets nebo Airtable pro budování pipeline.
  • Mediální výzkum a konkurenční analýza: Sledujte kategorie, pozicování a signály růstu napříč publikacemi a zjistěte, co nabírá na popularitě.
  • Content strategie: Zmapujte témata a popisy newsletterů, abyste našli mezery, nové motivy a segmenty publika.

Thunderbit je obzvlášť užitečný, když:

  • se rozložení stránky často mění a klasické scrapery se „rozbíjejí“
  • chcete využít Subpage Scraping k doplnění každého řádku o detailnější informace
  • potřebujete rychle exportovat do nástrojů, které už používáte (Sheets, Airtable, Notion)

Pokud se scrapingem začínáte, pomůžou vám tyto návody:

🧩 Jak používat Substack Chrome Extension

  1. Nainstalujte Thunderbit Chrome Extension: Stáhněte si ji z a vytvořte si účet.
  2. Přejděte na stránku Substacku, kterou chcete vytěžit: Například nebo .
  3. Spusťte AI scraper: Klikněte na AI Suggest Columns, vygenerujte názvy sloupců, případně upravte pole podle potřeby, a poté klikněte na Scrape.

Tip: Po prvním scrapingu použijte Scrape Subpages — Thunderbit navštíví každou URL publikace a doplní do tabulky další pole (např. rozšířené popisy, informace o autorovi, odkazy nebo další viditelná metadata).

💳 Ceník pro Substack

Thunderbit používá jednoduchý kreditní systém:

  • 1 kredit = 1 výstupní řádek ve výsledné tabulce.
  • Funkce AI Powered Scraper (AI Suggest Columns + Scrape) je k dispozici hned od začátku a export dat je zdarma (CSV/JSON, Excel, Google Sheets, Airtable, Notion).

Thunderbit si můžete vyzkoušet bez placení:

  • Free tier: vytěžení 6 stránek měsíčně
  • Free trial: vytěžení 10 stránek zdarma před výběrem placeného tarifu

Pokud vytěžíte Substack Discover a získáte 200 řádků newsletterů, je to zhruba 200 kreditů za daný běh. Když pak tyto řádky obohatíte scrapingem podstránek, celkový počet kreditů závisí na tom, kolik obohacených řádků nakonec vytvoříte.

Placené tarify (měsíční i roční) jsou nastavené pro různé objemy a roční plán obvykle vychází výhodněji, protože obsahuje slevu oproti platbě měsíc po měsíci. Kompletní detaily najdete na .

TarifCena (měsíčně)Cena (ročně)Celková cena za rokKredity (měsíčně)Kredity (ročně)
FreeFreeFreeFree6 stránekN/A
Starter$15$9$1085005,000
Pro 1$38$16.5$1993,00030,000
Pro 2$75$33.8$3986,00060,000
Pro 3$125$68.4$79610,000120,000
Pro 4$249$137.5$1,59220,000240,000

Jste připraveni vytěžovat Substack pomocí AI

  • Instalace:
  • Produkt:

❓ FAQ

  1. Co je AI Powered Substack Scraper?
    AI Powered Substack Scraper je , který získává strukturovaná data ze stránek Substacku, jako je Discover nebo seznamy publikací. Otevřete stránku, kliknete na AI Suggest Columns a Thunderbit připraví schéma vhodné pro tabulku a vytěží data do řádků, které můžete exportovat.

  2. Co je Thunderbit?
    je AI rozšíření pro Chrome zaměřené na web scraping a produktivitu. Pomáhá sbírat data z webů, PDF i obrázků a převádět je do strukturovaných datasetů. Je navržené pro business použití jako lead generation, průzkum trhu, ecommerce operace nebo realitní segment, s rychlým exportem do nástrojů jako Google Sheets, Airtable a Notion.

  3. Jaké stránky Substacku mohu s Thunderbitem vytěžit?
    Můžete vytěžovat řadu veřejných stránek Substacku, včetně , kurátorovaných resource stránek i jednotlivých stránek publikací. Pokud je potřeba přihlášení, často pomůže Browser Scraping, aby Thunderbit fungoval přímo ve vašem přihlášeném Chrome sezení.

  4. Umí Thunderbit vytěžit podstránky publikací pro více detailů?
    Ano. Funkce Subpage Scraping umí navštívit každou URL publikace, kterou jste získali ze seznamu, a doplnit do tabulky další pole. To se hodí, když listovací stránka ukazuje jen krátký popis, ale stránka publikace obsahuje bohatší metadata, která chcete zachytit.

  5. Jak vybrat správné sloupce pro scraping Substacku?
    Začněte s AI Suggest Columns a pak upravte názvy polí i datové typy podle svého workflow. Do sloupce můžete přidat i Field AI Prompt, který AI navede, jak data vytahovat nebo formátovat — například sjednotit kategorie nebo vytěžit „čisté“ jméno autora.

  6. Mohu data ze Substacku exportovat do Google Sheets, Airtable nebo Notion?
    Ano — a export je zdarma. Po scrapingu si můžete stáhnout CSV/JSON nebo dataset poslat přímo do Google Sheets, Airtable či Notion pro spolupráci, filtrování a další obohacení.

  7. Jaký je rozdíl mezi Cloud Scraping a Browser Scraping pro Substack?
    Cloud Scraping je rychlejší a hodí se pro veřejné stránky bez přihlášení. Browser Scraping běží ve vašem Chrome sezení a je lepší, když potřebujete přístup za přihlášením nebo chcete, aby se scraper choval přesně jako váš prohlížeč.

  8. Kolik řádků mohu ze Substacku vytěžit v jednom běhu?
    Praktický limit závisí na struktuře stránky, stránkování/infinite scroll a kreditech ve vašem tarifu. Často se ale cílí na stovky řádků najednou (typicky až kolem 500 řádků na jeden běh). Pokud stránka používá infinite scroll nebo více stránek, Thunderbit zvládne stránkování a bude sbírat řádky dál, jak budete načítat další výsledky.

  9. Je scraping Substacku v pořádku?
    Scrapeujte zodpovědně a dodržujte platné zákony, očekávání ohledně soukromí i podmínky Substacku. Thunderbit je nástroj pro strukturování dat, ke kterým máte přístup ve svém prohlížeči — a vy rozhodujete, co sbíráte a jak to používáte.

📚 Další zdroje

  • Začněte s produktem:
  • Instalace rozšíření:
  • Návody a články:
  • Základy:
  • List scraping:
  • Excel workflow:
  • Extrakce z PDF:
  • Best practices pro sběr e-mailů:
  • Srovnání nástrojů:
Získejte data pomocí AI
Snadno přeneste data do Google Sheets, Airtable nebo Notion
Chrome Store Rating
PRODUCT HUNT#1 Product of the Week