Thunderbit’s Substack Scraper vám pomůže proměnit stránky Substacku na čisté, strukturované datasety pomocí AI. Snadno vytěžíte seznamy newsletterů, kategorie, autory i detaily publikací ze Substack Discover a z přehledových stránek typu zdroje/žebříčky. Výsledky pak můžete obohatit tím, že necháte scraper projít podstránky a doplnit hlubší informace. Data vyexportujete do Excelu, Google Sheets, Airtable nebo Notion během pár minut s AI Web Scraper (https://thunderbit.com/ai-web-scraper).
🧠 Co je Substack Scraper
AI Powered Substack Scraper je , se kterým získáte data ze jednoduchým postupem: otevřete stránku, kliknete na AI Suggest Columns a potom na Scrape. AI od Thunderbitu rozpozná rozložení stránky, navrhne nejvhodnější pole k extrakci a data uspořádá do tabulky, kterou si můžete stáhnout nebo odeslat do svých nástrojů.

🧾 Co můžete ze Substacku vytěžit
Substack obsahuje spoustu veřejně dostupných informací užitečných pro výzkum, partnerství, monitoring médií i rozvoj publika. S Thunderbitem můžete nejdřív vytěžit listovací stránky (např. Discover) a pak použít Subpage Scraping, aby se navštívila stránka každého newsletteru/publikace a dataset se doplnil o detaily, které v seznamu nejsou vidět.
Níže jsou dva běžné a velmi hodnotné postupy, které se Substack Scraperem často dávají smysl.
🗞️ Vytěžení newsletterů ze Substack Discover
Tento postup využijete, když si chcete vytvořit databázi newsletterů ze stránky . Hodí se pro vyhledávání publikací podle tématu, posouzení potenciálních partnerů pro sponzoring nebo sledování trendů napříč kategoriemi.

Postup:
- Nainstalujte si a zaregistrujte si účet.
- Otevřete cílovou stránku, například: .
- Klikněte na AI Suggest Columns a nechte AI navrhnout názvy sloupců i datové typy.
- Klikněte na Scrape, spusťte extrakci a poté exportujte do Excelu, Google Sheets, Airtable nebo Notion.
Názvy sloupců
| Sloupec | Popis |
|---|---|
| 📰 Název newsletteru / publikace | Název newsletteru nebo publikace zobrazený v Discover. |
| 🔗 URL publikace | Odkaz na stránku publikace (ideální pro obohacení přes podstránky). |
| ✍️ Autor / tvůrce | Autor nebo značka stojící za publikací, pokud je uvedeno. |
| 🏷️ Kategorie / téma | Štítky kategorií spojené se záznamem (např. Tech, Politics, Culture). |
| 📝 Popis | Krátké shrnutí/pozicování zobrazené v seznamu. |
| 👥 Počet odběratelů | Počet odběratelů, pokud je zobrazen (nebo nechte prázdné a doplňte přes podstránky). |
| 🖼️ Obrázek publikace | URL loga/cover obrázku publikace. |
| ⭐ Označení „featured“ / pořadí | Badge „featured“, štítek trendů nebo indikátor umístění zobrazený na stránce. |
🏆 Vytěžení top publikací ze Substack Leaderboard (Resources)
Tento postup slouží k získání kurátorovaného seznamu publikací ze stránky typu zdroje/žebříček: . Využijete ho pro konkurenční analýzu, oslovování partnerů nebo tvorbu přehledu mediálního prostředí podle niche.

Postup:
- Nainstalujte si a zaregistrujte si účet.
- Otevřete cílovou stránku, například: .
- Klikněte na AI Suggest Columns a nechte vygenerovat doporučená pole pro dané rozložení stránky.
- Klikněte na Scrape, vytěžte tabulku a poté data stáhněte nebo vyexportujte.
Názvy sloupců
| Sloupec | Popis |
|---|---|
| 🏷️ Název publikace | Název publikace uvedený na stránce. |
| 🔗 URL publikace | Přímý odkaz na publikaci (ideální pro scraping podstránek). |
| 🧑💼 Autor / tým | Jméno autora(ů) nebo organizace za publikací, pokud je uvedeno. |
| 🗂️ Kategorie / kolekce | Sekce nebo skupina, ve které se publikace nachází (pokud je relevantní). |
| 📝 Shrnutí | Krátký popis nebo pozicování. |
| 👥 Odběratelé / publikum | Jakýkoli ukazatel velikosti publika zobrazený na stránce. |
| 🖼️ Logo / obrázek | URL loga nebo náhledu publikace. |
| 🕒 Poslední aktualizace / aktuálnost | Signál aktuálnosti zobrazený na stránce (nebo vytěžte z podstránek, pokud je k dispozici). |
🎯 Proč používat nástroj pro Substack
Scraping Substacku může podpořit reálné business scénáře, zejména když potřebujete strukturovaná data pro analýzu, oslovování nebo monitoring.
Typické důvody, proč Substack vytěžovat pomocí :
- Marketing a partnerství: Vytvořte si seznam newsletterů pro sponzorské oslovení, cross-promo nebo affiliate spolupráce. Seznam můžete obohatit scrapingem podstránek o kontaktní odkazy a detaily publikace.
- Sales a lead generation: Najděte tvůrce a niche publikace, které odpovídají vašemu ICP, a exportujte do Google Sheets nebo Airtable pro budování pipeline.
- Mediální výzkum a konkurenční analýza: Sledujte kategorie, pozicování a signály růstu napříč publikacemi a zjistěte, co nabírá na popularitě.
- Content strategie: Zmapujte témata a popisy newsletterů, abyste našli mezery, nové motivy a segmenty publika.
Thunderbit je obzvlášť užitečný, když:
- se rozložení stránky často mění a klasické scrapery se „rozbíjejí“
- chcete využít Subpage Scraping k doplnění každého řádku o detailnější informace
- potřebujete rychle exportovat do nástrojů, které už používáte (Sheets, Airtable, Notion)
Pokud se scrapingem začínáte, pomůžou vám tyto návody:
🧩 Jak používat Substack Chrome Extension
- Nainstalujte Thunderbit Chrome Extension: Stáhněte si ji z a vytvořte si účet.
- Přejděte na stránku Substacku, kterou chcete vytěžit: Například nebo .
- Spusťte AI scraper: Klikněte na AI Suggest Columns, vygenerujte názvy sloupců, případně upravte pole podle potřeby, a poté klikněte na Scrape.
Tip: Po prvním scrapingu použijte Scrape Subpages — Thunderbit navštíví každou URL publikace a doplní do tabulky další pole (např. rozšířené popisy, informace o autorovi, odkazy nebo další viditelná metadata).
💳 Ceník pro Substack
Thunderbit používá jednoduchý kreditní systém:
- 1 kredit = 1 výstupní řádek ve výsledné tabulce.
- Funkce AI Powered Scraper (AI Suggest Columns + Scrape) je k dispozici hned od začátku a export dat je zdarma (CSV/JSON, Excel, Google Sheets, Airtable, Notion).
Thunderbit si můžete vyzkoušet bez placení:
- Free tier: vytěžení 6 stránek měsíčně
- Free trial: vytěžení 10 stránek zdarma před výběrem placeného tarifu
Pokud vytěžíte Substack Discover a získáte 200 řádků newsletterů, je to zhruba 200 kreditů za daný běh. Když pak tyto řádky obohatíte scrapingem podstránek, celkový počet kreditů závisí na tom, kolik obohacených řádků nakonec vytvoříte.
Placené tarify (měsíční i roční) jsou nastavené pro různé objemy a roční plán obvykle vychází výhodněji, protože obsahuje slevu oproti platbě měsíc po měsíci. Kompletní detaily najdete na .
| Tarif | Cena (měsíčně) | Cena (ročně) | Celková cena za rok | Kredity (měsíčně) | Kredity (ročně) |
|---|---|---|---|---|---|
| Free | Free | Free | Free | 6 stránek | N/A |
| Starter | $15 | $9 | $108 | 500 | 5,000 |
| Pro 1 | $38 | $16.5 | $199 | 3,000 | 30,000 |
| Pro 2 | $75 | $33.8 | $398 | 6,000 | 60,000 |
| Pro 3 | $125 | $68.4 | $796 | 10,000 | 120,000 |
| Pro 4 | $249 | $137.5 | $1,592 | 20,000 | 240,000 |
Jste připraveni vytěžovat Substack pomocí AI
- Instalace:
- Produkt:
❓ FAQ
-
Co je AI Powered Substack Scraper?
AI Powered Substack Scraper je , který získává strukturovaná data ze stránek Substacku, jako je Discover nebo seznamy publikací. Otevřete stránku, kliknete na AI Suggest Columns a Thunderbit připraví schéma vhodné pro tabulku a vytěží data do řádků, které můžete exportovat. -
Co je Thunderbit?
je AI rozšíření pro Chrome zaměřené na web scraping a produktivitu. Pomáhá sbírat data z webů, PDF i obrázků a převádět je do strukturovaných datasetů. Je navržené pro business použití jako lead generation, průzkum trhu, ecommerce operace nebo realitní segment, s rychlým exportem do nástrojů jako Google Sheets, Airtable a Notion. -
Jaké stránky Substacku mohu s Thunderbitem vytěžit?
Můžete vytěžovat řadu veřejných stránek Substacku, včetně , kurátorovaných resource stránek i jednotlivých stránek publikací. Pokud je potřeba přihlášení, často pomůže Browser Scraping, aby Thunderbit fungoval přímo ve vašem přihlášeném Chrome sezení. -
Umí Thunderbit vytěžit podstránky publikací pro více detailů?
Ano. Funkce Subpage Scraping umí navštívit každou URL publikace, kterou jste získali ze seznamu, a doplnit do tabulky další pole. To se hodí, když listovací stránka ukazuje jen krátký popis, ale stránka publikace obsahuje bohatší metadata, která chcete zachytit. -
Jak vybrat správné sloupce pro scraping Substacku?
Začněte s AI Suggest Columns a pak upravte názvy polí i datové typy podle svého workflow. Do sloupce můžete přidat i Field AI Prompt, který AI navede, jak data vytahovat nebo formátovat — například sjednotit kategorie nebo vytěžit „čisté“ jméno autora. -
Mohu data ze Substacku exportovat do Google Sheets, Airtable nebo Notion?
Ano — a export je zdarma. Po scrapingu si můžete stáhnout CSV/JSON nebo dataset poslat přímo do Google Sheets, Airtable či Notion pro spolupráci, filtrování a další obohacení. -
Jaký je rozdíl mezi Cloud Scraping a Browser Scraping pro Substack?
Cloud Scraping je rychlejší a hodí se pro veřejné stránky bez přihlášení. Browser Scraping běží ve vašem Chrome sezení a je lepší, když potřebujete přístup za přihlášením nebo chcete, aby se scraper choval přesně jako váš prohlížeč. -
Kolik řádků mohu ze Substacku vytěžit v jednom běhu?
Praktický limit závisí na struktuře stránky, stránkování/infinite scroll a kreditech ve vašem tarifu. Často se ale cílí na stovky řádků najednou (typicky až kolem 500 řádků na jeden běh). Pokud stránka používá infinite scroll nebo více stránek, Thunderbit zvládne stránkování a bude sbírat řádky dál, jak budete načítat další výsledky. -
Je scraping Substacku v pořádku?
Scrapeujte zodpovědně a dodržujte platné zákony, očekávání ohledně soukromí i podmínky Substacku. Thunderbit je nástroj pro strukturování dat, ke kterým máte přístup ve svém prohlížeči — a vy rozhodujete, co sbíráte a jak to používáte.
📚 Další zdroje
- Začněte s produktem:
- Instalace rozšíření:
- Návody a články:
- Základy:
- List scraping:
- Excel workflow:
- Extrakce z PDF:
- Best practices pro sběr e-mailů:
- Srovnání nástrojů:
