substack-scraper

Скрапер Substack

Скрапер Substack от Thunderbit помогает с помощью ИИ превращать страницы Substack Discover и страницы публикаций в структурированные данные. Собирайте списки рассылок, категории, авторов и сведения о подписчиках, а затем дополняйте результаты, переходя на подстраницы для более подробной информации о публикациях. Экспортируйте данные в Excel, Google Sheets, Airtable или Notion за считанные минуты.
4.8
Пользователей в месяц8.2k
На базе AI
Новости
Начать бесплатно
Доступен бесплатный тариф

Скрапер Substack Scraper от Thunderbit помогает с помощью ИИ превращать страницы Substack в аккуратные, структурированные наборы данных. Вы можете извлекать списки рассылок, категории, авторов и сведения о публикациях из Substack Discover и страниц в формате подборок/рейтингов, а затем расширять датасет, собирая данные с подстраниц для более глубоких деталей. Экспортируйте данные в Excel, Google Sheets, Airtable или Notion за несколько минут с AI Web Scraper (https://thunderbit.com/ai-web-scraper).

🧠 Что такое Substack Scraper

Substack Scraper на базе ИИ — это , который позволяет собирать данные с по простому сценарию: откройте страницу, нажмите AI Suggest Columns, затем нажмите Scrape. ИИ Thunderbit анализирует структуру страницы, предлагает оптимальные поля для извлечения и формирует таблицу, которую можно скачать или отправить в ваши рабочие инструменты.

Substack — A new economic engine for culture

🧾 Что можно собирать с Substack

В Substack много ценной публичной информации для исследований, партнёрств, мониторинга медиа и развития аудитории. С Thunderbit вы можете собирать данные со страниц-списков (например, Discover), а затем использовать Subpage Scraping, чтобы перейти на страницу каждой рассылки/публикации и дополнить таблицу деталями, которых не видно в списке.

Ниже — два самых распространённых и полезных сценария работы со Substack Scraper.

🗞️ Сбор рассылок со страницы Substack Discover

Этот сценарий подходит, чтобы собрать базу рассылок со страницы . Полезно, если вы ищете публикации по темам, оцениваете потенциальных партнёров для спонсорства или отслеживаете тренды по категориям.

Scrape Newsletters from Substack Discover

Шаги:

  1. Установите и зарегистрируйте аккаунт.
  2. Откройте нужную страницу, например: .
  3. Нажмите AI Suggest Columns, чтобы ИИ предложил названия колонок и типы данных.
  4. Нажмите Scrape, запустите сбор и экспортируйте в Excel, Google Sheets, Airtable или Notion.

Названия колонок

КолонкаОписание
📰 Название рассылки / публикацииНазвание рассылки или публикации, отображаемое в Discover.
🔗 URL публикацииСсылка на страницу публикации (удобно для обогащения через подстраницы).
✍️ Автор / создательАвтор или бренд, стоящий за публикацией (если указан).
🏷️ Категория / темаТеги категории, связанные с карточкой (например, Tech, Politics, Culture).
📝 ОписаниеКороткое описание/позиционирование из списка.
👥 Количество подписчиковЧисло подписчиков, если показано (или оставьте пустым и дополните через подстраницы).
🖼️ Изображение публикацииURL логотипа/обложки публикации.
Метка “избранное” / рейтингБейджи, отметки “в тренде” или индикаторы позиции на странице.

🏆 Сбор топ-публикаций со страницы Substack Leaderboard (Resources)

Этот сценарий помогает извлечь подборку публикаций со страницы ресурсов/рейтинга Substack: . Подходит для конкурентного анализа, партнёрского аутрича и составления карты медиа по нишам.

Scrape Top Publications from Substack Leaderboard

Шаги:

  1. Установите и зарегистрируйте аккаунт.
  2. Откройте нужную страницу, например: .
  3. Нажмите AI Suggest Columns, чтобы сгенерировать рекомендуемые поля под этот макет.
  4. Нажмите Scrape, извлеките таблицу и скачайте или экспортируйте данные.

Названия колонок

КолонкаОписание
🏷️ Название публикацииНазвание публикации, указанное на странице.
🔗 URL публикацииПрямая ссылка на публикацию (идеально для сбора с подстраниц).
🧑‍💼 Автор / командаИмя автора(ов) или организация, стоящая за публикацией (если указано).
🗂️ Категория / подборкаРаздел или группа, в которой показана публикация (если применимо).
📝 Краткое описаниеКороткое описание или позиционирование.
👥 Подписчики / аудиторияЛюбой индикатор размера аудитории, отображаемый на странице.
🖼️ Логотип / изображениеURL логотипа или миниатюры публикации.
🕒 Обновление / актуальностьЛюбой сигнал “свежести” (или извлеките с подстраниц, если доступно).

🎯 Зачем использовать инструмент для Substack

Сбор данных с Substack помогает решать прикладные бизнес-задачи — особенно когда нужны структурированные данные для анализа, аутрича или мониторинга.

Типичные причины собирать данные с Substack с помощью :

  • Маркетинг и партнёрства: соберите список рассылок для спонсорских интеграций, кросс-промо или партнёрских программ. Список можно обогатить, собрав с подстраниц контактные ссылки и детали публикации.
  • Продажи и лидогенерация: находите авторов и нишевые публикации, подходящие под ваш ICP, и выгружайте в Google Sheets или Airtable для построения воронки.
  • Медиа-исследования и конкурентный анализ: отслеживайте категории, позиционирование и сигналы роста, чтобы понимать, что набирает популярность.
  • Контент-стратегия: сопоставляйте темы и описания рассылок, чтобы находить пробелы, новые тренды и сегменты аудитории.

Thunderbit особенно удобен, когда:

  • Макет страницы часто меняется, и классические скраперы “ломаются”
  • Нужно Subpage Scraping, чтобы дополнять каждую строку более подробной информацией о публикации
  • Важно быстро экспортировать в привычные инструменты (Sheets, Airtable, Notion)

Если вы только начинаете, помогут эти материалы:

🧩 Как пользоваться расширением Substack для Chrome

  1. Установите Thunderbit Chrome Extension: скачайте в и создайте аккаунт.
  2. Перейдите на страницу Substack, с которой хотите собрать данные: например, или .
  3. Запустите скрапер на базе ИИ: нажмите AI Suggest Columns, при необходимости отредактируйте поля, затем нажмите Scrape.

Совет: после первого сбора используйте Scrape Subpages, чтобы Thunderbit открыл URL каждой публикации и добавил в таблицу дополнительные поля (например, расширенное описание, данные об авторе, ссылки или другие видимые метаданные).

💳 Цены для Substack

В Thunderbit используется простая система кредитов:

  • 1 кредит = 1 строка результата в вашей таблице.
  • Режим AI Powered Scraper (AI Suggest Columns + Scrape) доступен сразу, а экспорт данных бесплатный (CSV/JSON, Excel, Google Sheets, Airtable, Notion).

Попробовать Thunderbit можно бесплатно:

  • Бесплатный тариф: сбор 6 страниц в месяц
  • Бесплатный пробный период: сбор 10 страниц бесплатно перед выбором платного плана

Если вы собрали 200 строк рассылок из Substack Discover — это примерно 200 кредитов за запуск. Если затем вы обогатите эти строки через сбор с подстраниц, итоговое число кредитов будет зависеть от того, сколько обогащённых строк вы получите на выходе.

Платные планы (помесячно и ежегодно) рассчитаны на разные объёмы, а годовая подписка обычно выгоднее, потому что включает скидку по сравнению с оплатой помесячно. Подробности — на странице .

ТарифЦена (в месяц)Цена (в год)Итого за годКредиты (в месяц)Кредиты (в год)
FreeFreeFreeFree6 страницN/A
Starter$15$9$1085005,000
Pro 1$38$16.5$1993,00030,000
Pro 2$75$33.8$3986,00060,000
Pro 3$125$68.4$79610,000120,000
Pro 4$249$137.5$1,59220,000240,000

Готовы собирать данные с Substack с помощью ИИ

  • Установка:
  • Продукт:

❓ FAQ

  1. Что такое AI Powered Substack Scraper?
    AI Powered Substack Scraper — это , который извлекает структурированные данные со страниц Substack, таких как Discover и списки публикаций. Вы открываете страницу, нажимаете AI Suggest Columns, и Thunderbit формирует схему “под таблицу” и собирает данные в строки, которые можно экспортировать.

  2. Что такое Thunderbit?
    — это Chrome-расширение для веб-скрапинга и повышения продуктивности на базе ИИ. Оно помогает собирать данные с сайтов, PDF и изображений и превращать их в структурированные наборы данных. Инструмент ориентирован на бизнес-задачи: лидогенерацию, исследование рынка, e-commerce операции и недвижимость, с быстрым экспортом в Google Sheets, Airtable и Notion.

  3. Какие страницы Substack можно собирать с Thunderbit?
    Можно собирать данные со многих публичных страниц Substack, включая , подборки ресурсов и отдельные страницы публикаций. Если страница требует входа, часто помогает Browser Scraping — Thunderbit работает прямо в вашей авторизованной сессии Chrome.

  4. Может ли Thunderbit собирать данные с подстраниц публикаций для большей детализации?
    Да. Функция Subpage Scraping может перейти по каждому URL публикации, собранному со страницы-списка, и добавить дополнительные поля в вашу таблицу. Это полезно, когда в списке есть только короткое описание, а на странице публикации — более богатые метаданные.

  5. Как выбрать правильные колонки для сбора данных с Substack?
    Начните с AI Suggest Columns, затем подстройте названия полей и типы данных под вашу задачу. Также можно добавить к колонке Field AI Prompt, чтобы направить извлечение или форматирование — например, нормализовать категории или получить “чистое” имя автора.

  6. Можно ли экспортировать данные Substack в Google Sheets, Airtable или Notion?
    Да, и экспорт бесплатный. После сбора вы можете скачать CSV/JSON или отправить датасет напрямую в Google Sheets, Airtable или Notion для совместной работы, фильтрации и дальнейшего обогащения.

  7. В чём разница между Cloud Scraping и Browser Scraping для Substack?
    Cloud Scraping работает быстрее и отлично подходит для публичных страниц без авторизации. Browser Scraping выполняется в вашей сессии Chrome и лучше, когда нужен доступ к страницам за логином или когда важно, чтобы скрапер вёл себя точно как ваш браузер.

  8. Сколько строк можно собрать с Substack за один запуск?
    Практический предел зависит от структуры страницы, пагинации/бесконечной прокрутки и кредитов вашего плана, но во многих сценариях собирают сотни строк за раз (часто до ~500 строк за типичный запуск). Если используется infinite scroll или несколько страниц, Thunderbit может работать с пагинацией и продолжать сбор по мере загрузки новых результатов.

  9. Можно ли собирать данные с Substack?
    Делайте это ответственно: соблюдайте применимые законы, ожидания по приватности и условия Substack. Thunderbit — инструмент для структурирования данных, доступных вам в браузере, а вы сами контролируете, что именно собираете и как используете.

📚 Узнать больше

  • Начать работу с продуктом:
  • Установить расширение:
  • Читать гайды в
  • База:
  • Про сбор списков:
  • Сценарий для Excel:
  • Извлечение из PDF:
  • Лучшие практики по сбору email:
  • Сравнение инструментов: