substack-scraper

Substack 스크래퍼

Thunderbit의 Substack 스크래퍼는 AI로 Substack Discover와 퍼블리케이션 페이지에서 구조화된 데이터를 손쉽게 추출할 수 있도록 도와줍니다. 뉴스레터 목록, 카테고리, 작성자, 구독자 관련 정보를 수집하고, 하위 페이지까지 추가로 스크래핑해 더 깊은 퍼블리케이션 정보를 보강할 수 있습니다. 결과는 몇 분 만에 Excel, Google Sheets, Airtable, Notion으로 내보낼 수 있습니다.
4.8
월간 사용자8.2k
AI 기반
뉴스
무료로 시작하기
무료 플랜 제공
한국어 지원

Thunderbit의 Substack 스크래퍼는 AI를 활용해 Substack 페이지를 깔끔한 구조화 데이터셋으로 변환해 줍니다. Substack Discover와 리소스/리더보드 형태의 페이지에서 뉴스레터 목록, 카테고리, 작성자, 퍼블리케이션 정보를 추출한 뒤, 하위 페이지를 추가로 스크래핑해 더 풍부한 정보로 데이터셋을 확장할 수 있습니다. AI 웹 스크래퍼 (https://thunderbit.com/ai-web-scraper)로 몇 분 안에 Excel, Google Sheets, Airtable, Notion으로 내보내세요.

🧠 Substack 스크래퍼란?

AI 기반 Substack 스크래퍼로, 에서 데이터를 매우 간단한 흐름으로 수집할 수 있습니다. 페이지를 열고 AI Suggest Columns를 누른 다음 Scrape를 클릭하면 끝입니다. Thunderbit의 AI가 페이지 레이아웃을 읽고 추출하기 좋은 필드를 추천해 주며, 다운로드하거나 다른 도구로 보낼 수 있는 표 형태로 데이터를 정리해 줍니다.

Substack — A new economic engine for culture

🧾 Substack에서 무엇을 스크래핑할 수 있나요?

Substack에는 리서치, 파트너십, 미디어 모니터링, 오디언스 확장에 활용할 수 있는 공개 정보가 풍부합니다. Thunderbit를 사용하면 Discover 같은 목록 페이지를 먼저 스크래핑한 뒤, Subpage Scraping으로 각 뉴스레터/퍼블리케이션 페이지를 방문해 목록 화면에서는 보이지 않는 상세 정보를 추가로 채워 넣을 수 있습니다.

아래는 Substack 스크래퍼로 자주 쓰이는 고가치 워크플로 2가지입니다.

🗞️ Substack Discover에서 뉴스레터 스크래핑하기

에서 뉴스레터 데이터베이스를 만들 때 유용합니다. 주제별 퍼블리케이션을 찾거나, 스폰서십 파트너 후보를 평가하거나, 카테고리별 트렌드를 추적하고 싶을 때 특히 효과적입니다.

Scrape Newsletters from Substack Discover

Steps:

  1. 을 설치하고 계정을 등록합니다.
  2. 대상 페이지로 이동합니다. 예: .
  3. AI Suggest Columns를 클릭해 AI가 컬럼명과 데이터 유형을 추천하도록 합니다.
  4. Scrape를 클릭해 스크래핑을 실행한 뒤 Excel, Google Sheets, Airtable, Notion으로 내보냅니다.

Column names

ColumnDescription
📰 뉴스레터 / 퍼블리케이션 이름Discover에 표시되는 뉴스레터 또는 퍼블리케이션 이름입니다.
🔗 퍼블리케이션 URL퍼블리케이션 페이지로 연결되는 링크(하위 페이지 보강에 유용)입니다.
✍️ 작성자 / 크리에이터표시되는 경우, 퍼블리케이션을 운영하는 작성자 또는 브랜드입니다.
🏷️ 카테고리 / 주제목록에 연결된 카테고리 태그(예: Tech, Politics, Culture)입니다.
📝 설명목록에 표시되는 짧은 소개/요약 문구입니다.
👥 구독자 수표시되는 경우의 구독자 수(또는 비워두고 하위 페이지에서 보강)입니다.
🖼️ 퍼블리케이션 이미지퍼블리케이션 로고/커버 이미지 URL입니다.
추천 / 랭킹 라벨추천 배지, 트렌딩 라벨, 노출 위치 등 페이지에 표시되는 표식입니다.

🏆 Substack 리더보드(리소스)에서 상위 퍼블리케이션 스크래핑하기

Substack의 리소스/리더보드 형태 페이지인 에서 큐레이션된 퍼블리케이션 목록을 추출할 때 적합합니다. 경쟁사 리서치, 파트너십 아웃리치, 니치별 미디어 지형도 리스트를 만들 때 도움이 됩니다.

Scrape Top Publications from Substack Leaderboard

Steps:

  1. 을 설치하고 계정을 등록합니다.
  2. 대상 페이지로 이동합니다. 예: .
  3. AI Suggest Columns를 클릭해 해당 레이아웃에 맞는 추천 필드를 생성합니다.
  4. Scrape를 클릭해 표 데이터를 추출한 뒤 다운로드하거나 내보냅니다.

Column names

ColumnDescription
🏷️ 퍼블리케이션 이름페이지에 표시된 퍼블리케이션 이름입니다.
🔗 퍼블리케이션 URL퍼블리케이션으로 바로 가는 링크(하위 페이지 스크래핑에 최적)입니다.
🧑‍💼 작성자 / 팀표시되는 경우, 작성자 이름 또는 운영 조직입니다.
🗂️ 카테고리 / 컬렉션해당 퍼블리케이션이 속한 섹션/그룹(해당 시)입니다.
📝 요약짧은 소개 또는 포지셔닝 문구입니다.
👥 구독자 / 오디언스페이지에 표시되는 오디언스 규모 지표입니다.
🖼️ 로고 / 이미지퍼블리케이션 로고 또는 썸네일 이미지 URL입니다.
🕒 최근 업데이트 / 최신성페이지에 표시되는 최신성 신호(또는 가능하면 하위 페이지에서 추출)입니다.

🎯 Substack 도구를 사용해야 하는 이유

Substack 스크래핑은 분석, 아웃리치, 모니터링을 위해 데이터를 구조화해야 하는 실제 비즈니스 업무에 큰 도움이 됩니다.

로 Substack을 스크래핑하는 대표적인 이유:

  • 마케팅 & 파트너십: 스폰서십 제안, 크로스 프로모션, 제휴 파트너십을 위한 뉴스레터 리스트를 구축할 수 있습니다. 하위 페이지를 스크래핑해 연락처 링크나 퍼블리케이션 상세 정보를 추가로 보강할 수도 있습니다.
  • 세일즈 & 리드 발굴: ICP에 맞는 크리에이터/니치 퍼블리케이션을 찾아 Google Sheets나 Airtable로 내보내 파이프라인을 구성할 수 있습니다.
  • 미디어 리서치 & 경쟁 분석: 카테고리, 포지셔닝, 성장 신호를 추적해 어떤 퍼블리케이션이 주목받는지 파악할 수 있습니다.
  • 콘텐츠 전략: 뉴스레터 주제와 설명을 매핑해 공백 영역, 떠오르는 테마, 오디언스 세그먼트를 찾을 수 있습니다.

Thunderbit가 특히 유용한 경우:

  • 페이지 레이아웃이 자주 바뀌어 기존 스크래퍼가 쉽게 깨질 때
  • Subpage Scraping으로 각 행에 더 깊은 퍼블리케이션 정보를 덧붙이고 싶을 때
  • 이미 쓰고 있는 도구(Sheets, Airtable, Notion)로 빠르게 내보내고 싶을 때

스크래핑이 처음이라면 아래 가이드가 도움이 됩니다:

🧩 Substack Chrome Extension 사용 방법

  1. Thunderbit Chrome Extension 설치: 에서 설치하고 계정을 생성합니다.
  2. 스크래핑할 Substack 페이지로 이동: 예: 또는 .
  3. AI 기반 스크래퍼 실행: AI Suggest Columns를 클릭해 컬럼명을 생성하고 필요한 필드를 조정한 뒤 Scrape를 클릭합니다.

Tip: 첫 스크래핑 이후 Scrape Subpages를 사용하면 Thunderbit가 각 퍼블리케이션 URL을 방문해 추가 필드(확장 설명, 작성자 상세, 링크, 기타 화면에 보이는 메타데이터 등)를 표에 이어 붙여 줍니다.

💳 Substack 요금 안내

Thunderbit는 이해하기 쉬운 크레딧 시스템을 사용합니다:

  • 결과 테이블에서 1 크레딧 = 1개 출력 행
  • AI 기반 스크래퍼(AI Suggest Columns + Scrape)는 처음부터 사용할 수 있으며, 데이터 내보내기는 무료입니다(CSV/JSON, Excel, Google Sheets, Airtable, Notion).

Thunderbit는 무료로도 시작할 수 있습니다:

  • 무료 플랜: 월 6페이지 스크래핑
  • 무료 체험: 유료 플랜 선택 전 10페이지 무료 스크래핑

예를 들어 Substack Discover에서 뉴스레터 200행을 수집했다면, 해당 실행은 대략 200 크레딧이 사용됩니다. 이후 하위 페이지 스크래핑으로 각 행을 보강하면, 최종적으로 출력되는 보강 행 수에 따라 총 크레딧이 달라집니다.

유료 플랜(월간/연간)은 사용량 규모에 맞춰 구성되어 있으며, 연간 플랜은 보통 월별 결제 대비 할인이 적용되어 더 경제적입니다. 자세한 내용은 에서 확인하세요.

TierPricing (Monthly)Pricing (Yearly)Yearly Total PriceCredits (Monthly)Credits (Yearly)
FreeFreeFreeFree6 pagesN/A
Starter$15$9$1085005,000
Pro 1$38$16.5$1993,00030,000
Pro 2$75$33.8$3986,00060,000
Pro 3$125$68.4$79610,000120,000
Pro 4$249$137.5$1,59220,000240,000

AI로 Substack 스크래핑을 시작할 준비가 되셨나요?

  • 설치:
  • 제품:

❓ FAQ

  1. AI 기반 Substack 스크래퍼란 무엇인가요?
    AI 기반 Substack 스크래퍼는 로, Discover나 퍼블리케이션 목록 같은 Substack 페이지에서 구조화된 데이터를 추출합니다. 페이지를 열고 AI Suggest Columns를 누르면 Thunderbit가 표에 맞는 스키마를 만들고, 내보낼 수 있는 행 단위 데이터로 수집해 줍니다.

  2. Thunderbit는 무엇인가요?
    는 웹사이트, PDF, 이미지에서 데이터를 수집해 구조화 데이터셋으로 바꿔주는 AI 웹 스크래핑 & 생산성 Chrome Extension입니다. 리드 발굴, 시장 조사, 이커머스 운영, 부동산 등 비즈니스 워크플로에 맞춰 설계되었고, Google Sheets, Airtable, Notion 같은 도구로 빠르게 내보낼 수 있습니다.

  3. Thunderbit로 어떤 Substack 페이지를 스크래핑할 수 있나요?
    , 큐레이션된 리소스 페이지, 개별 퍼블리케이션 페이지 등 다양한 공개 Substack 페이지를 스크래핑할 수 있습니다. 로그인이 필요한 페이지라면, 종종 Browser Scraping을 사용해 로그인된 Chrome 세션 안에서 그대로 동작하게 할 수 있습니다.

  4. 퍼블리케이션 하위 페이지를 스크래핑해 더 많은 정보를 가져올 수 있나요?
    가능합니다. Thunderbit의 Subpage Scraping은 목록 페이지에서 수집한 각 퍼블리케이션 URL을 방문해 추가 필드를 표에 덧붙일 수 있습니다. 목록에는 짧은 설명만 보이지만, 퍼블리케이션 페이지에는 더 풍부한 메타데이터가 있을 때 특히 유용합니다.

  5. Substack 스크래핑에 적합한 컬럼은 어떻게 고르나요?
    먼저 AI Suggest Columns로 시작한 뒤, 업무 목적에 맞게 필드명과 데이터 유형을 조정하세요. 또한 카테고리 표준화나 작성자 이름 정리처럼 추출/포맷을 유도하고 싶다면 컬럼에 Field AI Prompt를 추가할 수도 있습니다.

  6. Substack 데이터를 Google Sheets, Airtable, Notion으로 내보낼 수 있나요?
    네, 가능하며 내보내기는 무료입니다. 스크래핑 후 CSV/JSON을 다운로드하거나, 데이터셋을 Google Sheets, Airtable, Notion으로 바로 전송해 협업/필터링/추가 보강에 활용할 수 있습니다.

  7. Substack에서 Cloud Scraping과 Browser Scraping의 차이는 무엇인가요?
    Cloud Scraping은 더 빠르게 실행되며 로그인 없이 접근 가능한 공개 페이지에 적합합니다. Browser Scraping은 Chrome 세션에서 실행되므로 인증 뒤에 있는 페이지에 접근해야 하거나, 브라우저와 동일한 방식으로 동작시키고 싶을 때 더 좋습니다.

  8. 한 번에 Substack에서 몇 행까지 스크래핑할 수 있나요?
    실제 한도는 페이지 구조, 페이지네이션/무한 스크롤, 그리고 플랜 크레딧에 따라 달라집니다. 다만 많은 워크플로가 한 번에 수백 행(일반적으로 약 500행 수준)을 목표로 합니다. 무한 스크롤이나 여러 페이지로 구성된 경우에도 Thunderbit는 페이지네이션을 처리하며 더 많은 결과를 로드하는 동안 계속 행을 수집할 수 있습니다.

  9. Substack을 스크래핑해도 괜찮나요?
    책임감 있게 스크래핑하고, 관련 법규와 개인정보 기대 수준, Substack의 약관을 준수해야 합니다. Thunderbit는 브라우저에서 접근 가능한 데이터를 구조화하는 도구이며, 무엇을 수집하고 어떻게 활용할지는 사용자가 직접 통제합니다.

📚 더 알아보기

  • 제품 시작하기:
  • 확장 프로그램 설치:
  • 에서 가이드 읽기
  • 기본 개념:
  • 리스트 스크래핑 개념:
  • Excel 워크플로:
  • PDF 추출:
  • 이메일 수집 베스트 프랙티스:
  • 도구 비교: