Thunderbit 的 Substack 爬蟲 透過 AI,能把 Substack 頁面快速整理成乾淨、可用的結構化資料集。你可以從 Substack Discover 與各種資源/排行榜型頁面擷取電子報清單、分類、作者與出版品資訊,接著再用子頁面爬取補強更深入的細節。搭配 人工智慧網頁爬蟲 (https://thunderbit.com/ai-web-scraper),幾分鐘內就能把資料匯出到 Excel、Google Sheets、Airtable 或 Notion。
🧠 什麼是 Substack 爬蟲
AI 驅動的 Substack 爬蟲 是一款 ,讓你用非常直覺的流程抓取 的資料:打開頁面 → 點擊 AI Suggest Columns → 再點 Scrape。Thunderbit 的 AI 會自動理解頁面版型,建議最適合擷取的欄位,並把資料整理成表格,方便你下載或直接同步到常用工具。

🧾 可以用 Substack 抓到哪些資料
Substack 上有大量公開且具價值的資訊,適合用於研究、合作開發、媒體監測與受眾經營。使用 Thunderbit 時,你可以先抓取清單頁(例如 Discover),再透過 Subpage Scraping 逐一開啟每個電子報/出版品頁面,把清單頁看不到的細節補進資料集。
下面是兩個最常見、也最有價值的 Substack 爬取情境。
🗞️ 從 Substack Discover 抓取電子報清單
這個流程適合用來建立 的電子報資料庫。當你想依主題找出版品、評估潛在贊助/合作對象,或追蹤各分類的熱門趨勢時特別好用。

操作步驟:
- 下載 並註冊帳號。
- 前往目標頁面,例如:。
- 點擊 AI Suggest Columns,讓 AI 推薦欄位名稱與資料類型。
- 點擊 Scrape 開始抓取,接著匯出到 Excel、Google Sheets、Airtable 或 Notion。
欄位名稱
| 欄位 | 說明 |
|---|---|
| 📰 電子報 / 出版品名稱 | Discover 清單中顯示的電子報或出版品名稱。 |
| 🔗 出版品 URL | 連到出版品頁面的網址(很適合用來做子頁面補強)。 |
| ✍️ 作者 / 創作者 | 清單中顯示的作者或品牌名稱(若有)。 |
| 🏷️ 分類 / 主題 | 該項目所屬的分類標籤(例如:Tech、Politics、Culture)。 |
| 📝 簡介 | 清單中顯示的短摘要/定位描述。 |
| 👥 訂閱者數 | 若頁面有顯示訂閱數就擷取;若未顯示可留空並用子頁面補抓。 |
| 🖼️ 出版品圖片 | 出版品的 Logo/封面圖片 URL。 |
| ⭐ 精選 / 排名標記 | 頁面上出現的精選徽章、熱門標籤或排名/位置提示。 |
🏆 從 Substack Leaderboard(Resources)抓取熱門出版品
此流程用於從 Substack 的資源/排行榜型頁面擷取精選出版品清單:。適合做競品研究、合作開發名單整理,或依利基市場建立媒體版圖清單。

操作步驟:
- 下載 並註冊帳號。
- 前往目標頁面,例如:。
- 點擊 AI Suggest Columns,依此頁面版型產生建議欄位。
- 點擊 Scrape 擷取表格,接著下載或匯出資料。
欄位名稱
| 欄位 | 說明 |
|---|---|
| 🏷️ 出版品名稱 | 頁面上列出的出版品名稱。 |
| 🔗 出版品 URL | 直達出版品的連結(非常適合做子頁面爬取)。 |
| 🧑💼 作者 / 團隊 | 出版品背後的作者姓名或組織(若有顯示)。 |
| 🗂️ 分類 / 集合 | 出版品所屬的區塊或分組(若適用)。 |
| 📝 摘要 | 短版描述或定位文字。 |
| 👥 訂閱者 / 受眾規模 | 頁面上顯示的受眾規模指標(若有)。 |
| 🖼️ Logo / 圖片 | 出版品 Logo 或縮圖圖片 URL。 |
| 🕒 最近更新 / 新鮮度 | 頁面上顯示的更新/新鮮度訊號(或可從子頁面擷取)。 |
🎯 為什麼要用 Substack 工具
抓取 Substack 的資料能支援許多實際的商務情境,特別是當你需要把資訊整理成可分析、可外聯或可監測的結構化資料時。
常見使用 來抓取 Substack 的原因包括:
- 行銷與合作:建立可用於贊助洽談、互推或聯盟合作的電子報名單;並可透過子頁面爬取補上聯絡連結與出版品細節。
- 銷售與名單開發:找出符合 ICP 的創作者與利基出版品,匯出到 Google Sheets 或 Airtable 以建立銷售管線。
- 媒體研究與競品分析:追蹤各出版品的分類、定位與成長訊號,掌握哪些內容正在起勢。
- 內容策略:整理電子報主題與描述,找出內容缺口、新興議題與受眾分群。
Thunderbit 特別適合以下情況:
- 頁面版型常變動,傳統爬蟲容易失效
- 你需要用 Subpage Scraping 為每一列補齊更深入的出版品資訊
- 你希望快速匯出到既有工具(Sheets、Airtable、Notion)
如果你剛開始接觸爬取,以下指南會很有幫助:
🧩 如何使用 Substack Chrome 擴充功能
- 安裝 Thunderbit Chrome 擴充功能:到 下載並建立帳號。
- 前往你想抓取的 Substack 頁面:例如 或 。
- 啟用 AI 驅動爬取:點擊 AI Suggest Columns 產生欄位名稱,視需求調整後再點 Scrape。
小提示:第一次抓取完成後,可以使用 Scrape Subpages,讓 Thunderbit 逐一造訪每個出版品 URL,並把額外欄位(例如更完整的描述、作者細節、連結或其他可見的中繼資料)回填到同一張表格中。
💳 Substack 爬取的計費方式
Thunderbit 採用簡單易懂的點數機制:
- 1 點數 = 結果表格中的 1 列輸出。
- AI 驅動爬取(AI Suggest Columns + Scrape)從一開始就能使用,且資料匯出免費(CSV/JSON、Excel、Google Sheets、Airtable、Notion)。
你可以免費試用 Thunderbit:
- 免費方案:每月可抓取 6 個頁面
- 免費試用:在選擇付費方案前,可先免費抓取 10 個頁面
例如你抓取 Substack Discover 得到 200 列電子報資料,這次執行大約會消耗 200 點數。若你再用子頁面爬取為這些列補強資訊,總點數會依你最終輸出的補強列數而定。
付費方案(按月/按年)可對應不同的使用量;通常年繳更划算,因為相較月繳會有折扣。完整資訊請見 。
| 方案 | 月付價格 | 年付價格 | 年付總價 | 每月點數 | 每年點數 |
|---|---|---|---|---|---|
| Free | Free | Free | Free | 6 pages | N/A |
| Starter | $15 | $9 | $108 | 500 | 5,000 |
| Pro 1 | $38 | $16.5 | $199 | 3,000 | 30,000 |
| Pro 2 | $75 | $33.8 | $398 | 6,000 | 60,000 |
| Pro 3 | $125 | $68.4 | $796 | 10,000 | 120,000 |
| Pro 4 | $249 | $137.5 | $1,592 | 20,000 | 240,000 |
準備用 AI 抓取 Substack 了嗎
- 安裝:
- 產品:
❓ 常見問題(FAQ)
-
什麼是 AI 驅動的 Substack 爬蟲?
AI 驅動的 Substack 爬蟲是一款 ,可從 Discover、出版品清單等 Substack 頁面擷取結構化資料。你只要打開頁面、點擊 AI Suggest Columns,Thunderbit 就會產生可直接成表的欄位結構,並把資料抓成可匯出的列資料。 -
Thunderbit 是什麼?
是一款結合 AI 的網頁爬取與效率工具 Chrome 擴充功能,能從網站、PDF 與圖片收集資料並整理成結構化資料集。它面向名單開發、市場研究、電商營運與房地產等商務流程設計,並可快速匯出到 Google Sheets、Airtable、Notion 等工具。 -
Thunderbit 可以抓取哪些 Substack 頁面?
你可以抓取多種公開的 Substack 頁面,包括 、精選資源頁,以及單一出版品頁面。若頁面需要登入,通常可改用 Browser Scraping,讓 Thunderbit 在你已登入的 Chrome 工作階段中運作。 -
Thunderbit 能爬取出版品子頁面以取得更多細節嗎?
可以。Thunderbit 的 Subpage Scraping 能逐一造訪你從清單頁收集到的出版品 URL,並把更多欄位追加回同一張表格。當清單頁只顯示短描述、但出版品頁有更豐富的中繼資料時,這個功能特別實用。 -
我該如何選擇適合的 Substack 擷取欄位?
建議先用 AI Suggest Columns 起步,再依你的工作需求調整欄位名稱與資料類型。你也可以在欄位加入 Field AI Prompt 來引導擷取或格式化,例如統一分類命名、或抽取乾淨的作者姓名。 -
可以把 Substack 資料匯出到 Google Sheets、Airtable 或 Notion 嗎?
可以,而且匯出免費。抓取完成後,你可以下載 CSV/JSON,或直接把資料集同步到 Google Sheets、Airtable、Notion,方便協作、篩選與後續補強。 -
Substack 的 Cloud Scraping 與 Browser Scraping 有什麼差別?
Cloud Scraping 速度更快,適合不需登入的公開頁面。Browser Scraping 則在你的 Chrome 工作階段中執行,當你需要存取登入後內容,或希望爬蟲行為完全比照瀏覽器時會更合適。 -
一次可以從 Substack 抓取多少列資料?
實際上限取決於頁面結構、分頁/無限捲動機制,以及你的方案點數;多數情境會一次抓取數百列(常見約到 500 列左右)。若頁面採無限捲動或多頁結果,Thunderbit 也能處理分頁並在你載入更多結果時持續收集。 -
抓取 Substack 合適嗎?
請以負責任的方式抓取,並遵守適用法律、隱私期待與 Substack 的使用條款。Thunderbit 的定位是把你在瀏覽器中可存取的資料整理成結構化內容;你可以自行決定要收集哪些資料,以及如何使用。
📚 延伸閱讀
- 產品上手:
- 安裝擴充功能:
- 閱讀教學:
- 基礎概念:
- 清單爬取:
- Excel 流程:
- PDF 擷取:
- Email 蒐集最佳實務:
- 工具比較:
