Thunderbit 的 WordPress.org 爬蟲 透過 AI 將 WordPress.org 頁面整理成乾淨、可用的結構化資料集。你可以擷取外掛目錄的統計資訊與區塊樣式庫的中繼資料,並匯出到 Excel、Google Sheets、Airtable 或 Notion。操作主打快速:點一下 AI Suggest Columns,再點 Scrape,就讓 AI 幫你把資料自動整理好。
🧩 什麼是 WordPress.org 爬蟲
WordPress.org 爬蟲 是一款 ,讓你用 AI 從 抓取資料——不需要寫程式。你只要打開想要的頁面(例如外掛目錄或樣式庫),按下 AI Suggest Columns 產生可直接使用的欄位結構,接著按 Scrape,就能把資料逐列收集成表格。

使用 Thunderbit,你也能透過 Subpage Scraping 逐一進入每個外掛或樣式的詳情頁,為資料集補上更深入的欄位(例如評分分佈、版本、最後更新、標籤、樣式分類等)。如果你剛開始接觸資料抓取,這兩篇很適合入門: 與 。
🗂️ 可以用 WordPress.org 抓取哪些資料
WordPress.org 有大量「結構清楚但分散在各處」的資訊:外掛列表、外掛詳情頁、樣式(Pattern)總覽與樣式詳情頁。Thunderbit 的 AI 會讀懂頁面版型並建議合適欄位,你再把結果匯出到日常使用的工作工具即可。
下面是兩種常見的抓取流程。
📈 抓取 WordPress 外掛市佔與成長
從 你可以抓取外掛表現指標並長期追蹤成長趨勢——非常適合競品研究、合作夥伴開發與產品規劃。

操作步驟:
- 下載 並註冊帳號。
- 前往目標頁面,例如:。
- 點擊 AI Suggest Columns,讓系統推薦欄位名稱。
- 點擊 Scrape 執行爬蟲、取得資料並下載檔案。
欄位名稱
| 欄位 | 說明 |
|---|---|
| 🧩 外掛名稱 | 目錄列表中顯示的外掛名稱。 |
| 🔗 外掛 URL | 外掛詳情頁連結(方便做子頁補全)。 |
| 🏷️ Slug | 外掛的 slug(常用於 URL 與內部識別)。 |
| ⭐ 評分 | 列表上顯示的平均星等。 |
| 🗳️ 評分數 | 參與評分/評論的數量。 |
| ⬇️ 啟用安裝數 | 目前啟用安裝數(重要採用度指標)。 |
| 🕒 最後更新 | 外掛顯示的「Last updated」時間。 |
| 🧑💻 作者 | 外掛作者或組織名稱。 |
| 🧾 簡短描述 | 列表卡片上的一句話摘要。 |
| 🏷️ 標籤 | 外掛相關標籤/分類(若有提供)。 |
| 🧠 已測試的 WP 版本 | 相容性資訊,例如「Tested up to」(多在子頁)。 |
| 🧱 需要的 PHP / WP | 需求條件欄位(常見於外掛詳情頁)。 |
| 🧾 目前版本 | 最新版本號(常見於外掛詳情頁)。 |
小提示: 抓完列表後,可用 Scrape Subpages 為每一列補上詳情頁欄位,例如完整描述、更新紀錄重點、支援統計與相容性等。若你要每週追蹤變化,搭配 Scheduled Scraper 建立時間序列會更方便。
🎨 抓取 WordPress 區塊樣式庫(Block Pattern Library)素材
從 你可以抓取樣式中繼資料,用於靈感蒐集、內容營運、佈景主題研究,或建立內部設計素材庫。

操作步驟:
- 下載 並註冊帳號。
- 前往目標頁面,例如:。
- 點擊 AI Suggest Columns,讓系統推薦欄位名稱。
- 點擊 Scrape 執行爬蟲、取得資料並下載檔案。
欄位名稱
| 欄位 | 說明 |
|---|---|
| 🧩 樣式名稱 | 樣式庫中顯示的標題。 |
| 🔗 樣式 URL | 樣式詳情頁連結,用於取得更完整的中繼資料。 |
| 🗂️ 分類 | 樣式分類(例如頁首、見證等),若頁面有顯示。 |
| 🏷️ 標籤 | 樣式相關標籤(常見於子頁)。 |
| 🖼️ 預覽圖片 | 樣式預覽縮圖的圖片 URL。 |
| 🧱 區塊類型 | 該樣式使用到的區塊類型(多在詳情頁)。 |
| 🧑🎨 作者 / 來源 | 若有提供,顯示署名或來源資訊。 |
| 📝 描述 | 簡短描述或摘要文字。 |
| 📄 樣式內容 | 樣式的標記/內容(建議從詳情頁擷取)。 |
| 🕒 最後更新 | 若頁面有提供,顯示更新時間。 |
小提示: 匯出到 Notion 或 Airtable 後,你可以建立可搜尋的內部樣式目錄。Thunderbit 支援圖片欄位,讓預覽在資料庫中仍能以視覺方式呈現。
🎯 為什麼要用 WordPress.org 工具
當你需要可重複、可分析的 結構化資料 來做分析、監控或素材蒐集時,抓取 WordPress.org 特別有價值——尤其是當手動複製貼上變成固定例行工作。
團隊常見的使用情境:
- 產品與成長團隊:追蹤外掛採用度指標(啟用安裝數、評分、更新頻率),掌握類別龍頭與新興工具。
- 電商與代理商:為客戶技術堆疊建立外掛清單、比較替代方案、整理相容性需求。
- 行銷團隊:鎖定合作對象(外掛作者/公司)、建立外聯名單、監控競品定位。
- 佈景與設計團隊:蒐集並分類區塊樣式,建立可重用素材庫,加速頁面製作。
- 研究與分析人員:建立跨分類、標籤與更新頻率的趨勢資料集。
Thunderbit 針對商務流程設計:可處理 分頁、支援 子頁補全,並能匯出到你已在使用的工具。更多技巧可參考: 與 。
🧭 如何使用 WordPress.org Chrome 擴充功能
- 安裝 Thunderbit Chrome 擴充功能:到 下載,並在 建立帳號。
- 前往 WordPress.org 目標頁:打開像是 的列表,或 。
- 啟用 AI 驅動的爬蟲:點擊 AI Suggest Columns 產生欄位名稱,調整資料類型(文字、數字、日期、URL、圖片),並可加入欄位擷取指示。
- 抓取並匯出:點擊 Scrape,再匯出到 Excel/CSV/JSON、Google Sheets、Airtable 或 Notion(匯出免費)。
若你想做長期監控(例如外掛安裝數或評分變化),可使用 Scheduled Scraper 依你設定的頻率自動執行。
💳 WordPress.org 的收費方式
Thunderbit 採用點數制:1 點 = 1 筆輸出列。例如你從列表抓取 200 個外掛,大約會使用 200 點(子頁補全只有在你建立額外表格時才可能增加更多列;若只是補全同一列,通常仍以你產生的輸出列數計算)。
免費可體驗內容:
- Free 方案:每月可抓取 6 頁(以頁數計算的免費額度)。
- 免費試用:在選擇付費方案前,可先免費抓取 10 頁。
- 可完整體驗 AI 驅動抓取(AI Suggest Columns + Scrape),快速驗證你的工作流程。
付費方案(月付/年付)會依使用量擴充;且 年付因折扣通常更划算。完整資訊請見 。
| 方案 | 月付價格 | 年付價格(每月) | 年付總價 | 點數(每月) | 點數(每年) |
|---|---|---|---|---|---|
| Free | Free | Free | Free | 6 pages | N/A |
| Starter | $15 | $9 | $108 | 500 | 5,000 |
| Pro 1 | $38 | $16.5 | $199 | 3,000 | 30,000 |
| Pro 2 | $75 | $33.8 | $398 | 6,000 | 60,000 |
| Pro 3 | $125 | $68.4 | $796 | 10,000 | 120,000 |
| Pro 4 | $249 | $137.5 | $1,592 | 20,000 | 240,000 |
❓ 常見問題
-
什麼是 AI Powered WordPress.org Scraper?
AI Powered WordPress.org Scraper 是 Thunderbit 內的一套流程,利用 AI 讀取 WordPress.org 頁面並轉成結構化表格。你先按 AI Suggest Columns 產生欄位,再按 Scrape 收集外掛或樣式資料並匯出。 -
Thunderbit 是什麼?
是一款 AI 網頁爬蟲與生產力 Chrome 擴充功能,可將網站、PDF、圖片中的資訊擷取成結構化格式。它特別適合需要快速設定、穩定擷取,並能輕鬆匯出到 Google Sheets、Airtable、Notion 等工具的商務團隊。 -
我可以抓取外掛詳情頁,而不只列表頁嗎?
可以。先抓取外掛列表(例如 Popular)後,你可用 Subpage Scraping 逐一進入每個外掛詳情頁,為表格補上版本、需求條件、最後更新等欄位。當列表頁資訊不足時特別實用。 -
Thunderbit 能處理 WordPress.org 目錄的分頁嗎?
可以。Thunderbit 支援分頁抓取,包括點擊式分頁與出現時的無限捲動。你不必手動翻頁,也能收集超過第一頁可見的資料。 -
WordPress.org 抓取結果可以匯出哪些格式?
你可以匯出 CSV/JSON 供本機使用,或直接送到 Excel、Google Sheets、Airtable、Notion。匯出設計以分析與營運為導向,方便你做儀表板、追蹤變化或建立內部目錄。 -
AI Suggest Columns 對外掛與樣式的欄位建議準確嗎?
多數情況下,AI Suggest Columns 能在幾秒內辨識列表卡片的主要欄位(名稱、URL、評分、安裝數、圖片)並提出可用的欄位結構。你也能自行調整欄位名稱、設定資料類型,或加入欄位指示以符合特定格式(例如只從「Active installs」中擷取數字)。 -
我可以自動監控外掛成長趨勢嗎?
可以。使用 Scheduled Scraper 依排程(每日/每週/每月)重複抓取同一個外掛列表,並匯出到試算表做時間序列追蹤。這是監控安裝數、評分變化與更新頻率的實用方法。 -
抓取 WordPress.org 合適嗎?
WordPress.org 多為公開頁面,許多團隊會蒐集公開網路資料用於研究與營運。不過你仍應檢視 WordPress.org 的使用條款並遵守適用法律、尊重網站速率限制,且避免蒐集敏感資料。 -
如果 WordPress.org 改版,我的爬蟲會失效嗎?
傳統爬蟲常因 HTML 結構變動而失效,但 Thunderbit 的 AI 每次執行都會依頁面語境重新理解內容,能適應不少版型更新。若頁面變動幅度較大,你只要重新執行 AI Suggest Columns,通常一分鐘內就能更新欄位結構。
📚 延伸閱讀
- 立即開始:
- 更多指南:
- 基礎概念:
- 大量抓取清單:
- 匯出到 Excel 的流程:
- 工具總覽:
- 收費方案:
- 教學與示範:
