上週,我們其中一位使用者傳訊給我們:「我需要 14 間競爭對手 Shopify 商店的價格、描述和變體資料,而且要在週五前交。」這大概是 4,000 個商品頁面。複製貼上?根本不可能。
如果你曾經想從 Shopify 商店抓取商品資料——像是價格、圖片、描述、變體、評論——你就知道那有多折磨。到了 2026 年,線上 Shopify 商店已經超過 ,而且沒有一家會提供「給外部人士匯出」按鈕。與此同時,表示他們會積極監控競爭對手定價;電商服務供應商也指出,就算只是手動上傳一個含變體與圖片的商品,也可能要花掉 。如果再乘上幾百個商品,你整整一週就沒了。
這也是為什麼 Shopify 爬蟲 Chrome 擴充功能,已經成為電商工具箱的標配——不論是競品研究、代發貨選品、目錄搬遷,或其他用途。不過,多數「最佳爬蟲」文章只會列功能,卻不會展示它們在真實 Shopify 商店上實際跑起來是什麼樣子。這篇不一樣。我拿八款擴充功能直接對真實店面測試,碰上真實的反機器人防線,最後找出哪些工具能拿到你需要的深度商品資料,哪些只停留在表層。
為什麼電商團隊需要 Shopify 爬蟲 Chrome 擴充功能
Shopify 商店其實是商業上很有價值的商品資料寶庫。但對外部人士來說,你不會拿到 CSV 下載檔,只會看到一個商店前台。要把這個前台轉成可操作的情報,你就需要爬蟲——而且用途遠不只是「我想要商品名稱清單」。
真正的問題是:你到底需要什麼資料,又是為了哪種流程?以下是最常見的電商情境,對應到具體資料欄位的方式:
競爭對手定價研究
你需要:商品標題、價格、原價對比價,以及變體層級的定價。這就是動態定價策略的核心——不只是知道競爭對手賣多少,而是知道他們如何折扣、組合銷售,以及針對不同尺寸或顏色如何定價。
代發貨商品挖掘
你需要:標題、所有圖片(不只是縮圖)、完整描述,以及發佈日期。依最新發佈日期排序,有助於你在市場飽和前,先發現正在竄紅或剛上架的商品。
匯入自家商店的商品目錄
你需要:標題、body HTML、所有圖片、變體、SKU 和價格——理想上還要是 。不是每款工具都能做得漂亮。
銷售速度估算
你需要:商品標題和庫存數量,而且要持續追蹤。只要定期截取庫存數據,你就能估算競爭對手的商品銷售速度——雖然粗略,但在沒有直接銷售資料時相當有用。
潛在客戶開發(找商店擁有者)
你需要:商店名稱、聯絡電子郵件、電話號碼,有時還包括商店使用的應用程式或技術堆疊。銷售團隊會用這些資料建立依利基市場或技術分類的開發名單。
先看一個快速參考:
| 使用情境 | 需要的關鍵資料欄位 | 建議流程 |
|---|---|---|
| 競爭對手定價研究 | 標題、價格、對比價、變體價格 | 抓取列表頁 + 子頁面補強變體資料 |
| 代發貨商品挖掘 | 標題、價格、圖片(全部)、描述、發佈日期 | 子頁面抓取 + 依最新發佈日期排序 |
| 匯入自家商店的商品目錄 | 標題、body HTML、圖片、變體、SKU、價格 | 完整子頁面抓取 → 匯出為可匯入 Shopify 的 CSV |
| 銷售估算 | 標題、庫存數量(隨時間變化) | 排程抓取 → 追蹤到 Google Sheets |
| 潛在客戶開發(商店擁有者) | 商店名稱、電子郵件、電話、使用中的應用程式 | 抓取商店聯絡頁 + 電子郵件/電話提取器 |
我是如何評估這 8 款 Shopify 爬蟲 Chrome 擴充功能的
我安裝了全部八款擴充功能,並拿它們去抓同一批真實 Shopify 商店——包含公開商店、受 Cloudflare 保護的商店,以及停用 products.json 的商店。我不只是看功能表。我想知道,當你在一個真實的 Shopify 集合頁面按下「抓取」時,實際會發生什麼事。
以下是我使用的八項標準,以及它們對 Shopify 為什麼特別重要:
| 標準 | 對 Shopify 抓取的重要性 |
|---|---|
| 設定難易度 | 非技術型代發貨賣家能不能在 5 分鐘內開始抓取? |
| 擷取的資料欄位 | 能不能抓到標題、價格、圖片、描述、變體,還有評論——還是只有表層資料? |
| 子頁面補強 | 能不能先抓列表頁,再自動造訪每個商品頁取得完整細節? |
| 分頁處理 | 能不能抓到第一頁以外的商品(點分頁或無限捲動)? |
| 反機器人韌性 | 能不能處理 Cloudflare Turnstile 或 Shopify 的機器人防護而不出錯? |
| 匯出格式 | CSV、Excel、Google Sheets、Airtable、Notion、可匯入 Shopify 的 CSV? |
| 排程/重複抓取 | 能不能隨時間自動監控價格或庫存變化? |
| 定價透明度 | 免費方案限制、點數制度、固定月費——以及你實際能拿到什麼 |
有了這個框架,接下來就是各工具的實際表現。
1. Thunderbit——專為不寫程式者打造的 AI Shopify 爬蟲
是我們在 Thunderbit 內部打造的工具,專門服務想取得深度商品資料、卻不想寫程式、設定 CSS selector,或花 20 分鐘做初始化的商務使用者。對 Shopify 商店來說,流程真的只要兩步:打開集合頁,點一下「AI 建議欄位」,AI 就會讀取頁面並提出欄位建議(標題、價格、圖片等)。再點「抓取」,列表頁就完成了。

但真正的差異化——也是多數競品文章忽略的部分——是下一步會發生什麼。
子頁面補強:徹底改變遊戲規則的功能
抓完列表頁後,你會點「抓取子頁面」。Thunderbit 的 AI 會造訪每個商品 URL,並把詳細頁資料附加回原始表格:完整描述、所有圖庫圖片、變體選項、SKU、評論數等等。這一步,會把一份淺層試算表變成可用的競品研究資料集。
我會在下方專門章節更深入說明這件事的重要性,並展示前後對比。
Shopify 抓取的關鍵優勢
- AI 建議欄位會讀取 Shopify 頁面,自動產生正確欄位結構——不需要 CSS selector,也不需要手動設定
- 子頁面抓取補上列表頁常常缺少的資料(完整描述、變體選項、圖片庫、評論)
- 雲端抓取模式適合在公開商店上快速大量擷取;瀏覽器抓取模式則適合 Cloudflare 保護或需要登入的商店
- 分頁處理(點擊式與無限捲動皆可)
- 排程抓取可持續監控價格/庫存——直接用白話描述排程即可(例如「每週一早上 9 點」)
- 免費電子郵件與電話提取器,適合開發名單情境
- 可匯出到 Excel、Google Sheets、Airtable、Notion、CSV、JSON——也包含適合匯入 Shopify 的格式
- 欄位 AI 提示詞可讓你針對每一欄加入自訂指令(例如「分類成 3 種商品類型」或「將描述翻譯成英文」)
缺點
- 採點數制,超大規模抓取(數萬件商品)需要付費方案
- 相較於非常簡單的模板式爬蟲,AI 處理每列會多花幾秒
價格
- 免費方案: 6 個頁面(或試用最多 10 個),所有匯出免費
- Starter: ,每月 500 點數
- Professional: 每月 38 美元起(3,000 點數)到每月 249 美元(20,000 點數)
- 點數規則: 1 筆輸出列 = 1 點,用於網頁抓取;1 筆輸出列 = 2 點,用於子頁面抓取;匯出永遠免費
最適合: 需要最深度 Shopify 商品資料、又想把初始化成本壓到最低的非技術型電商團隊——以及想長期監控競爭對手的人。
2. Instant Data Scraper——零設定的自動偵測選項
Instant Data Scraper 是一款免費的 Chrome 擴充功能,利用啟發式演算法自動偵測網頁上的表格資料。完全不需要設定——打開 Shopify 集合頁,點一下擴充功能圖示,它就會嘗試偵測並把商品資料以表格顯示出來。

根據我的測試,它在標準 Shopify Dawn 主題的集合頁上表現不錯,幾秒內就能抓到標題、價格和縮圖 URL。若商店版型不標準,它偶爾會抓到導覽連結或頁尾內容,而不是商品本身——所以你得自己檢查輸出結果。
Shopify 抓取的關鍵優勢
- 完全免費,沒有限制使用次數
- 自動偵測代表完全不需要設定——很適合快速、一次性的匯出
- 支援分頁(可自動點「下一頁」)
- 可匯出為 CSV 和 XLSX
缺點
- 在版型不標準的 Shopify 商店上,自動偵測結果不穩定
- 沒有子頁面補強:你只能拿到列表頁上的資料(標題、價格、縮圖),拿不到完整描述、變體或評論
- 沒有 AI 幫你清理、標記或轉換資料
- 沒有排程,也沒有雲端抓取
- 無法直接匯出到 Google Sheets、Airtable 或 Notion
價格
- 完全免費
最適合: 想從標準 Shopify 商店快速、免費、零設定匯出可見列表頁資料的人。
3. Web Scraper——視覺化 Sitemap 建構工具
Web Scraper(webscraper.io)是經典的點擊式 Chrome 擴充功能,用來建立「sitemap」——也就是你先在頁面上選取元素,再定義抓取流程的抓取腳本。對 Shopify 來說,你會透過點選商品標題、價格、圖片,並設定分頁與追蹤連結規則來建立 sitemap。

Shopify 抓取的關鍵優勢
- 視覺化選取器建構器,比自動偵測工具有更多控制權
- 可以追蹤連結到子頁面(商品詳細頁)——但需要你在 sitemap 中手動設定父子選取器
- 設定正確時能處理分頁
- 免費的瀏覽器端抓取;也有付費雲端抓取方案(每月 50 美元起)
- 可匯出 CSV;雲端方案支援 Google Sheets 與其他格式
缺點
- 設定比較耗時:為新的 Shopify 商店建立包含父子選取器的 sitemap,大約要 15 分鐘
- 子頁面抓取需要——不是一鍵補強
- Shopify 商店只要版型或 CSS 類別一變,sitemap 就可能壞掉
- 學習曲線比 AI 驅動方案更陡峭
價格
- 瀏覽器擴充功能: 免費
- 雲端方案: Project 每月 50 美元、Professional 每月 100 美元、Scale 每月 200 美元起
最適合: 想要細緻控制抓取流程、也不介意自己搭建腳本的技術使用者。
4. Data Miner——以 Recipe 為核心的爬蟲
Data Miner(dataminer.io)是圍繞「recipe」設計的——也就是你套用在頁面上的預建或自訂抓取模板。它有公開 recipe 資料庫,所以你可能找到其他使用者分享的 Shopify 模板,也可以自己透過點選頁面元素來建立。

Shopify 抓取的關鍵優勢
- recipe 資料庫可能有其他使用者分享的預建 Shopify 模板
- 視覺化 recipe 建構器,可做自訂抓取設定
- 透過 recipe 設定可處理分頁
- 可匯出 CSV、Excel、Google Sheets 和 TSV
- 有 crawl 工作流程,可在列表頁後再造訪詳細頁
缺點
- 免費方案限制為每月 500 頁
- recipe 是以 CSS selector 為基礎,所以商店版型一改就容易壞
- 沒有 AI 驅動的欄位建議或資料轉換
- 沒有內建的一鍵子頁面補強流程——詳細頁需要另外建立 crawl recipe
- 雖然有排程抓取,但排程體驗不是最簡單的
價格
- 免費: 每月 500 頁
- Solo: 每月 19.99 美元
- Small Business: 每月 49 美元
- Business: 每月 99 美元
- Business Plus: 每月 200 美元
最適合: 喜歡模板工作方式、想借助 recipe 資料庫加快常見網站設定的人。
5. Simplescraper——輕量型擷取工具
Simplescraper(simplescraper.io)是一款極簡的 Chrome 擴充功能與雲端爬蟲,主打簡單好上手。你在 Shopify 頁面上點選資料元素後,Simplescraper 會產生 CSS selector,並擷取符合條件的資料。

Shopify 抓取的關鍵優勢
- 介面乾淨、極簡——很好學
- 提供雲端抓取,可用於排程與大量任務
- 對想把抓取資料整合進工作流程的開發者提供 API 存取
- 可匯出 CSV、JSON、Google Sheets、Airtable,並支援 webhook
- 有深層抓取概念,可追蹤連結到詳細頁
- 支援登入型工作流程,適合有 session 狀態的商店
缺點
- 仍是手動選取器模式——沒有 AI 自動偵測欄位
- 子頁面抓取需要額外設定
- 跟 Web Scraper 或 Data Miner 相比,社群較小、預建模板較少
- 免費方案:100 點數(1 個 JS 渲染頁 = 2 點)
- 官方網站上的付費方案價格透明度,比多數同類產品低
價格
- 免費: 100 點數
- 付費方案: 第三方資料顯示 Plus 約每月 39 美元、Pro 約每月 70 美元、Premium 約每月 150 美元(依 G2 價格資料)
最適合: 想要一款輕量、現代化、整合性不錯的雲端爬蟲,而且不需要 AI 欄位偵測的人。
6. Octoparse——以桌面程式為核心的 Chrome 擴充功能
Octoparse(octoparse.com)主要是一款桌面應用程式,Chrome 擴充功能只是搭配使用。它同時提供視覺化流程建構器與熱門網站的預建模板,其中也包含 Shopify 專屬抓取教學。

Shopify 抓取的關鍵優勢
- 針對常見抓取任務提供預建 Shopify 模板
- 功能強大的桌面應用程式,具備進階功能:IP 輪換、排程抓取、雲端擷取
- 對分頁、無限捲動和 AJAX 載入內容的處理都很不錯
- 這份清單中記錄最完整的反機器人處理能力,包括自動 CAPTCHA 處理
- 可匯出 CSV、Excel、JSON、HTML、XML、資料庫和 Google Sheets
缺點
- 只有 Chrome 擴充功能本身的功能有限——大多數強大功能都需要桌面程式
- 桌面程式的視覺化工作流程建構器學習曲線較高
- 免費方案限制很多;要真正使用必須付費
- 相較於純 Chrome 擴充工具,設定較重,不適合快速 5 分鐘抓取
- 桌面程式僅支援 Windows/Mac(不是純瀏覽器工具)
價格
- 免費方案 可用
- Basic: 每月 39 美元
- Standard: 每月約 83 美元(按月)、每月約 75 美元(按年)
- Professional: 每月約 299 美元(按月)、每月約 208 美元(按年)
- Enterprise: 客製化
最適合: 需要企業級規模抓取、IP 輪換、反機器人處理與重複雲端任務的團隊,而且不介意使用桌面應用程式。
7. Bardeen——以自動化為優先的爬蟲
Bardeen(bardeen.ai)是一個瀏覽器自動化平台,把網頁抓取與工作流程自動化結合在一起。使用者會建立「playbook」,不只能抓資料,還能把資料送到其他應用程式——你可以把它想成「如果我抓到這些資料,那就推送到我的 CRM」。

Shopify 抓取的關鍵優勢
- 不只抓取,還能做工作流程自動化:抓 Shopify 資料 → 補強 → 推送到 CRM 或試算表,一個 playbook 就能完成
- 可整合 100+ 應用程式(Google Sheets、Airtable、Notion、HubSpot、Slack 等)
- 具備 AI 驅動的資料擷取與分類功能
- 在瀏覽器中執行,不需要桌面應用程式
- 支援按時間/日期排程自動化
缺點
- 它主要是自動化工具,不是專門爬蟲——抓取功能的深度不如專業工具
- 對只想擷取商品清單的使用者來說,playbook 建立可能有點難懂
- 免費方案只提供 100 點數
- 子頁面補強與分頁處理沒有專門抓取工具那麼直覺
- 如果你只是想抓資料,沒有後續自動化需求,它就顯得過度強大了
價格
- 免費: 100 點數
- Basic: 每月 10 美元,100 點數/月
- Premium: 每月 50 美元,1,000 點數/月(年繳約每月 40 美元)
- Enterprise: 客製化
- 點數模型:每抓取一列 1 點,每補強一列 3 點
最適合: 想要抓 Shopify 資料,並立刻在同一個自動化流程中推送到下游應用(CRM、試算表、Slack)的團隊。
8. Listly——把清單轉成試算表的工具
Listly(listly.io)專門設計來把網頁上的清單和表格轉成可直接用於試算表的資料。你在 Shopify 集合頁上點一下擴充功能,Listly 就會嘗試偵測商品清單,並把它匯出成試算表。

Shopify 抓取的關鍵優勢
- 介面極其簡單——就是為一鍵擷取清單而設計
- 很擅長偵測重複出現的清單結構(例如商品格狀列表)
- 可直接匯出到 Excel 和 Google Sheets
- 有群組抓取功能,可一次處理多個 URL
- Business 方案提供排程功能
缺點
- 只能抓取它在頁面上自動偵測到的內容——不能自訂欄位
- 沒有子頁面補強——只能匯出列表頁層級的資料
- 遇到非標準 Shopify 主題或 JavaScript 渲染較重的商店時表現較差
- 免費方案非常有限(每月 10 個 URL)
- 相較競爭對手,匯出選項較少(主要是 Excel 和 Sheets)
價格
- 免費: 每月 10 個 URL、基本單頁擷取、Excel 下載、Google Sheet 匯出
- Light: 每月 30 美元(年繳每年 187.20 美元)
- Business: 每月 90 美元(年繳每年 993.60 美元)——增加進階擷取、群組擷取、排程、自動捲動/點擊、API Beta
最適合: 想把 Shopify 集合頁最簡單地轉成試算表,而且不需要深度商品資料的人。
8 款 Shopify 爬蟲 Chrome 擴充功能完整比較
以下是完整的並排比較。我盡量在每個欄位都寫得具體,而不是只打勾——因為「支援分頁」這件事,依工具不同意思差很多。
| 工具 | 設定難易度 | 資料欄位 | 子頁面補強 | 分頁 | 反機器人處理 | 匯出格式 | 排程 | 免費方案/價格 |
|---|---|---|---|---|---|---|---|---|
| Thunderbit | 非常容易(AI 引導、2 步完成) | 對非技術使用者最強(AI 會建議所有相關欄位) | 有——一鍵補強 | 有(點擊 + 無限捲動) | 公開站用雲端,受保護站用瀏覽器 | Sheets、Airtable、Notion、CSV、JSON、Excel | 有(白話排程) | 免費 6 頁;付費每月 15 美元起 |
| Instant Data Scraper | 極容易(零設定) | 只適合列表層級資料 | 沒有 | 有(自動偵測下一頁) | 僅瀏覽器端,沒有專門反機器人方案 | CSV、XLSX | 沒有 | 免費 |
| Web Scraper | 中偏難(手動 sitemap) | 如果 sitemap 建得好,就很有彈性 | 有,但要透過連結選取器手動做 | 有(需 sitemap 設定) | 本機瀏覽器端;雲端方案有代理輪換 | 本機 CSV;雲端支援更多格式 | 雲端方案有 | 免費擴充功能;雲端每月 50 美元起 |
| Data Miner | 中等(以 recipe 為主) | 如果有現成 recipe 或能自己做,就不錯 | 有,但需要多步驟 crawl 設定 | 有(recipe 設定) | 主要在瀏覽器端 | CSV、Excel、Sheets、TSV | 有自動化 crawl | 免費每月 500 頁;付費每月 19.99 美元起 |
| Simplescraper | 容易到中等(以選取器為主) | 適合輕量擷取 | 有深層抓取概念,但不是一鍵式 | 有(支援無限捲動) | 有代理輪換,也適合登入情境 | CSV、JSON、Sheets、Airtable、webhook | 有 | 免費 100 點數;另有付費方案 |
| Octoparse | 較難(桌面應用) | 設定後非常強 | 有,透過工作流程或模板 | 有(AJAX、無限捲動) | 這份清單中最強(IP 輪換、CAPTCHA) | CSV、Excel、JSON、HTML、XML、資料庫、Sheets | Standard 以上有 | 免費;Basic 每月 39 美元;雲端每月約 83 美元起 |
| Bardeen | 中等(playbook 建構器) | 若和自動化綁定,表現很好 | 可透過工作流程邏輯做到,但不是以 Shopify 為中心 | 可以 | 在瀏覽器中執行,反機器人不是核心 | CSV、Sheets、Airtable、Notion | 可透過自動化 | 免費 100 點數;Basic 每月 10 美元;Premium 每月 50 美元 |
| Listly | 非常容易(一鍵偵測清單) | 最適合可見的列表列 | 沒有 | 受限於偵測到的列表結構 | 很少 | Business 方案可用 Excel、Sheets、CSV/JSON API | Business 方案有 | 免費每月 10 個 URL;Light 每月 30 美元;Business 每月 90 美元 |
依優先順序快速判斷
如果你要的是最深的 Shopify 商品資料,而且初始化最少,Thunderbit 的 AI + 子頁面補強是最強組合。如果你要的是完全免費、快速粗抓的匯出,Instant Data Scraper 對簡單頁面就很好用。如果你想要完全控制且不介意自己寫 recipe,Web Scraper 或 Octoparse 會給你那種掌控力。而如果你的真正目標是抓取 → 自動化 → 推送到 CRM,那就該看看 Bardeen 這種工作流程平台。
只抓列表頁只完成了一半:子頁面補強工作流程

這一段是我最希望其他 Shopify 爬蟲文章都能加入的,因為這是競品內容裡最大的缺口,也是我從電商使用者那裡最常聽到的第一大痛點。
當你抓 Shopify 集合頁(列表頁)時,你拿到的是表層資料:標題、價格、縮圖,也許還有截斷過的描述。但你真正做競品分析、目錄匯入或代發貨研究時需要的欄位,其實都在單一商品詳細頁上。
只有列表頁 vs. 加上子頁面補強後,你會得到什麼
| 資料欄位 | 只有列表頁 | 子頁面補強後 |
|---|---|---|
| 商品標題 | ✅ | ✅ |
| 價格 | ✅ | ✅ |
| 縮圖 | ✅ | ✅ + 所有圖庫圖片 |
| 簡短描述 | ⚠️ 已截斷 | ✅ 完整 HTML 描述 |
| 變體(尺寸、顏色) | ❌ | ✅ |
| SKU/庫存 | ❌ | ✅ |
| 評論/評分 | ❌ | ✅ |
差異非常大。
只抓列表頁,你得到的是一份很淺的試算表;加上子頁面補強後,你拿到的就是可直接使用的競品研究資料集。
Thunderbit 的子頁面抓取怎麼做(逐步說明)
- 進入 Shopify 商店的集合/列表頁
- 點 「AI 建議欄位」——Thunderbit 會讀取頁面並建議欄位(標題、價格、圖片、連結等)
- 點 「抓取」,擷取列表頁資料
- 點 「抓取子頁面」——AI 會造訪每個商品 URL,並把詳細頁資料(完整描述、所有圖片、變體、評論)附加到原始表格
- 將補強後的表格匯出到 Excel、Google Sheets、Airtable、Notion 或 CSV
對一般集合頁來說,整個過程只要幾分鐘;最後得到的資料集,原本手動整理可能要花好幾小時。
其他工具支援子頁面補強嗎?
- Web Scraper: 有,但需要手動設定 sitemap,包含連結選取器與子 sitemap——每個商店大約要 15–20 分鐘
- Octoparse: 有,透過工作流程建構器或模板——強大但設定較重
- Data Miner: 有,透過多步驟 crawl 工作流程——不是一鍵操作
- Simplescraper: 有深層抓取概念,但沒那麼開箱即用
- Instant Data Scraper、Listly、Bardeen: 沒有明確的一鍵式 Shopify 子頁面補強功能
「技術上能透過 20 分鐘手動設定追蹤連結」和「一鍵補強」之間的差距,就是爬蟲工程師工具和電商營運工具的差距。
當 Shopify 的 products.json 失效時——為什麼 Chrome 擴充功能就是備用方案
如果你看過其他 Shopify 抓取指南,大概都見過 /products.json 這招:只要在 Shopify 商店 URL 後面加上 /products.json,你就會得到 JSON 格式的結構化商品資料。這確實是個有效端點,而且在可用時非常方便。
products.json 的運作方式
Shopify 商店會在 /products.json 提供一個 ,回傳結構化商品資料。你可以用 ?page=2&limit=250 分頁(每頁最多 250 件商品)。
通常會回傳的欄位包括:title、body_html、vendor、product_type、tags、published_at、variants(含 price、compare_at_price、sku、available)以及 images。
products.json 缺少什麼
- 沒有評論資料或評分數
- 相較於渲染後頁面,描述格式較有限
- 自訂 metafield 常常不會包含在內
- 變體層級的圖片可能不一致
- 沒有渲染後的行銷內容、徽章或社會證明
products.json 什麼時候會壞掉
我在 2026 年 4 月 27 日對八個真實 Shopify 商店做了直接 HTTP 檢查,結果很有意思:
| 商店 | 結果 |
|---|---|
| kith.com | ✅ 可用——乾淨的 JSON |
| colourpop.com | ✅ 可用 |
| allbirds.com | ✅ 可用 |
| brooklinen.com | ✅ 可用 |
| negativeunderwear.com | ✅ 可用 |
| gymshark.com | ❌ 被阻擋——回傳 403 HTML 而不是 JSON |
| mvmt.com | ⚠️ 部分停用——回傳 200 HTML 頁面,不是 JSON |
| fashionnova.com | ❌ 已停用——404 |
八個裡面有五個回傳乾淨 JSON,三個沒有。
論壇使用者也有同樣的回報:「不曉得為什麼,有些 Shopify 商店選擇不公開 products.json。」 需要密碼保護的商店、自訂 API 設定的商店,以及受 Cloudflare 保護的網域,都可能讓這個模式失效。
Chrome 擴充功能的備援方案
當 products.json 不可用時,Chrome 擴充功能會直接從已渲染頁面(DOM)擷取資料。這就是瀏覽器型爬蟲的核心價值主張:它們看到並擷取的,就是你在瀏覽器裡看到的內容,不受 API 可用與否影響。因此 Chrome 擴充功能是可靠的第二方案——而且在你需要評論、行銷內容或完整圖庫這類渲染後資料時,往往甚至是第一方案。
反機器人防護:真正抓 Shopify 商店時會發生什麼

多數 Shopify 爬蟲文章都假設每間商店大門敞開。事實並不是這樣。指出,99.2% 的 Shopify 商店使用 Cloudflare 基礎架構。這不代表每間商店都會強力阻擋爬蟲,但代表阻擋用的基礎設施到處都有。
實務上,大致可分成以下幾種:
容易抓取
- 沒有強力 Cloudflare 防護的公開商店
- 啟用 products.json 的商店
- 使用標準 Shopify 主題的商店(DOM 結構一致)
較難抓取
- 受 Cloudflare 保護的商店(CAPTCHA 挑戰、Turnstile)
- 需要登入或密碼門檻的商店
- 使用自訂安全層的 Shopify Plus 商店
- 採取嚴格速率限制的商店
各工具如何處理反機器人情境
| 情境 | 最佳做法 | 可處理的工具 |
|---|---|---|
| 公開商店、沒有反機器人 | 雲端抓取(快速) | Thunderbit(雲端模式)、Instant Data Scraper、多數其他工具 |
| 受 Cloudflare 保護的商店 | 瀏覽器型抓取(使用你的 session) | Thunderbit(瀏覽器模式)、Web Scraper、Octoparse |
| 需要登入/私有商店 | 使用你登入中的瀏覽器 session 進行抓取 | Thunderbit(瀏覽器模式)、Web Scraper、Simplescraper |
| products.json 已停用 | 直接從渲染後頁面進行 DOM 擷取 | 所有 Chrome 擴充功能(這是它們的強項) |
Thunderbit 的雲端/瀏覽器雙模式在這裡真的很重要。雲端模式適合快速大量抓取公開商店;當反機器人防護需要你自己的 Chrome session 時,瀏覽器模式就派上用場。這個彈性在 gymshark.com 上救了我一把,因為雲端請求被擋下來,但瀏覽器模式運作正常。
Shopify 排程抓取:隨時間監控價格與庫存
一次性抓取很有用。但電商營運團隊通常需要持續性的競爭情報——不只是單次快照。價格變動、庫存波動、新品上架:這些都在持續發生。有位論壇使用者講得很直接:「更有幫助的是看到他們目前的庫存量,以及庫存逐步下降的快照。」
然而,幾乎沒有競品文章提到排程或重複抓取。這是很明顯的盲點。
Shopify 排程監控怎麼運作
- 設定競爭對手集合頁或商品頁的定期抓取
- 每次執行都把資料匯出到 Google Sheets(或 Airtable),形成價格與庫存的時間序列
- 用這些資料追蹤:降價/漲價、缺貨、新品新增、季節性模式
用 Thunderbit 設定排程抓取
Thunderbit 讓這件事簡單得有點誇張。
你只要用白話描述排程(例如「每週一早上 9 點」),輸入 Shopify 商店 URL,再點「排程」。Thunderbit 就會自動執行抓取,並匯出到你選定的目的地。不需要 cron job、不需要寫程式、也不需要第三方排程器。
8 款工具的排程支援情況
| 工具 | 支援排程嗎? |
|---|---|
| Thunderbit | 有——白話排程 |
| Instant Data Scraper | 沒有 |
| Web Scraper | 有——雲端方案支援 |
| Data Miner | 有自動化 crawl,但不是最簡單的排程方式 |
| Simplescraper | 有 |
| Octoparse | 有——Standard 以上支援 |
| Bardeen | 有——透過時間/日期自動化 |
| Listly | 有——Business 方案支援 |
如果持續監控競爭對手是你流程的一部分,這就是關鍵差異化。大多數免費方案 Chrome 擴充功能根本不提供這個功能。
哪一款 Shopify 爬蟲 Chrome 擴充功能適合你?

與其做一個泛泛的「選你喜歡的」結尾,不如直接看依照使用情境設計的決策矩陣:
| 使用情境 | 最佳建議 | 原因 |
|---|---|---|
| 競爭對手定價研究 | Thunderbit | 列表頁 + 子頁面補強 + 排程 = 完整定價流程 |
| 快速一次性匯出 | Instant Data Scraper | 當你只需要可見列表資料時,這是最快的免費路徑 |
| 匯入 Shopify 商品目錄 | Thunderbit | 完整子頁面資料 + 適合匯入 Shopify 的 CSV/Excel 匯出 |
| 持續價格/庫存監控 | Thunderbit 或 Octoparse | 最簡單的無程式排程 vs. 最強企業級排程 |
| 潛在客戶開發(商店聯絡資訊) | Thunderbit | 內建電子郵件/電話提取器 + 結構化匯出 |
| 複雜多步驟自動化 | Bardeen | 一個工作流程內完成抓取、補強,並推送到下游應用 |
| 想完全掌控的技術使用者 | Web Scraper 或 Octoparse | 對選取器、流程與擷取邏輯有最佳手動控制 |
結語
到了 2026 年,Shopify 抓取不再是「能不能拿到商品資料」的問題,而是你的流程能做到多深、多快、以及多可重複。這個領域的大多數文章都只停在列表頁。真正的價值在於子頁面補強、排程監控,以及處理真實 Shopify 商店丟來的各種反機器人突發狀況。
如果你想實際看看這一切怎麼運作——從集合頁到幾次點擊就完成的深度補強資料集——可以試試 。如果 Thunderbit 不是你的完美選擇,Instant Data Scraper 也很適合拿來做簡單任務的免費起手式;而 Web Scraper 和 Octoparse 則很適合想要更多控制權的技術使用者。
祝你抓取順利——也希望你的商品資料永遠完整、結構化,而且變體資訊豐富。
常見問題
1. 抓取 Shopify 商店資料是否合法?
Shopify 商店中公開可見的商品資料,一般而言任何訪客都能存取。不過,是否合法仍取決於你的司法管轄區、商店的服務條款,以及你打算如何使用這些資料。用公開價格做競品分析很常見;但若是大量複製內容再重新發布,風險就高得多。這不是法律意見——請針對你的具體情況諮詢專業人士。
2. 我可以抓需要登入或密碼的 Shopify 商店嗎?
可以,但你需要使用瀏覽器型爬蟲,並透過你已登入的 Chrome session 來操作。雲端爬蟲通常無法存取有登入門檻的頁面。Thunderbit 的瀏覽器模式、Web Scraper(本機版)以及 Simplescraper 的登入工作流程都支援這種情境。
3. 我一次可以從 Shopify 商店抓多少商品?
這取決於工具和方案。Shopify 的 products.json 端點每頁可分頁 。Thunderbit 的雲端模式一次最多可處理 50 頁。多數工具的免費方案都會限制頁數、列數或點數——所以在開始大規模任務前,先確認你的方案限制。
4. Shopify 的雲端抓取和瀏覽器抓取有什麼差別?
雲端抓取是在遠端伺服器上執行——速度較快,也更適合沒有反機器人防護的公開商店。瀏覽器抓取則使用你本機的 Chrome session,這代表它可以處理受 Cloudflare 保護、需要登入或對地區敏感的商店。Thunderbit 兩種模式都有,通常要看商店會不會阻擋遠端請求來決定。
5. 我可以把抓到的 Shopify 資料直接匯出到 Google Sheets 或 Airtable 嗎?
可以,但不是所有工具都支援。Thunderbit 可免費匯出到 Google Sheets、Airtable、Notion、Excel、CSV 和 JSON。Data Miner 和 Listly 支援 Google Sheets。Simplescraper 支援 Sheets 和 Airtable。Octoparse 在進階方案中支援 Google Sheets。Bardeen 可整合 Sheets、Airtable 和 Notion。Instant Data Scraper 只匯出 CSV 和 XLSX,沒有直接整合 Sheets。
了解更多