讓我們一起進入網頁爬取的世界——這個詞聽起來好像有點技術門檻,但其實超級實用。簡單來說,網頁爬取就是把你需要的網站資訊,像是房地產刊登、商品價格,甚至社群留言,擷取出來並整理到 Excel 中,方便你檢視與分析。
當然,你也可以手動複製貼上資料,但如果面對幾百筆甚至幾千筆資料,效率就會瞬間掉下來。這時候,何不交給 AI 工具來處理最花時間的部分?今天我們要介紹的是 ,一款能讓這件事變得超輕鬆的 AI 工具。
什麼是網頁爬取?
網頁爬取是一種從網站擷取資料的技術。無論你是想整理電商網站上的商品資訊,還是從房地產平台收集租屋資料,網頁爬取都能把這些流程自動化,並把資料整理成可輕鬆匯入 Excel 的表格。
傳統上,網頁爬取主要有兩種做法。第一種是程式碼式爬取,對非工程師來說門檻很高。第二種則是無程式碼爬蟲工具,例如 ,但設定起來往往也不算簡單。這類工具通常會針對像 這樣的熱門網站提供範本,但在真實情境中,你可能需要從各種不同且獨特的網站抓資料,例如名錄網站或 Shopify 商店。面對這類複雜又多變的網站,用 AI 來做網頁爬取,會是更聰明的選擇。
為什麼要用 AI 抓取網站資料?
使用 AI 來抓取網站資料,是更聰明也更有效率的方法。AI 工具可以自動辨識網頁上的資料結構與模式。它們會直接讀取網站內容,並輸出結構化資料,因此能處理動態內容,也能適應網頁版面變動,快速提供準確結果。此外,這類工具不需要技術背景——只要幾個點擊,就能把抓取到的資料直接匯入 Excel、Notion 或 Airtable,方便後續分析與使用。 就是這樣一款 AI 網頁爬蟲,接下來我們會帶你了解它的功能與使用方式。
試試用 AI 做網頁爬取
試試看!你可以一邊觀看,一邊點擊、探索並實際操作流程。
認識 Thunderbit —— AI 網頁爬蟲
隆重介紹今天的主角:。它是一款智慧型 AI 網頁爬蟲,不僅能透過內建爬蟲處理熱門網站,也能用 自訂指令 應對更複雜的網站,滿足不同需求。
- 內建網頁爬蟲 提供專為熱門網站設計的內建網頁爬蟲,例如 、 和 。你只要選擇對應範本,幾個點擊就能把網站資料抓到 Excel。

- 自訂指令
如果是較複雜的網站,你可以使用 Thunderbit 的 欄位詳細指令 功能,精準指定你要抓取的內容。舉例來說,如果你只需要地址中的城市與州別,可以直接輸入像「我只需要 City 和 State,例如 San Francisco, CA」這樣的詳細說明,匯出的資料就會符合你的需求。

一步一步教你把網站資料抓到 Excel
抓取熱門網站(Amazon、Zillow、Twitter、Instagram 等)
以下是使用 從網站抓資料並匯出到 Excel 的方法。
- 安裝 Thunderbit
前往 網站,將它新增為 Chrome 擴充功能。

- 開始爬取
打開你想抓取的網站,例如 或 。系統會自動跳出內建範本,你只要點擊「Scrape」即可。AI 會自動辨識頁面上有用的資訊,例如商品價格與名稱。

- 選擇輸出格式
爬取完成後,選擇你要的匯出格式,例如 Excel,方便你整理資料。你也可以直接複製貼上到 Google Sheets。

抓取任何網站
如果你想爬取的網站不在範本清單中怎麼辦?別擔心,使用 的 自訂指令 功能,就能靈活調整:
- 設定 AI 爬蟲範本
點擊「AI Suggest Columns」,AI 會讀取整個網站,並自動擷取像商品價格、描述、評論等欄位。

如果你對 AI 產生的欄位名稱不滿意,也可以自行調整每個欄位的資料格式,例如數字、日期、文字、單選或多選。

另外,點擊「Add column detailed instruction」還可以補充更多描述,讓 AI 更精準理解你的需求。舉例來說,輸入「我只需要 City 和 State,例如 San Francisco, CA」,匯出的資料就會以你想要的格式呈現。

- 連接到你的表格
資料抓取完成後,點擊「Download CSV」即可直接匯入 Excel。你也可以選擇「Save to…」,將結果同步到 Notion、Airtable、Google Sheets 等工具,方便存取。

Thunderbit 的實際應用場景
名單開發
假設你在一家教育軟體公司工作,想找出大學教授的聯絡資訊來推廣產品。學校網站通常沒有現成範本,這時 Thunderbit 的自動爬取功能就非常適合。只要兩個步驟,就能把網站資料抓到 Excel,幫助你進行名單開發。以下是擷取教授資訊的範例:
- 使用 Thunderbit 抓取 UC Berkeley 教職員名單: 打開你要爬取的頁面並啟動 Thunderbit。當你點擊「AI Suggest Column」時,AI 會讀取整個網頁,並自動辨識你需要的欄位,例如教授姓名、電子郵件與研究領域。
- 匯出資料: 點擊「Scrape」後,Thunderbit 會依照設定的欄位名稱擷取資料。再點擊「Download CSV」即可直接匯入 Excel,或複製貼上到 Google Sheet。

電商
電商賣家需要即時追蹤競品價格與商品細節。你可以從 或 商店抓取商品資訊,包括價格、庫存與評分,以便快速分析市場趨勢。在電商場景中,通常有兩種情況:像 Amazon 這樣的大型購物平台,可以使用內建範本一鍵擷取;而像 Shopify 這種樣式多變的商店,則可以搭配 自訂指令 使用。
- Amazon
打開 網站,點進你要抓取的商品頁面,內建範本圖示就會自動跳出,包括 Amazon SKU 詳細資料爬蟲與 Amazon SKU 評論爬蟲。選擇你要抓取的類型後,點擊「Scrape」即可。

- Shopify 商店
對於介面各不相同的 Shopify 商店,建議使用 AI 驅動的 自訂指令 功能。打開你有興趣的 Shopify 商店頁面,點擊右上角的 Thunderbit 外掛圖示,啟動 Thunderbit,再點擊「AI Suggest Column」。AI 會自動辨識你需要的資料:商品名稱、價格、評論等。
接著點擊「Scrape」即可把資料匯入 Excel。你也可以選擇「Copy with headers」或「Copy without headers」,直接貼到 Excel 中。

房地產
如果你是房地產經紀人或投資人,就需要整理來自不同區域的房源資訊。對於像 Zillow 這類熱門房地產網站,可以使用內建範本一鍵抓取資料;而像 這類房地產公司網站,則可以使用 自訂指令 功能。
- Zillow
Thunderbit 已經為多個熱門網站建立內建範本,並提供像 City、State、Pricing、Address 等豐富欄位名稱,資料表非常完整。使用 Thunderbit 的內建範本抓取 Zillow 的房源資料,並整理成 Excel 試算表,清楚又有效率。如下圖所示,你只要打開 ,搜尋你要抓取的資訊,Thunderbit 就會自動跳出「Use Pre-built template」提示框。點擊確認後,就能產出完整資料。

- Equity Apartments
房地產公司網站通常會持續更新最新房源,但每家公司的網站都不一樣,而且可能只有幾十筆資料。這種情況下,傳統網頁爬蟲反而不划算,因為設定爬蟲所花的時間,可能比直接複製貼上到 Excel 還久。所以,AI 網頁爬蟲就是最佳解,只要兩次點擊就能把網站上的房源抓下來。
-
讓 AI 自動選擇要抓取的資料欄位: 打開你要抓取的網站,點擊 AI Web Scraper,再點擊 AI Suggest Columns。AI 會讀取整個頁面,並產生建議欄位名稱,例如 Apartment Name、Address、Phone Number 等。

-
點擊 Scrape: 欄位設定好後,點擊「Scrape」。資料產生後,點擊「Download CSV」即可在 Excel 中開啟。你也可以選擇「Copy with headers」或「Copy without headers」,直接貼到 Excel 裡。
使用 Thunderbit 的小技巧
以下是一些能幫助你更有效率使用 的技巧:
- AI Suggest Columns
想抓取沒有範本的網頁,卻不知道怎麼分類資料?沒問題,交給 AI Suggest Columns 就好。打開你要抓取的網頁,點擊 AI Web Scraper,再點擊 AI Suggest Columns。Thunderbit 會讀取整個頁面,並自動推薦可能的資料欄位,例如價格、日期與地址,大幅減少手動設定的麻煩。
如果你對 AI Suggest Columns 的結果不滿意,也可以手動修改資料欄位,例如更改欄位名稱與調整讀取格式。資料格式可以是數字、文字、單選或多選,甚至圖片。你也可以新增欄位詳細指令,輸入需求,讓 AI 根據你的要求擷取資料。
- 整合 Notion、Airtable、Google Sheet
匯出的資料可以選擇含標題或不含標題複製,方便你貼到 Excel 中。此外,Thunderbit 也能與其他工具協作,將抓取到的資料無縫同步到 Notion、Airtable 等效率工具,非常適合長期專案或團隊協作使用。
匯出的資料也能直接在 Google Sheets 中開啟,方便個人使用。
- 抓取 PDF
除了一般網頁資料之外, 也能辨識網路上的 PDF 檔案。PDF 看起來整齊,實際上可能包含文字、表格與圖片等多種資料。傳統 PDF 爬蟲通常相當複雜,但有了 Thunderbit,從 PDF 擷取資料就變得很簡單。就像我在文章 中提到的,你也可以用 Thunderbit 把網路上的 PDF 資料抓到 Excel。
別再為繁瑣的人工資料整理感到頭痛了。無論是 Amazon、Zillow 這類熱門網站,還是任何你想抓取的利基網站,都交給 吧。這款 AI 工具能幫你輕鬆完成所有「把網站資料抓到 Excel」的需求。現在就試試看,你會發現資料抓取原來可以這麼簡單又高效。
常見問題
- 我可以使用 Thunderbit 抓取任何網站的資料嗎?
可以。Thunderbit 透過自訂指令功能,讓使用者能從任何網站抓取資料。你只要明確指定想擷取的內容,AI 就會依照需求產生對應輸出。
- Thunderbit 可以抓取哪些類型的資料?
你可以抓取各種類型的資料,包括商品名稱、價格、描述、聯絡資訊等。Thunderbit 的 AI 會根據網站內容,自動建議相關欄位。
- 我該如何匯出抓取到的資料?
完成爬取後,你可以輕鬆將資料匯出為 CSV,或直接匯入 Excel。Thunderbit 也支援將抓取結果同步到 Notion 或 Airtable,方便後續分析。
- 使用網頁爬蟲工具需要程式設計能力嗎?
本文介紹的大多數工具都不需要程式設計能力,但像 Octoparse 和 Web Scraper 這類工具,若使用者具備基本的網頁結構知識與程式思維,通常會更容易發揮最佳效果。
- Thunderbit 有哪些常見應用場景?
常見用途包括名單開發(例如從大學網站擷取教職員資訊)、電商價格監控(例如追蹤 Amazon 上的競品),以及房地產資料蒐集(例如整理 Zillow 上的房源列表)。
延伸閱讀