如何運用 AI 將網站資料抓取到 Excel

最後更新於 March 26, 2026

讓我們一起進入網頁爬取的世界——這個詞聽起來好像有點技術門檻,但其實超級實用。簡單來說,網頁爬取就是把你需要的網站資訊,像是房地產刊登、商品價格,甚至社群留言,擷取出來並整理到 Excel 中,方便你檢視與分析。

當然,你也可以手動複製貼上資料,但如果面對幾百筆甚至幾千筆資料,效率就會瞬間掉下來。這時候,何不交給 AI 工具來處理最花時間的部分?今天我們要介紹的是 ,一款能讓這件事變得超輕鬆的 AI 工具。

什麼是網頁爬取?

網頁爬取是一種從網站擷取資料的技術。無論你是想整理電商網站上的商品資訊,還是從房地產平台收集租屋資料,網頁爬取都能把這些流程自動化,並把資料整理成可輕鬆匯入 Excel 的表格。

傳統上,網頁爬取主要有兩種做法。第一種是程式碼式爬取,對非工程師來說門檻很高。第二種則是無程式碼爬蟲工具,例如 ,但設定起來往往也不算簡單。這類工具通常會針對像 這樣的熱門網站提供範本,但在真實情境中,你可能需要從各種不同且獨特的網站抓資料,例如名錄網站或 Shopify 商店。面對這類複雜又多變的網站,用 AI 來做網頁爬取,會是更聰明的選擇。

為什麼要用 AI 抓取網站資料?

使用 AI 來抓取網站資料,是更聰明也更有效率的方法。AI 工具可以自動辨識網頁上的資料結構與模式。它們會直接讀取網站內容,並輸出結構化資料,因此能處理動態內容,也能適應網頁版面變動,快速提供準確結果。此外,這類工具不需要技術背景——只要幾個點擊,就能把抓取到的資料直接匯入 Excel、Notion 或 Airtable,方便後續分析與使用。 就是這樣一款 AI 網頁爬蟲,接下來我們會帶你了解它的功能與使用方式。

試試用 AI 做網頁爬取

試試看!你可以一邊觀看,一邊點擊、探索並實際操作流程。

認識 Thunderbit —— AI 網頁爬蟲

隆重介紹今天的主角:。它是一款智慧型 AI 網頁爬蟲,不僅能透過內建爬蟲處理熱門網站,也能用 自訂指令 應對更複雜的網站,滿足不同需求。

  • 內建網頁爬蟲 提供專為熱門網站設計的內建網頁爬蟲,例如 。你只要選擇對應範本,幾個點擊就能把網站資料抓到 Excel。

scrape_amazon_template.gif

  • 自訂指令

如果是較複雜的網站,你可以使用 Thunderbit 的 欄位詳細指令 功能,精準指定你要抓取的內容。舉例來說,如果你只需要地址中的城市與州別,可以直接輸入像「我只需要 City 和 State,例如 San Francisco, CA」這樣的詳細說明,匯出的資料就會符合你的需求。 custom_instruction.gif

一步一步教你把網站資料抓到 Excel

抓取熱門網站(Amazon、Zillow、Twitter、Instagram 等)

以下是使用 從網站抓資料並匯出到 Excel 的方法。

  1. 安裝 Thunderbit

前往 網站,將它新增為 Chrome 擴充功能。

set_up_thunderbit.png

  1. 開始爬取

打開你想抓取的網站,例如 。系統會自動跳出內建範本,你只要點擊「Scrape」即可。AI 會自動辨識頁面上有用的資訊,例如商品價格與名稱。

one_click_scrape.gif

  1. 選擇輸出格式

爬取完成後,選擇你要的匯出格式,例如 Excel,方便你整理資料。你也可以直接複製貼上到 Google Sheets。 export_format.gif

抓取任何網站

如果你想爬取的網站不在範本清單中怎麼辦?別擔心,使用 自訂指令 功能,就能靈活調整:

  1. 設定 AI 爬蟲範本

點擊「AI Suggest Columns」,AI 會讀取整個網站,並自動擷取像商品價格、描述、評論等欄位。 set_up_AI_scraper.png

如果你對 AI 產生的欄位名稱不滿意,也可以自行調整每個欄位的資料格式,例如數字、日期、文字、單選或多選。 customize_each_column.png

另外,點擊「Add column detailed instruction」還可以補充更多描述,讓 AI 更精準理解你的需求。舉例來說,輸入「我只需要 City 和 State,例如 San Francisco, CA」,匯出的資料就會以你想要的格式呈現。 add_column_detailed_instrcution.png

  1. 連接到你的表格

資料抓取完成後,點擊「Download CSV」即可直接匯入 Excel。你也可以選擇「Save to…」,將結果同步到 Notion、Airtable、Google Sheets 等工具,方便存取。 connect_to_your_table.png connect_to_your_accounts.png

Thunderbit 的實際應用場景

名單開發

假設你在一家教育軟體公司工作,想找出大學教授的聯絡資訊來推廣產品。學校網站通常沒有現成範本,這時 Thunderbit 的自動爬取功能就非常適合。只要兩個步驟,就能把網站資料抓到 Excel,幫助你進行名單開發。以下是擷取教授資訊的範例:

  1. 使用 Thunderbit 抓取 UC Berkeley 教職員名單: 打開你要爬取的頁面並啟動 Thunderbit。當你點擊「AI Suggest Column」時,AI 會讀取整個網頁,並自動辨識你需要的欄位,例如教授姓名、電子郵件與研究領域。
  2. 匯出資料: 點擊「Scrape」後,Thunderbit 會依照設定的欄位名稱擷取資料。再點擊「Download CSV」即可直接匯入 Excel,或複製貼上到 Google Sheet。

scrape_leads_gen.gif

電商

電商賣家需要即時追蹤競品價格與商品細節。你可以從 商店抓取商品資訊,包括價格、庫存與評分,以便快速分析市場趨勢。在電商場景中,通常有兩種情況:像 Amazon 這樣的大型購物平台,可以使用內建範本一鍵擷取;而像 Shopify 這種樣式多變的商店,則可以搭配 自訂指令 使用。

  • Amazon

打開 網站,點進你要抓取的商品頁面,內建範本圖示就會自動跳出,包括 Amazon SKU 詳細資料爬蟲與 Amazon SKU 評論爬蟲。選擇你要抓取的類型後,點擊「Scrape」即可。 scrape_amazon_template.gif

  • Shopify 商店

對於介面各不相同的 Shopify 商店,建議使用 AI 驅動的 自訂指令 功能。打開你有興趣的 Shopify 商店頁面,點擊右上角的 Thunderbit 外掛圖示,啟動 Thunderbit,再點擊「AI Suggest Column」。AI 會自動辨識你需要的資料:商品名稱、價格、評論等。

接著點擊「Scrape」即可把資料匯入 Excel。你也可以選擇「Copy with headers」或「Copy without headers」,直接貼到 Excel 中。

scrape_shopify.gif

房地產

如果你是房地產經紀人或投資人,就需要整理來自不同區域的房源資訊。對於像 Zillow 這類熱門房地產網站,可以使用內建範本一鍵抓取資料;而像 這類房地產公司網站,則可以使用 自訂指令 功能。

  • Zillow

Thunderbit 已經為多個熱門網站建立內建範本,並提供像 City、State、Pricing、Address 等豐富欄位名稱,資料表非常完整。使用 Thunderbit 的內建範本抓取 Zillow 的房源資料,並整理成 Excel 試算表,清楚又有效率。如下圖所示,你只要打開 ,搜尋你要抓取的資訊,Thunderbit 就會自動跳出「Use Pre-built template」提示框。點擊確認後,就能產出完整資料。 scrape_zillow_template.gif

  • Equity Apartments

房地產公司網站通常會持續更新最新房源,但每家公司的網站都不一樣,而且可能只有幾十筆資料。這種情況下,傳統網頁爬蟲反而不划算,因為設定爬蟲所花的時間,可能比直接複製貼上到 Excel 還久。所以,AI 網頁爬蟲就是最佳解,只要兩次點擊就能把網站上的房源抓下來。

  1. 讓 AI 自動選擇要抓取的資料欄位: 打開你要抓取的網站,點擊 AI Web Scraper,再點擊 AI Suggest Columns。AI 會讀取整個頁面,並產生建議欄位名稱,例如 Apartment Name、Address、Phone Number 等。 scrape_equity_apartments.gif

  2. 點擊 Scrape: 欄位設定好後,點擊「Scrape」。資料產生後,點擊「Download CSV」即可在 Excel 中開啟。你也可以選擇「Copy with headers」或「Copy without headers」,直接貼到 Excel 裡。

使用 Thunderbit 的小技巧

以下是一些能幫助你更有效率使用 的技巧:

  • AI Suggest Columns

想抓取沒有範本的網頁,卻不知道怎麼分類資料?沒問題,交給 AI Suggest Columns 就好。打開你要抓取的網頁,點擊 AI Web Scraper,再點擊 AI Suggest Columns。Thunderbit 會讀取整個頁面,並自動推薦可能的資料欄位,例如價格、日期與地址,大幅減少手動設定的麻煩。

如果你對 AI Suggest Columns 的結果不滿意,也可以手動修改資料欄位,例如更改欄位名稱與調整讀取格式。資料格式可以是數字、文字、單選或多選,甚至圖片。你也可以新增欄位詳細指令,輸入需求,讓 AI 根據你的要求擷取資料。

  • 整合 Notion、Airtable、Google Sheet

匯出的資料可以選擇含標題或不含標題複製,方便你貼到 Excel 中。此外,Thunderbit 也能與其他工具協作,將抓取到的資料無縫同步到 Notion、Airtable 等效率工具,非常適合長期專案或團隊協作使用。

匯出的資料也能直接在 Google Sheets 中開啟,方便個人使用。

  • 抓取 PDF

除了一般網頁資料之外, 也能辨識網路上的 PDF 檔案。PDF 看起來整齊,實際上可能包含文字、表格與圖片等多種資料。傳統 PDF 爬蟲通常相當複雜,但有了 Thunderbit,從 PDF 擷取資料就變得很簡單。就像我在文章 中提到的,你也可以用 Thunderbit 把網路上的 PDF 資料抓到 Excel。

別再為繁瑣的人工資料整理感到頭痛了。無論是 Amazon、Zillow 這類熱門網站,還是任何你想抓取的利基網站,都交給 吧。這款 AI 工具能幫你輕鬆完成所有「把網站資料抓到 Excel」的需求。現在就試試看,你會發現資料抓取原來可以這麼簡單又高效。

常見問題

  1. 我可以使用 Thunderbit 抓取任何網站的資料嗎?

可以。Thunderbit 透過自訂指令功能,讓使用者能從任何網站抓取資料。你只要明確指定想擷取的內容,AI 就會依照需求產生對應輸出。

  1. Thunderbit 可以抓取哪些類型的資料?

你可以抓取各種類型的資料,包括商品名稱、價格、描述、聯絡資訊等。Thunderbit 的 AI 會根據網站內容,自動建議相關欄位。

  1. 我該如何匯出抓取到的資料?

完成爬取後,你可以輕鬆將資料匯出為 CSV,或直接匯入 Excel。Thunderbit 也支援將抓取結果同步到 Notion 或 Airtable,方便後續分析。

  1. 使用網頁爬蟲工具需要程式設計能力嗎?

本文介紹的大多數工具都不需要程式設計能力,但像 Octoparse 和 Web Scraper 這類工具,若使用者具備基本的網頁結構知識與程式思維,通常會更容易發揮最佳效果。

  1. Thunderbit 有哪些常見應用場景?

常見用途包括名單開發(例如從大學網站擷取教職員資訊)、電商價格監控(例如追蹤 Amazon 上的競品),以及房地產資料蒐集(例如整理 Zillow 上的房源列表)。

延伸閱讀

試用 AI 網頁爬蟲
Shuai Guan
Shuai Guan
Co-founder/CEO @ Thunderbit. Passionate about cross section of AI and Automation. He's a big advocate of automation and loves making it more accessible to everyone. Beyond tech, he channels his creativity through a passion for photography, capturing stories one picture at a time.
Topics
AI 網頁爬蟲Excel
目錄

試試 Thunderbit

只要 2 次點擊即可抓取名單與其他資料,AI 驅動。

取得 Thunderbit 免費使用
使用 AI 擷取資料
輕鬆將資料轉移到 Google Sheets、Airtable 或 Notion
PRODUCT HUNT#1 Product of the Week