Google News 每天彙整來自全球超過 的內容,讓它成為網路上最豐富的即時新聞來源之一。但有一件事很少人一開始就會告訴你:Google 早在 2011 年就關閉了官方 News API,而且到現在也沒有推出替代方案。
這也讓追蹤品牌聲量的公關團隊、監測產業動態的業務人員,以及建立競品情報儀表板的分析師都卡住了。你要的是結構化新聞資料——標題、來源、日期、文章內文——但 Google 會透過 CAPTCHA、速率限制,以及持續變動的頁面版型,積極阻擋自動化擷取。我在 Thunderbit 從事資料擷取工具的開發與測試多年,可以很直接地說:「我隨便抓一下 Google News 就好」和「真的拿到穩定、結構化資料」之間的差距,通常比大多數人想像得還大。
這份指南整理了我找到的 10 款最佳 Google News 爬蟲,涵蓋 API、無程式碼工具與免費方案,並附上誠實的價格比較、反機器人能力分析,以及真正能幫你選對工具的欄位細節。
為什麼 Google News 很難爬?又為什麼沒有官方 API?
Google 於 2011 年 。從那之後,凡是自稱「Google News API」的工具,基本上都是第三方包裝:替你抓取或代理 Google News 結果。最接近官方的程式化選項是 ,它提供每天 100 次免費查詢,超過後每 1,000 次查詢收費 5 美元。但它需要你先設定自訂搜尋引擎,而且並不是 Google News 的直接替代品。
同時,Google 的反擷取防護也是真材實料:
- 基於 IP 的速率限制:如果你對 Google News 請求太快,就會看到 。
- 同意頁與中介頁面:依你所在的位置不同,Google 可能會先顯示 cookie 同意畫面,讓大多數解析器直接失效。
- JavaScript 動態載入內容:Google News 很多內容是動態載入的,單純的 HTTP 請求只會拿到不完整的 HTML。
- 重新導向包裝的網址:Google News 連結通常會先經過 Google 自己的重新導向層,才會到出版社頁面。
- 版面漂移:Google 經常調整新聞卡片、故事群組和主題區塊的結構。
到了 2025 年 3 月,Google 也 ,讓這個平台變得更動態。GitHub 上的社群討論串與 上也充滿開發者分享如何處理同意頁、失效選擇器,以及變動的網址格式。
那為什麼大家還是要抓它?因為 ,而其中 是 Google 從沒見過的新查詢。對品牌監測、趨勢分析、銷售線索偵測與競爭情報來說,Google News 依然是覆蓋範圍最廣、查詢彈性最高的新聞來源之一。
RSS、API 與無程式碼擷取:該怎麼選?
不是每一款 Google News 爬蟲的運作方式都一樣。選工具之前,先了解三種主要做法,以及各自適合什麼情境,會比較有幫助。
| 做法 | 最適合 | 限制 | 範例工具 |
|---|---|---|---|
| Google News RSS 摘要 | 簡單標題監控、免費、低量需求 | 沒有全文、最多約 100 筆結果、篩選有限 | 內建 RSS 閱讀器、n8n |
| SERP / News API | 可擴充的關鍵字監控、結構化中繼資料 | 持續成本、通常只有標題 + 摘要片段 | SerpApi、Scrapingdog、Newsdata.io |
| 直接擷取(無程式碼) | 文章全文、自訂欄位、一次性研究 | 需要處理反機器人機制,擴充性不如 API | Thunderbit、Octoparse、Apify |
| 直接擷取(程式碼) | 最高控制度、自訂流程 | 維護成本高、要處理 CAPTCHA、常常會壞 | Scrapy、BeautifulSoup + Selenium |
多數競品文章只會談 API 和 Python 函式庫。但我看到的使用意圖數據顯示,搜尋「best Google News scrapers」的人裡,有很大一部分其實不是開發者——像是公關經理、營運主管、業務團隊——他們要的是點選式解決方案,不是寫程式專案。這也是為什麼這份清單把瀏覽器擴充功能和無程式碼平台,也一起列進來的原因。
值得注意的是:Google News RSS 摘要仍然免費而且實用,非常適合輕量的標題監控。你可以訂閱主題或關鍵字的 RSS,取得大約 100 筆結果,包含標題、連結和發佈日期。不過如果你需要全文、作者名稱、情緒判斷,或超過一百筆結果,就得使用下面這些工具之一。
我們如何評估最佳 Google News 爬蟲
我對這份清單中的每一款工具都套用相同標準:
- 易用性:無程式碼、需寫程式,或只能用 API
- 反機器人 / CAPTCHA 處理能力:對 Google 來說至關重要
- 可擷取的資料欄位:標題、來源、日期、摘要、網址、全文、作者、圖片、情緒
- 是否提供免費方案與其限制
- 每 1,000 次請求的標準化成本:因為各家定價方式不同(按月、按點數、按請求),我統一換算成最低付費方案下,每 1,000 筆成功結果的成本
- 匯出格式:JSON、CSV、Google Sheets、Airtable、Notion 等
- 擴充性:每日上限、速率限制、並行數
- 最佳使用場景
價格標準化比你想的還重要。一個工具按「搜尋次數」計價(一次搜尋回傳 10 筆結果),另一個按「點數」計價(1 點 = 1 列),還有一個按「請求」計價(如果需要渲染 JavaScript 還要加錢)。如果不先統一標準,你其實是在拿蘋果跟長臂猿比。
一眼看懂 10 款最佳 Google News 爬蟲
這是總比較表。我會在下方逐一深入說明,但先看這個表,可以快速縮小選擇範圍。
| 工具 | 類型 | 免費方案 | 約每 1K 結果成本 | 反機器人處理 | 全文擷取 | 匯出格式 | 最適合 |
|---|---|---|---|---|---|---|---|
| Thunderbit | Chrome 擴充功能 / AI 無程式碼 | 免費方案(6 頁) | 約 $6–$30 / 1K 列(視方案而定) | 瀏覽器模式(使用你的 session) + 雲端模式 | 有(子頁面擷取) | Excel、CSV、Sheets、Airtable、Notion、JSON | 非技術使用者、商務團隊 |
| SerpApi | SERP API | 每月 250 次搜尋 | 約 $5–$15 / 1K 結果 | SERP 專用反偵測 | 無(只有標題 + 摘要片段) | JSON | 開發者、結構化 API 流程 |
| ScraperAPI | 通用擷取 API | 每月 1,000 點數 + 5K 試用 | 約 $0.10–$0.49 / 1K 請求 | 代理輪換、JS 渲染 | 沒有專用解析器 | JSON、HTML | 預算型開發者、通用擷取 |
| Apify | 雲端擷取平台 | 7 天試用 | 依 actor / 運算資源而異 | JS 渲染、無頭瀏覽器 | 視 actor 而定 | JSON、CSV、Excel、API | 技術團隊、預先建好的流程 |
| Bright Data | 企業級爬蟲 / 資料集 | 1K 試用請求 | 約 $1.30–$2.50 / 1K 記錄 | 代理、CAPTCHA 解決、瀏覽器渲染 | 有(News Scraper 產品) | JSON、CSV | 企業級流程 |
| Octoparse | 視覺化無程式碼平台 | 免費方案(有限制) | 約 $9–$25 / 1K 列(攤提後) | 雲端執行、反封鎖 | 有(範本含內文) | CSV、Excel、JSON、資料庫 | 視覺化流程建構者 |
| ScrapingBee | 擷取 API | 試用點數 | 視情況而定(按點數計價,JS 更貴) | 無頭 Chrome、代理輪換、CAPTCHA | 沒有專用解析器 | JSON、HTML | 需要 JS 渲染的開發者 |
| Oxylabs | SERP / 擷取 API | 最多 2,000 筆結果試用 | 約 $1.00–$2.35 / 1K 結果 | 1 億+ 代理、CAPTCHA 解決 | 無(SERP 資料) | JSON | 大規模、地區定向擷取 |
| Scrapingdog | 平價 SERP API | 1,000 免費點數 | 約 $0.10 / 1K 請求 | SERP 專用反偵測 | 無(只有標題 + 摘要片段) | JSON | 重視預算的開發者 |
| Newsdata.io | 專用新聞 API | 每天 200 次請求 | 視方案而定 | 不適用(不是直接抓 Google) | 有(進階方案) | JSON | 新聞專用 NLP 功能 |
有幾個重點很明顯。單次請求成本最低?Scrapingdog 和 ScraperAPI。最容易上手的無程式碼方案?Thunderbit 和 Octoparse。企業級可靠性與地區定向能力?Bright Data 和 Oxylabs。
接下來看詳細拆解。
1. Thunderbit — 最適合商務使用者的無程式碼 Google News 爬蟲
是我們公司自己開發的工具,所以我先講清楚這一點。但我也會具體說明它能做什麼、不能做什麼,因為我認為誠實比吹捧更有用。
Thunderbit 是一款 AI 驅動的 ,專為不想寫程式、卻需要網站結構化資料的人設計。以 Google News 為例,流程大概是這樣:
- 在 Chrome 打開 Google News 搜尋結果。
- 點擊 「AI 建議欄位」——AI 會讀取頁面,自動偵測像標題、來源、日期、摘要和網址等欄位。
- 點擊 「擷取」,把結構化資料匯出成表格。
這只是列表頁。真正適合新聞情境的功能在後面:擷取完 Google News 結果之後,你可以點 「擷取子頁面」,逐一開啟每篇文章網址,抓取全文、作者、圖片等資訊。這直接解決了論壇裡常見的問題:「我拿到連結了,但還是得進去抓真正內容」。
欄位 AI 提示詞 可以讓你替每個欄位加入自訂 AI 指令。比如你可以新增一個「情緒」欄位,提示詞寫成:「判斷這篇文章對 [品牌] 是正面、負面還是中立。」這代表你不只是在擷取資料,還能在同一趟流程中順便補強資料;這是純 API 工具通常做不到的。
Thunderbit 同時支援 瀏覽器擷取(在你的 Chrome session 中執行,沿用你的 cookie 和登入狀態,因此能避開許多機器人偵測)以及 雲端擷取(一次可處理最多 50 個頁面,內建反機器人基礎設施)。你也可以設定 ,做例行新聞監測。
主要功能
- AI 建議欄位可自動偵測標題、來源、日期、網址欄位
- 子頁面擷取可抓取全文、作者與圖片
- 欄位 AI 提示詞可做情緒分析、翻譯或自訂標記
- 雲端與瀏覽器兩種擷取模式
- 支援每日 / 每週監控的排程擷取
- 可免費匯出到 Google Sheets、Airtable、Notion、Excel、CSV、JSON
價格
- 免費方案:6 頁
- 免費試用:10 頁
- 付費方案約從每月 $9 起(按點數計價,1 點 = 1 筆輸出列)
- 標準化每 1K 列成本:約 $6–$30,依方案而定
最適合
業務團隊、公關人員、營運經理,以及任何不想寫一行程式碼、卻需要結構化 Google News 資料的人。當你還需要全文內容,加上像情緒分析這類 AI 增強欄位時,它尤其強大。
2. SerpApi — 最適合開發者的結構化 Google News API
適合想要專用 Google News API 端點、並回傳乾淨結構化 JSON 的使用者。它有兩個相關端點:一個對應 news.google.com(Google News 頁面),另一個對應標準 Google Search 裡的 tbm=nws 新聞分頁。
它的欄位文件非常詳細——你可以取得 title、source、authors、link、thumbnail、topic_token、story_token、related_topics 和 related_publications。其中 story-token 和 topic-token 對去重聚合新聞串流非常實用,這是大多數工具忽略的痛點。
就我的經驗來看,SerpApi 回應速度很快(通常不到 2 秒),穩定性也不錯。主要限制是:它只提供 API,因此你需要寫程式或透過無程式碼整合來使用。沒有全文——只有標題、摘要和中繼資料。
主要功能
- 專用 Google News 搜尋端點,回傳結構化 JSON
- 可做地點與語言定向
- 可透過
tbs參數查詢歷史新聞 - 支援 story 與 topic token,利於新聞聚合
價格
- 免費:每月
- Developer:每月 75 美元,5,000 次搜尋
- Production:每月 150 美元,15,000 次搜尋
- 標準化每 1K 結果成本:約 $5–$15(假設每次搜尋約 10 筆結果)
最適合
正在建立自動化新聞監控流程、需要可靠且結構化 SERP 資料,並希望欄位覆蓋完整的開發者。
3. ScraperAPI — 最適合抓 Google News 的平價通用 API
ScraperAPI 是一個通用擷取 API,不是專門為 Google News 設計的工具。但我們把它列進來,是因為如果你能自己寫解析器,它其實是大規模抓取 Google News 頁面最便宜的方法之一。
ScraperAPI 透過簡單的 REST API 處理代理輪換、JavaScript 渲染和 CAPTCHA 解決。你送出一個網址,它就回傳已渲染的 HTML。問題在於:它沒有專用的 Google News 解析器,所以你得自己擷取欄位(或搭配解析函式庫使用)。
有些使用者回報它的回應時間偏慢(基準測試約 7–23 秒),而且點數制度代表不同請求類型會消耗不同點數。但對已經知道怎麼解析 Google News HTML 的開發者來說,ScraperAPI 的定價很難被打敗。
主要功能
- 自動代理輪換與地區定向
- JavaScript 渲染
- 按點數計價(基本方案含 100K 點數)
- + 5,000 試用點數
價格
- 免費:每月 1,000 點數
- Hobby:每月 49 美元(100,000 點數)
- Startup:每月 149 美元(1,000,000 點數)
- 標準化每 1K 請求成本:約 $0.10–$0.49,依方案而定
最適合
重視預算的開發者,需要便宜的代理 / 渲染層,而且願意自己建立 Google News 解析器。
4. Apify — 最適合預先建好 Google News Actor 的雲端平台
Apify 是一個雲端擷取平台,擁有一個名為「Actors」的市集——也就是可以直接跑、無需寫程式的預建爬蟲。平台上有好幾個社群貢獻的 Google News Scraper actor,而且平台本身負責雲端執行、排程與儲存。
你可以用預建 actor 快速上手。代價是:社群 actor 的品質和維護程度不一。有些在 Google 改版後會失效,而你也得依賴作者修復。Apify 自家的基礎設施本身很穩,但 Google News 的實際體驗取決於你選哪個 actor。
主要功能
- Apify Store 裡有 Google News 專用 actor
- 雲端排程執行
- API 與 webhook 整合
- 可匯出 JSON、CSV、Excel,或透過 API 取用
價格
- 免費試用:7 天
- 付費方案每月 49 美元起
- 標準化每 1K 請求成本:依 actor 與運算資源而異
最適合
想要現成擷取流程、但不想從零開發,且需要雲端排程與 API 整合的技術團隊。
5. Bright Data — 最適合企業級的 Google News 爬蟲
Bright Data 是企業級重量選手。它的 News Scraper 產品明確支援 Google News,並包含自動代理管理、完整瀏覽器渲染、CAPTCHA 解決,以及最多 5,000 個網址的批次處理。欄位包括 ID、URL、標題、作者、主題等。
Bright Data 也販售預先整理好的 Google News 資料集,起價為每 10 萬筆 2.50 美元,對不想即時抓取的團隊來說是很實用的選項。
真正讓它在反機器人處理上脫穎而出的,是那個超過 7,200 萬的住宅代理網路。如果你要從多個國家高頻率抓 Google News,Bright Data 幾乎會把複雜度全部幫你吃掉。
主要功能
- 支援 Google News 的 News Scraper
- 7,200 萬+ 住宅代理,支援地區定向
- 內建 CAPTCHA 解決
- Web Scraper IDE(視覺化、半無程式碼)
- 支援按量付費與訂閱方案
價格
- 免費試用:1,000 次請求
- 按量付費:約 $2.50 / 1K 記錄
- Scale:每月 499 美元(含 384K 記錄,額外約 $1.30 / 1K)
最適合
需要全球覆蓋、合規基礎設施,以及高流量、高可靠度 Google News 資料的大型企業。
6. Octoparse — 最適合 Google News 的桌面無程式碼爬蟲
Octoparse 同時提供一般 Google News Scraper 範本與雲端範本。它的欄位列表透明得出奇:關鍵字、來源、標題、發佈日期、URL、內文、作者、摘要、圖片,以及錯誤訊息欄位。
雲端範本甚至明確標出在 Run Mode 下每 1,000 列 0.1 美元,這種對無程式碼工具來說相當少見。不過實際成本還是取決於你為了雲端排程與反封鎖功能,需要訂閱哪個方案。
Octoparse 的視覺化流程建構器,適合想在不寫程式的前提下,對擷取步驟保有明確控制的使用者。學習曲線比 Thunderbit 的 AI 式操作更陡,但有些人反而喜歡這種細緻度。
主要功能
- 預建 Google News 範本,支援詳細欄位擷取
- 視覺化點選式流程建構器
- 支援雲端與本機執行
- 排程與定期擷取
- 可匯出 CSV、Excel、JSON、資料庫
價格
- 免費方案,功能有限
- 付費方案每月 69 美元起
- 標準化成本:約 $9–$25 / 1K 列(攤提後)
最適合
偏好視覺化桌面工具、希望逐步明確控制擷取流程,且需要定期抓取 Google News 的非技術使用者。
7. ScrapingBee — 最適合處理 JavaScript 很重的 Google News 頁面
ScrapingBee 專精於無頭瀏覽器渲染、代理輪換與反機器人繞過。當 Google News 頁面需要完整執行 JavaScript 才能顯示結果時,它是很強的選擇——而這種情況愈來愈常見。
API 很簡單:送出網址,拿回渲染後的 HTML 或截圖。ScrapingBee 會在背景處理代理輪換與 CAPTCHA 解決。但和 ScraperAPI 一樣,它沒有專用的 Google News 解析器——你仍然得自己擷取欄位。
點數制度代表 JavaScript 渲染請求比純 HTTP 請求更貴,所以在估算 Google News 成本時要記得把這點算進去。
主要功能
- 針對 JS 很重的頁面提供無頭 Chrome 渲染
- 自動代理輪換與 CAPTCHA 繞過
- 支援 Google Search / News 擷取
- 簡單 REST API,回傳 JSON / HTML
價格
- 方案每月 49 美元起
- 按點數計價(JS 渲染每次請求更貴)
- 標準化每 1K 請求成本:依渲染需求而異
最適合
需要透過簡單 API 來穩定處理 Google News 頁面 JavaScript 渲染與反機器人的開發者。
8. Oxylabs — 最適合地區定向結果的 Google News 爬蟲
Oxylabs 在其 SERP 架構下提供專用的 Google News Scraper API,背後有覆蓋 195 個國家的 1 億+ 代理池。主打賣點是:企業級可靠性加上地區特定結果。
Oxylabs 支援結構化 JSON 輸出、即時與批次擷取模式,以及可透過 XPath 和 CSS 選擇器自訂解析邏輯。Google 專用定價也很清楚:Micro 方案約每 1K 結果 2.00 美元,高階方案可降到每 1K 約 0.90 美元。
免費試用可拿到最多 ,足夠你測試資料品質是否符合需求。
主要功能
- 支援 Google News 的 SERP Scraper API
- 覆蓋 195 國的 1 億+ 代理
- 結構化 JSON 輸出
- 即時與批次擷取模式
價格
- 免費試用:最多 2,000 筆結果
- Micro:Google 結果每 1K 約 $2.00(含 JS 渲染約 $2.35 / 1K)
- 高階方案:每 1K 約 $0.90
- 另有客製企業方案
最適合
需要大規模、地區定向且高可靠度 Google News 結果的中大型企業團隊。
9. Scrapingdog — 最適合預算型的 Google News API
Scrapingdog 把自己定位成 SerpApi 的平價替代方案,並提供專用的 Google News API 端點。回傳的結構化 JSON 包含標題、來源、日期、摘要片段與連結。
它的定價真的很積極:有些方案 40 美元就能拿到 40 萬次請求,折算下來大約是每 1,000 次請求 0.10 美元。回應時間通常在 2 秒左右,而且有 1,000 免費點數可以試用。
代價是:Scrapingdog 規模較小,文件與整合數量也比大廠少。不過對新創和重視預算的開發者來說,這個價格非常有吸引力。
主要功能
- 專用 Google News Scraper API 端點
- 結構化 JSON 回應(標題、來源、日期、摘要、連結)
- 可透過
tbs參數取得歷史新聞資料 - 1,000 免費點數可供測試
價格
- 免費:1,000 點數
- 付費方案每月 40 美元起
- 標準化每 1K 請求成本:約 $0.10
最適合
預算有限的開發者與新創團隊,需要以最低單次成本取得大量 Google News 資料。
10. Newsdata.io — 最適合的專用新聞 API(不只 Google News)
是專為新聞資料打造的 API,彙整全球 50,000+ 來源。它嚴格來說不是 Google News 爬蟲——它不直接抓 Google News。相反地,它會獨立彙整相同與額外的出版來源,並回傳支援即時與歷史新聞搜尋的結構化 JSON。
進階方案包含全文擷取、情緒分析與分類篩選——這些功能多數 SERP 擷取工具都不原生提供。免費方案每天可有 ,對測試來說相當大方。
如果你的目標是「取得某個主題的新聞資料」,而不是特別「抓 Google News」,那 Newsdata.io 可能比這份清單中的任何 SERP 工具都更適合。
主要功能
- 即時與歷史新聞搜尋 API
- 全文擷取(進階方案)
- 情緒分析(進階方案)
- 類別、語言、國家篩選
- 每天 200 次請求的免費方案
價格
- 免費:每天 200 次請求
- 付費方案每月 99.99 美元起
- 標準化每 1K 請求成本:依方案而定
最適合
需要內建 NLP 功能(情緒、分類)的專用新聞資料來源,而且不特別需要直接抓 Google News 的團隊。
Google News 爬蟲比較:反機器人處理、資料欄位與價格
在挑選 Google News 爬蟲時,有三個比較維度比其他任何東西都更重要。我還沒看過另一份指南能把這三項系統性地一起講清楚。
各工具如何處理 Google 的反機器人機制
對任何抓 Google News 的人來說,反機器人處理都是第一優先。以下是各工具的做法:
| 策略 | 採用的工具 |
|---|---|
| 內建代理輪換 | Bright Data、ScrapingBee、Oxylabs、ScraperAPI |
| 內含 CAPTCHA 解決 | Bright Data、ScrapingBee、Oxylabs |
| JS 渲染 / 無頭瀏覽器 | Apify、Octoparse、ScrapingBee |
| 基於瀏覽器(使用你的 session) | Thunderbit(瀏覽器擷取模式) |
| SERP 專用反偵測 | SerpApi、Scrapingdog |
Thunderbit 的瀏覽器擷取模式值得多說一點。因為它是在你實際的 Chrome session 裡執行,所以會沿用你的 cookie 和登入狀態。這代表它能避開許多無頭爬蟲容易撞上的機器人偵測觸發點——同意頁、CAPTCHA 挑戰,以及指紋辨識檢查。若有大量需求,Thunderbit 的雲端擷取會用自己的反機器人基礎設施,一次處理 50 個頁面。
各 Google News 爬蟲回傳哪些資料欄位?
這是別人很少整理、但最關鍵的一張比較表。因為有些工具只給你標題和連結,有些則能擷取全文、作者,甚至情緒。
| 工具 | 標題 | 來源 | 日期 | 摘要 | 文章網址 | 全文 | 作者 | 圖片 | 情緒 |
|---|---|---|---|---|---|---|---|---|---|
| Thunderbit | ✅ | ✅ | ✅ | ✅ | ✅ | ✅(透過子頁面) | ✅(透過 AI) | ✅ | ✅(透過欄位 AI 提示詞) |
| SerpApi | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ✅ | ✅ | ❌ |
| ScraperAPI | ✅(自訂解析) | ✅(自訂解析) | ✅(自訂解析) | ✅(自訂解析) | ✅(自訂解析) | ❌ | ❌ | ❌ | ❌ |
| Apify | ✅ | ✅ | ✅ | ✅ | ✅ | 視 actor 而定 | 視 actor 而定 | ✅ | ❌ |
| Bright Data | ✅ | ✅ | ✅ | ✅ | ✅ | ✅(News Scraper) | ✅ | ✅ | ❌ |
| Octoparse | ✅ | ✅ | ✅ | ✅ | ✅ | ✅(範本) | ✅ | ✅ | ❌ |
| ScrapingBee | ✅(自訂解析) | ✅(自訂解析) | ✅(自訂解析) | ✅(自訂解析) | ✅(自訂解析) | ❌ | ❌ | ❌ | ❌ |
| Oxylabs | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ✅ | ❌ |
| Scrapingdog | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ | ❌ |
| Newsdata.io | ✅ | ✅ | ✅ | ✅ | ✅ | ✅(進階方案) | ✅ | ✅ | ✅(進階方案) |
這裡最亮眼的是,Thunderbit 可以透過子頁面擷取抓出全文,還能在同一趟流程中加入像情緒分析這類 AI 增強欄位。Newsdata.io 也提供情緒和全文,但它是透過專用新聞 API,而不是 Google News 擷取。多數 SERP API 只能回傳 Google News 列表頁上看得到的內容——標題、摘要片段和連結。
標準化每 1,000 筆結果成本
這是我當初在評估工具時最想看到的一張表,卻到處都找不到。因為每家廠商定價方式不同,所以我把所有數字統一換算成最低付費方案下,每 1,000 筆成功結果的成本。
| 工具 | 免費方案 | 最低付費方案 | 約每 1K 結果成本 | 備註 |
|---|---|---|---|---|
| Thunderbit | 免費 6 頁 / 試用 10 頁 | 約從每月 $9 起(按點數) | 約 $6–$30 | 1 點 = 1 列;含 AI 擷取 |
| SerpApi | 每月 250 次搜尋 | 每月 $75(5,000 次搜尋) | 約 $15 | 結構化 JSON、Google News 端點 |
| ScraperAPI | 每月 1,000 點數 | 每月 $49(100K 點數) | 約 $0.49 | 沒有專用 Google News 解析器 |
| Apify | 7 天試用 | 每月 $49 | 不定 | 視 actor 與運算資源而定 |
| Bright Data | 1K 試用請求 | 按量付費 | 約 $1.30–$2.50 | 企業級,也有資料集選項 |
| Octoparse | 免費方案(有限制) | $69/月 | 約 $9–$25 | 雲端範本:基礎每 1K 列 $0.1 |
| ScrapingBee | 試用點數 | 每月 $49 | 不定(JS 更貴) | 按點數計價,沒有專用解析器 |
| Oxylabs | 最多 2,000 筆結果 | Micro 方案 | 約 $1.00–$2.35 | 地區定向、結構化 JSON |
| Scrapingdog | 1,000 點數 | 每月 $40 | 約 $0.10 | 平價首選,專用 News 端點 |
| Newsdata.io | 每天 200 次請求 | 每月 $99.99 | 依方案而定 | 不是直接抓 Google;有 NLP 功能 |
幾個重點。Scrapingdog 的單次成本遠低於其他工具,但它只回傳 SERP 層級資料(沒有全文)。Bright Data 和 Oxylabs 的成本屬於中段,但反機器人基礎設施最強。Thunderbit 每列成本比最便宜的 API 高一些,但它是少數能在不用寫程式的情況下,同時提供全文擷取與 AI 增強的工具。
你該選哪一款 Google News 爬蟲?
依情境來看,我的建議如下:
- 只需要標題做監控,預算很低? → Scrapingdog 或 Newsdata.io 免費方案
- 非技術使用者,需要全文 + 資料增強? →
- 開發者要建立結構化新聞管線? → SerpApi(欄位覆蓋最佳)或 Scrapingdog(價格最佳)
- 企業、高流量、需要地區定向? → Bright Data 或 Oxylabs
- 想要視覺化桌面流程? → Octoparse
- 需要 Google News 以外、還有 NLP 功能的新聞資料? → Newsdata.io
- 需要最便宜的通用代理 / 渲染層? → ScraperAPI
適合的工具取決於三件事:你的技術能力、你需要的流量,以及你要的是標題即可還是全文內容。如果你還不確定,先從免費方案開始——這些工具大多都有——看看資料品質是否符合你的實際情境。
如果你想先試最快的無程式碼路徑,Thunderbit 的 可以讓你用幾下點擊就抓到 Google News 結果,並直接匯出到 Google Sheets 或 Airtable。想看操作教學,可以參考我們的 或 。
也祝你的標題永遠結構化、CAPTCHA 盡量少、匯出檔永遠乾淨。
常見問題
Google 有官方 News API 嗎?
沒有。Google ,而且一直沒有推出替代品。最接近的官方選項是 Custom Search JSON API,每天提供 100 次免費查詢,之後每 1,000 次查詢收費 5 美元,但它需要先設定自訂搜尋引擎,而且不是專門的 Google News 產品。現在凡是自稱「Google News API」的工具,都是第三方服務。
我可以用 Google News RSS 摘要代替爬蟲嗎?
可以,適合簡單情境。Google News RSS 摘要可免費提供標題和連結,但大約只到 100 筆結果,沒有全文,篩選選項也很少。如果你需要更豐富的資料——全文、作者名稱、情緒分析,或超過 100 筆結果——就需要這份清單中的專用爬蟲或 API。
我要怎麼從 Google News 結果取得全文?
Google News 列表頁只會顯示標題和摘要片段。若要取得全文,你需要能沿著文章連結進去,再擷取頁面內容的工具。Thunderbit 的子頁面擷取會在抓完 Google News 列表頁後自動完成這件事。像 Newsdata.io 這類 API 工具,在進階方案中也能提供全文。大多數 SERP API(例如 SerpApi、Scrapingdog、Oxylabs)只會回傳列表頁可見的內容。
抓 Google News 合法嗎?
一般來說,擷取公開可見資料在美國法下通常不會被視為未經授權存取(依 ),但這不代表它在政策上就沒問題。Google 的服務條款不鼓勵自動化查詢,而當它偵測到機器人流量時,也會主動送出 。使用者應該只處理公開可取得的資料、尊重文章內容的著作權,若是商業規模用途,請先諮詢法律顧問。
Google News 爬蟲最常壞在哪裡?
最常見的元凶包括:自動查詢偵測(CAPTCHA 和 429 錯誤)、地區 / 語言造成的結果差異、同意頁與中介頁面、新聞卡片版型的標記變更,以及重新導向網址的正規化。最穩定的資料層是文章中繼資料(標題、來源、日期、網址)。最不穩定的是呈現層——故事聚合、縮圖和區塊組織經常變動。
延伸閱讀