AI 驅動的 Web Scraper API

零維護。永遠如此。

一次 API 呼叫,就能把任何網頁轉成 Markdown 或表格。用即時網頁資料為你的 agent 提供燃料、建立 RAG、豐富資料庫——基礎架構交給我們。

深受全球 100,000+ 用戶信賴

ntnu logoccu logodelta_electronics logotsinghua_university logoharvard_university logobcg logomit logoadidas logored_bull_technology logowix logored_hat logontnu logoccu logodelta_electronics logotsinghua_university logoharvard_university logobcg logomit logoadidas logored_bull_technology logowix logored_hat logontnu logoccu logodelta_electronics logotsinghua_university logoharvard_university logobcg logomit logoadidas logored_bull_technology logowix logored_hat logontnu logoccu logodelta_electronics logotsinghua_university logoharvard_university logobcg logomit logoadidas logored_bull_technology logowix logored_hat logontnu logoccu logodelta_electronics logotsinghua_university logoharvard_university logobcg logomit logoadidas logored_bull_technology logowix logored_hat logontnu logoccu logodelta_electronics logotsinghua_university logoharvard_university logobcg logomit logoadidas logored_bull_technology logowix logored_hat logo

幾分鐘內即可上線運行

現在就到你的終端機試試。

>_
URL 轉 Markdown
1import requests
2
3resp = requests.post(
4 "https://open.thunderbit.com/v1/distill",
5 headers={"Authorization": f"Bearer {API_KEY}"},
6 json={"url": "https://example.com/article"}
7)
8
9markdown = resp.json()["data"]["markdown"]
核心 API

兩大核心能力

Distill 用於整理乾淨內容,Extract 用於結構化資料

Distill
URLMarkdown
去除廣告、導覽與雜訊——只保留重要內容
內建完整 JS 渲染與反機器人繞過
每次請求可批次處理最多 100 個 URL
Extract
URL + SchemaJSON / CSV
一套 Schema 可套用所有網站——無需逐站維護
自動應對網站改版
每次請求可批次處理最多 50 個 URL
優勢

為什麼使用 Thunderbit

你的 AI Agent 值得擁有的抓取 / 資料擷取基礎架構

定義要什麼,而不是怎麼做
不需要 CSS selector、不需要 XPath、也不需要逐站規則。只要用 JSON Schema 描述你需要的資料——AI 會自行判斷資料在哪裡,以及如何取得。
一套 Schema,適用所有網站
同一套 schema 可用於電商網站、銷售列表或你丟給它的任何 URL。新增資料來源只是一次設定變更,而不是一場工程衝刺。
即使網站改版也能持續運作
傳統 scraper 每次改版都會失效。Thunderbit 讀的是語意,不是 DOM 結構——因此即使底層 HTML 改變,抓取仍可持續運作。
產業

使用情境

你可以用 Thunderbit 建立什麼

具備網頁存取能力的 AI Agent
讓你的 agent 能夠讀取並理解任何網頁。一次 API 呼叫即可回傳結構化上下文,供你的 agent 進行下一步。
RAG 與知識庫
將任何 URL 轉為乾淨的 Markdown,並直接餵入你的向量資料庫。無需 HTML 解析,也無需內容清理腳本。
將任何網站轉為 API
定義一個 schema,指定一個 URL,就能拿回 JSON。打造商品價格 API、職缺列表 API 或新聞 Feed API——完全不用寫任何 scraper。
資料庫豐富化
用即時網頁資料保持你的資料庫最新。依排程抓取公司資訊、聯絡方式或列表細節——即使來源變更,schema 也維持不變。
競品監測
追蹤數百個頁面的價格、庫存、評論或內容變化。相同的 schema、相同的流程,幾秒內即可新增來源。
資料集建置
從公開網路建立訓練集、評估基準或研究資料集。可批次處理數千個 URL,輸出一致的結構化結果。

我們就是用這個 API 打造 Thunderbit

你正在查看的同一套 API,支撐著 Thunderbit 的 Chrome Extension 與網頁應用——被 100,000+ 用戶用來每月擷取數千萬個頁面。 這不是一個副業專案。這是我們押注自家產品的基礎架構 we bet our own product on

0M+
每月處理的頁面數持續成長
0K+
Thunderbit 擴充功能用戶
0%
正常運作時間
方案

價格

免費開始,隨用隨付

免費版
輕鬆體驗抓取。無需費用、無需信用卡、毫無負擔。
600 點數 / 一次性
$0一次性
 
Distill 600 個頁面
Extract 30 個頁面
2 個並行請求
入門版
非常適合副業專案與小型工具。快速、簡單,不過度設計。
60,000 API 點數 / 年
$16/月
按年計費。點數一次付清。
Distill 60,000 個頁面
Extract 3,000 個頁面
30 個並行請求
基本支援
專業版1最受歡迎
為高流量與高速而生。Thunderbit 火力全開。
600,000 API 點數 / 年
$40/月
按年計費。點數一次付清。
600K1200K2400K4800K
Distill 600,000 個頁面
Extract 30,000 個頁面
50 個並行請求
優先支援

常見 問題

關於產品與帳單,你需要知道的一切。