AI-Powered Web Scraper API

ไม่ต้องดูแลรักษาเลย ตลอดไป

ใช้คำขอ API เพียงครั้งเดียวก็แปลงเว็บเพจใดก็ได้เป็น Markdown หรือ ตาราง เติมข้อมูลเว็บสดให้ agent ของคุณ สร้าง RAG และเสริมฐานข้อมูล — เราดูแลโครงสร้างพื้นฐานให้

ได้รับความไว้วางใจจากผู้ใช้กว่า 100,000+ คนทั่วโลก

harvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logo

เริ่มใช้งานได้ภายในไม่กี่นาที

ลองใช้ในเทอร์มินัลของคุณได้เลยตอนนี้

>_
URL เป็น Markdown
1import requests
2
3resp = requests.post(
4 "https://open.thunderbit.com/v1/distill",
5 headers={"Authorization": f"Bearer {API_KEY}"},
6 json={"url": "https://example.com/article"}
7)
8
9markdown = resp.json()["data"]["markdown"]
Core API

ความสามารถหลัก 2 อย่าง

Distill สำหรับเนื้อหาที่สะอาดตา ส่วน Extract สำหรับข้อมูลที่มีโครงสร้าง

Distill
URLMarkdown
ตัดโฆษณา เมนูนำทาง และสิ่งรบกวนออก — เหลือเฉพาะเนื้อหาที่สำคัญ
รองรับการเรนเดอร์ JS แบบเต็มรูปแบบและมีระบบหลบหลีกบอทในตัว
ประมวลผล URL ได้สูงสุด 100 รายการต่อคำขอ
Extract
URL + SchemaJSON / CSV
Schema เดียวใช้ได้กับทุกเว็บไซต์ — ไม่ต้องดูแลแยกตามเว็บไซต์
รองรับการปรับดีไซน์เว็บไซต์โดยอัตโนมัติ
ประมวลผล URL ได้สูงสุด 50 รายการต่อคำขอ
ข้อดี

ทำไมต้องใช้ Thunderbit

โครงสร้างพื้นฐานสำหรับการดึงข้อมูล/แยกข้อมูลที่ AI agent ของคุณคู่ควร

กำหนดว่าอะไร ไม่ใช่วิธีการ
ไม่ต้องใช้ CSS selector ไม่ต้องใช้ XPath ไม่ต้องมีกฎแยกตามเว็บไซต์ เพียงอธิบายข้อมูลที่ต้องการด้วย JSON Schema — AI จะหาว่าข้อมูลอยู่ที่ไหนและดึงมาอย่างไร
Schema เดียว ใช้ได้กับทุกเว็บไซต์
Schema เดียวใช้ได้กับเว็บไซต์อีคอมเมิร์ซ รายการขาย หรือ URL ใดก็ตามที่คุณใส่เข้าไป การเพิ่มแหล่งข้อมูลใหม่เป็นเพียงการปรับค่าคอนฟิก ไม่ใช่งานวิศวกรรมใหญ่
ยังใช้งานได้แม้เว็บไซต์จะเปลี่ยน
scraper แบบเดิมพังทุกครั้งที่เว็บไซต์ปรับดีไซน์ แต่ Thunderbit อ่านความหมาย ไม่ใช่โครงสร้าง DOM — ดังนั้นการดึงข้อมูลจึงยังทำงานต่อได้แม้ HTML จะเปลี่ยนไป
อุตสาหกรรม

กรณีใช้งาน

สิ่งที่คุณสร้างได้ด้วย Thunderbit

AI Agents ที่เข้าถึงเว็บได้
ให้ agent ของคุณอ่านและเข้าใจเว็บเพจใดก็ได้ คำขอ API เพียงครั้งเดียวก็คืนบริบทแบบมีโครงสร้าง พร้อมสำหรับขั้นตอนถัดไปของ agent
RAG และคลังความรู้
แปลง URL ใดก็ได้เป็น Markdown ที่สะอาด แล้วส่งตรงเข้า vector database ของคุณ ไม่ต้องแยกวิเคราะห์ HTML ไม่ต้องมีสคริปต์ทำความสะอาดเนื้อหา
เปลี่ยนทุกเว็บไซต์ให้เป็น API
กำหนด schema ชี้ไปที่ URL แล้วรับ JSON กลับมา สร้าง API ราคาสินค้า API รายการงาน หรือ API ฟีดข่าวได้ — โดยไม่ต้องเขียน scraper เลยแม้แต่ตัวเดียว
การเสริมข้อมูลฐานข้อมูล
ทำให้ฐานข้อมูลของคุณอัปเดตเสมอด้วยข้อมูลเว็บแบบเรียลไทม์ ดึงโปรไฟล์บริษัท ข้อมูลติดต่อ หรือรายละเอียดรายการตามกำหนดเวลา — schema เดิมแม้แหล่งข้อมูลจะเปลี่ยน
การติดตามคู่แข่ง
ติดตามราคา สินค้าคงคลัง รีวิว หรือการเปลี่ยนแปลงเนื้อหาข้ามหลายร้อยหน้า Schema เดิม ไปป์ไลน์เดิม เพิ่มแหล่งข้อมูลใหม่ได้ในไม่กี่วินาที
การสร้างชุดข้อมูล
สร้างชุดฝึกสอน เกณฑ์ประเมิน หรือชุดข้อมูลวิจัยจากเว็บสาธารณะ ประมวลผล URL นับพันแบบแบตช์ให้เป็นผลลัพธ์ที่มีโครงสร้างสม่ำเสมอ

เราใช้ API นี้สร้าง Thunderbit

API เดียวกับที่คุณกำลังดูนี้เป็นพลังให้กับ Chrome Extension และเว็บแอปของ Thunderbit — ซึ่งมีผู้ใช้กว่า 100,000+ คนใช้ดึงข้อมูลจากหน้าเว็บนับสิบล้านหน้าทุกเดือน นี่ไม่ใช่โปรเจกต์เสริม แต่มันคือโครงสร้างพื้นฐาน ที่เราลงเดิมพันด้วยผลิตภัณฑ์ของเราเอง

0M+
จำนวนหน้าที่ประมวลผลต่อเดือนและยังเพิ่มขึ้นเรื่อย ๆ
0K+
ผู้ใช้บนส่วนขยาย Thunderbit
0%
ระยะเวลาทำงาน
แผน

ราคา

เริ่มใช้ฟรี จ่ายตามการเติบโต

ฟรี
วิธีทดลองดึงข้อมูลแบบเบา ๆ ไม่มีค่าใช้จ่าย ไม่ต้องใช้บัตร ไม่ยุ่งยาก
600 หน่วย / ครั้งเดียว
$0ครั้งเดียว
 
Distill 600 หน้า
Extract 30 หน้า
คำขอพร้อมกัน 2 รายการ
เริ่มต้น
เหมาะสำหรับโปรเจกต์เสริมและเครื่องมือขนาดเล็ก รวดเร็ว เรียบง่าย ไม่เกินความจำเป็น
60,000 หน่วย API / ปี
$16/เดือน
เรียกเก็บเงินรายปี ชำระหน่วยทั้งหมดล่วงหน้า
Distill 60,000 หน้า
Extract 3,000 หน้า
คำขอพร้อมกัน 30 รายการ
การสนับสนุนพื้นฐาน
Pro1นิยมที่สุด
สร้างมาเพื่อปริมาณงานสูงและความเร็ว Thunderbit ในศักยภาพเต็มที่
600,000 หน่วย API / ปี
$40/เดือน
เรียกเก็บเงินรายปี ชำระหน่วยทั้งหมดล่วงหน้า
600K1200K2400K4800K
Distill 600,000 หน้า
Extract 30,000 หน้า
คำขอพร้อมกัน 50 รายการ
การสนับสนุนแบบเร่งด่วน

คำถามที่พบบ่อย

ทุกสิ่งที่คุณควรรู้เกี่ยวกับผลิตภัณฑ์และการเรียกเก็บเงิน