AI-Powered Web Scraper API

ไม่ต้องดูแลเลย ตลอดไป

เรียก API เพียงครั้งเดียวก็เปลี่ยนเว็บเพจใดก็ได้ให้เป็น Markdown หรือตาราง เติมข้อมูลสดจากเว็บให้เอเจนต์ของคุณ สร้าง RAG และเพิ่มข้อมูลให้ฐานข้อมูล — เราดูแลโครงสร้างพื้นฐานให้

ได้รับความไว้วางใจจากผู้ใช้มากกว่า 100,000+ คนทั่วโลก

harvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logo

เริ่มใช้งานได้ในไม่กี่นาที

ลองใช้ในเทอร์มินัลของคุณได้เลยตอนนี้

>_
URL เป็น Markdown
1import requests
2
3resp = requests.post(
4 "https://open.thunderbit.com/v1/distill",
5 headers={"Authorization": f"Bearer {API_KEY}"},
6 json={"url": "https://example.com/article"}
7)
8
9markdown = resp.json()["data"]["markdown"]
Core API

ความสามารถหลักสองอย่าง

Distill สำหรับเนื้อหาที่สะอาด ส่วน Extract สำหรับข้อมูลแบบมีโครงสร้าง

Distill
URLMarkdown
ตัดโฆษณา เมนูนำทาง และสิ่งรบกวนออก — เหลือไว้เฉพาะเนื้อหาที่สำคัญ
มีการเรนเดอร์ JS แบบเต็มรูปแบบและระบบหลีกเลี่ยงบอทในตัว
ประมวลผล URL ได้สูงสุด 100 รายการต่อคำขอ
Extract
URL + SchemaJSON / CSV
สคีมาเดียวใช้ได้กับทุกเว็บไซต์ — ไม่ต้องดูแลแยกตามแต่ละเว็บ
ยังใช้งานได้แม้เว็บไซต์ออกแบบใหม่โดยอัตโนมัติ
ประมวลผล URL ได้สูงสุด 50 รายการต่อคำขอ
ข้อดี

ทำไมต้องใช้ Thunderbit

โครงสร้างพื้นฐานสำหรับสแครป / ดึงข้อมูลที่เอเจนต์ AI ของคุณคู่ควร

กำหนดว่าอะไร ไม่ใช่วิธีทำ
ไม่ต้องใช้ CSS selector ไม่ต้องใช้ XPath ไม่ต้องมีกฎเฉพาะแต่ละเว็บ อธิบายข้อมูลที่ต้องการด้วย JSON Schema — AI จะหาว่าข้อมูลอยู่ที่ไหนและดึงมาอย่างไร
สคีมาเดียว ใช้ได้กับทุกเว็บไซต์
สคีมาเดียวใช้ได้กับเว็บไซต์อีคอมเมิร์ซ รายการขาย หรือ URL ใดก็ตามที่คุณใส่เข้ามา การเพิ่มแหล่งข้อมูลใหม่เป็นแค่การปรับคอนฟิก ไม่ใช่งานวิศวกรรมใหญ่
ยังทำงานได้แม้เว็บไซต์มีการเปลี่ยนแปลง
สแครปเปอร์แบบดั้งเดิมมักพังทุกครั้งที่มีการออกแบบใหม่ Thunderbit อ่านความหมาย ไม่ใช่โครงสร้าง DOM — จึงยังดึงข้อมูลได้ต่อเนื่องแม้ HTML จะเปลี่ยนไปเบื้องหลัง
อุตสาหกรรม

กรณีใช้งาน

สิ่งที่คุณสร้างได้ด้วย Thunderbit

เอเจนต์ AI ที่เข้าถึงเว็บได้
ให้อินเทอร์ของคุณมีความสามารถอ่านและเข้าใจเว็บเพจใดก็ได้ เรียก API เพียงครั้งเดียวก็ได้บริบทแบบมีโครงสร้าง พร้อมสำหรับขั้นตอนถัดไปของเอเจนต์
RAG และฐานความรู้
แปลง URL ใดก็ได้เป็น Markdown ที่สะอาด แล้วส่งตรงเข้า vector database ของคุณได้เลย ไม่ต้องแปลง HTML ไม่ต้องใช้สคริปต์ทำความสะอาดเนื้อหา
เปลี่ยนทุกเว็บไซต์ให้เป็น API
กำหนดสคีมา ชี้ไปที่ URL แล้วรับ JSON กลับมา สร้าง API ราคาสินค้า API งานสมัครงาน หรือ API ฟีดข่าวได้ — โดยไม่ต้องเขียนสแครปเปอร์แม้แต่ตัวเดียว
การเติมข้อมูลให้ฐานข้อมูล
ทำให้ฐานข้อมูลของคุณสดใหม่ด้วยข้อมูลจากเว็บแบบเรียลไทม์ ดึงโปรไฟล์บริษัท ข้อมูลติดต่อ หรือรายละเอียดรายการตามกำหนดเวลา — สคีมายังคงเดิมแม้แหล่งข้อมูลจะเปลี่ยน
การติดตามคู่แข่ง
ติดตามราคา สินค้าคงคลัง รีวิว หรือการเปลี่ยนแปลงของเนื้อหาบนหลายร้อยหน้า สคีมาเดิม ไปป์ไลน์เดิม เพิ่มแหล่งข้อมูลใหม่ได้ในไม่กี่วินาที
การสร้างชุดข้อมูล
สร้างชุดฝึก โมเดลมาตรฐานการประเมิน หรือชุดข้อมูลสำหรับงานวิจัยจากเว็บสาธารณะ ประมวลผล URL หลายพันรายการแบบแบตช์ให้เป็นผลลัพธ์ที่มีโครงสร้างสม่ำเสมอ

เราใช้ API นี้ในการสร้าง Thunderbit

API เดียวกับที่คุณกำลังดูนี้คือพลังขับเคลื่อน Chrome Extension และเว็บแอปของ Thunderbit — มีผู้ใช้มากกว่า 100,000+ คนใช้ดึงข้อมูลจากหน้าหลายสิบล้านหน้าทุกเดือน นี่ไม่ใช่โปรเจ็กต์เสริม แต่มันคือโครงสร้างพื้นฐาน ที่เราเอาผลิตภัณฑ์ของเราเองไปเดิมพันด้วย

0M+
จำนวนหน้าที่ประมวลผลรายเดือนและกำลังเติบโต
0K+
ผู้ใช้บน Thunderbit Extension
0%
เวลาทำงาน
แผน

ราคา

เริ่มใช้ฟรี จ่ายตามการใช้งาน

ฟรี
วิธีทดลองสแครปที่เบาและง่าย ไม่มีค่าใช้จ่าย ไม่ต้องใช้บัตร ไม่ยุ่งยาก
600 ยูนิต / ครั้งเดียว
$0ครั้งเดียว
 
Distill 600 หน้า
Extract 30 หน้า
คำขอพร้อมกัน 2 รายการ
Starter
เหมาะสำหรับโปรเจ็กต์เสริมและเครื่องมือขนาดเล็ก เร็ว เรียบง่าย ไม่เกินความจำเป็น
60,000 API units / ปี
$16/เดือน
เรียกเก็บรายปี ยูนิตทั้งหมดจ่ายล่วงหน้า
Distill 60,000 หน้า
Extract 3,000 หน้า
คำขอพร้อมกัน 30 รายการ
การสนับสนุนขั้นพื้นฐาน
โปร1ยอดนิยมที่สุด
สร้างมาเพื่อปริมาณงานสูงและความเร็ว Thunderbit ในขีดสุด
600,000 API units / ปี
$40/เดือน
เรียกเก็บรายปี ยูนิตทั้งหมดจ่ายล่วงหน้า
600K1200K2400K4800K
Distill 600,000 หน้า
Extract 30,000 หน้า
คำขอพร้อมกัน 50 รายการ
การสนับสนุนแบบเร่งด่วน

คำถามที่พบบ่อย questions

ทุกสิ่งที่คุณควรรู้เกี่ยวกับผลิตภัณฑ์และการเรียกเก็บเงิน