เริ่มใช้งานได้ในไม่กี่นาที ลองใช้ในเทอร์มินัลของคุณได้เลยตอนนี้
Distill Extract
>_ Python Node.js cURL
1 import requests
2
3 resp = requests.post (
4 "https://open.thunderbit.com/v1/distill" ,
5 headers = { "Authorization" : f"Bearer {API_KEY}" } ,
6 json = { "url" : "https://example.com/article" }
7 )
8
9 markdown = resp.json ( ) [ "data" ] [ "markdown" ]
ความสามารถหลักสองอย่าง Distill สำหรับเนื้อหาที่สะอาด ส่วน Extract สำหรับข้อมูลแบบมีโครงสร้าง
Distill
URL → Markdown
ตัดโฆษณา เมนูนำทาง และสิ่งรบกวนออก — เหลือไว้เฉพาะเนื้อหาที่สำคัญ มีการเรนเดอร์ JS แบบเต็มรูปแบบและระบบหลีกเลี่ยงบอทในตัว ประมวลผล URL ได้สูงสุด 100 รายการต่อคำขอ Extract
URL + Schema → JSON / CSV
สคีมาเดียวใช้ได้กับทุกเว็บไซต์ — ไม่ต้องดูแลแยกตามแต่ละเว็บ ยังใช้งานได้แม้เว็บไซต์ออกแบบใหม่โดยอัตโนมัติ ประมวลผล URL ได้สูงสุด 50 รายการต่อคำขอ ทำไมต้องใช้ Thunderbit โครงสร้างพื้นฐานสำหรับสแครป / ดึงข้อมูลที่เอเจนต์ AI ของคุณคู่ควร
กำหนดว่าอะไร ไม่ใช่วิธีทำ
ไม่ต้องใช้ CSS selector ไม่ต้องใช้ XPath ไม่ต้องมีกฎเฉพาะแต่ละเว็บ อธิบายข้อมูลที่ต้องการด้วย JSON Schema — AI จะหาว่าข้อมูลอยู่ที่ไหนและดึงมาอย่างไร
สคีมาเดียว ใช้ได้กับทุกเว็บไซต์
สคีมาเดียวใช้ได้กับเว็บไซต์อีคอมเมิร์ซ รายการขาย หรือ URL ใดก็ตามที่คุณใส่เข้ามา การเพิ่มแหล่งข้อมูลใหม่เป็นแค่การปรับคอนฟิก ไม่ใช่งานวิศวกรรมใหญ่
ยังทำงานได้แม้เว็บไซต์มีการเปลี่ยนแปลง
สแครปเปอร์แบบดั้งเดิมมักพังทุกครั้งที่มีการออกแบบใหม่ Thunderbit อ่านความหมาย ไม่ใช่โครงสร้าง DOM — จึงยังดึงข้อมูลได้ต่อเนื่องแม้ HTML จะเปลี่ยนไปเบื้องหลัง
กรณีใช้งาน สิ่งที่คุณสร้างได้ด้วย Thunderbit
เอเจนต์ AI ที่เข้าถึงเว็บได้
ให้อินเทอร์ของคุณมีความสามารถอ่านและเข้าใจเว็บเพจใดก็ได้ เรียก API เพียงครั้งเดียวก็ได้บริบทแบบมีโครงสร้าง พร้อมสำหรับขั้นตอนถัดไปของเอเจนต์
RAG และฐานความรู้
แปลง URL ใดก็ได้เป็น Markdown ที่สะอาด แล้วส่งตรงเข้า vector database ของคุณได้เลย ไม่ต้องแปลง HTML ไม่ต้องใช้สคริปต์ทำความสะอาดเนื้อหา
เปลี่ยนทุกเว็บไซต์ให้เป็น API
กำหนดสคีมา ชี้ไปที่ URL แล้วรับ JSON กลับมา สร้าง API ราคาสินค้า API งานสมัครงาน หรือ API ฟีดข่าวได้ — โดยไม่ต้องเขียนสแครปเปอร์แม้แต่ตัวเดียว
การเติมข้อมูลให้ฐานข้อมูล
ทำให้ฐานข้อมูลของคุณสดใหม่ด้วยข้อมูลจากเว็บแบบเรียลไทม์ ดึงโปรไฟล์บริษัท ข้อมูลติดต่อ หรือรายละเอียดรายการตามกำหนดเวลา — สคีมายังคงเดิมแม้แหล่งข้อมูลจะเปลี่ยน
การติดตามคู่แข่ง
ติดตามราคา สินค้าคงคลัง รีวิว หรือการเปลี่ยนแปลงของเนื้อหาบนหลายร้อยหน้า สคีมาเดิม ไปป์ไลน์เดิม เพิ่มแหล่งข้อมูลใหม่ได้ในไม่กี่วินาที
การสร้างชุดข้อมูล
สร้างชุดฝึก โมเดลมาตรฐานการประเมิน หรือชุดข้อมูลสำหรับงานวิจัยจากเว็บสาธารณะ ประมวลผล URL หลายพันรายการแบบแบตช์ให้เป็นผลลัพธ์ที่มีโครงสร้างสม่ำเสมอ
เราใช้ API นี้ในการสร้าง Thunderbit API เดียวกับที่คุณกำลังดูนี้คือพลังขับเคลื่อน Chrome Extension และเว็บแอปของ Thunderbit — มีผู้ใช้มากกว่า 100,000+ คนใช้ดึงข้อมูลจากหน้าหลายสิบล้านหน้าทุกเดือน
นี่ไม่ใช่โปรเจ็กต์เสริม แต่มันคือโครงสร้างพื้นฐาน ที่เราเอาผลิตภัณฑ์ของเราเองไปเดิมพันด้วย
0M+
จำนวนหน้าที่ประมวลผลรายเดือนและกำลังเติบโต
0K+
ผู้ใช้บน Thunderbit Extension
ราคา เริ่มใช้ฟรี จ่ายตามการใช้งาน
รายเดือน รายปี -33%
วิธีทดลองสแครปที่เบาและง่าย ไม่มีค่าใช้จ่าย ไม่ต้องใช้บัตร ไม่ยุ่งยาก
เหมาะสำหรับโปรเจ็กต์เสริมและเครื่องมือขนาดเล็ก เร็ว เรียบง่าย ไม่เกินความจำเป็น
$16 /เดือน
เรียกเก็บรายปี ยูนิตทั้งหมดจ่ายล่วงหน้า
สร้างมาเพื่อปริมาณงานสูงและความเร็ว Thunderbit ในขีดสุด
$40 /เดือน
เรียกเก็บรายปี ยูนิตทั้งหมดจ่ายล่วงหน้า
คำถามที่พบบ่อย
questions ทุกสิ่งที่คุณควรรู้เกี่ยวกับผลิตภัณฑ์และการเรียกเก็บเงิน
Distill กับ Extract ต่างกันอย่างไร?
ใช้งานได้กับเว็บไซต์ที่ใช้ JavaScript หนัก ๆ หรือไม่?
การดึงข้อมูลจะเสียหายไหมเมื่อเว็บไซต์ออกแบบใหม่?
คะแนนความเชื่อมั่นคืออะไร?
งานแบบแบตช์ใช้เวลานานเท่าไร?