เริ่มใช้งานได้ภายในไม่กี่นาที
ลองใช้ในเทอร์มินัลของคุณได้เลยตอนนี้
>_
1import requests
2
3resp = requests.post(
4 "https://open.thunderbit.com/v1/distill",
5 headers={"Authorization": f"Bearer {API_KEY}"},
6 json={"url": "https://example.com/article"}
7)
8
9markdown = resp.json()["data"]["markdown"]
ความสามารถหลัก 2 อย่าง
Distill สำหรับเนื้อหาที่สะอาดตา ส่วน Extract สำหรับข้อมูลที่มีโครงสร้าง
Distill
URL→Markdown
ตัดโฆษณา เมนูนำทาง และสิ่งรบกวนออก — เหลือเฉพาะเนื้อหาที่สำคัญ รองรับการเรนเดอร์ JS แบบเต็มรูปแบบและมีระบบหลบหลีกบอทในตัว ประมวลผล URL ได้สูงสุด 100 รายการต่อคำขอ Extract
URL + Schema→JSON / CSV
Schema เดียวใช้ได้กับทุกเว็บไซต์ — ไม่ต้องดูแลแยกตามเว็บไซต์ รองรับการปรับดีไซน์เว็บไซต์โดยอัตโนมัติ ประมวลผล URL ได้สูงสุด 50 รายการต่อคำขอ ทำไมต้องใช้ Thunderbit
โครงสร้างพื้นฐานสำหรับการดึงข้อมูล/แยกข้อมูลที่ AI agent ของคุณคู่ควร
กำหนดว่าอะไร ไม่ใช่วิธีการ
ไม่ต้องใช้ CSS selector ไม่ต้องใช้ XPath ไม่ต้องมีกฎแยกตามเว็บไซต์ เพียงอธิบายข้อมูลที่ต้องการด้วย JSON Schema — AI จะหาว่าข้อมูลอยู่ที่ไหนและดึงมาอย่างไร
Schema เดียว ใช้ได้กับทุกเว็บไซต์
Schema เดียวใช้ได้กับเว็บไซต์อีคอมเมิร์ซ รายการขาย หรือ URL ใดก็ตามที่คุณใส่เข้าไป การเพิ่มแหล่งข้อมูลใหม่เป็นเพียงการปรับค่าคอนฟิก ไม่ใช่งานวิศวกรรมใหญ่
ยังใช้งานได้แม้เว็บไซต์จะเปลี่ยน
scraper แบบเดิมพังทุกครั้งที่เว็บไซต์ปรับดีไซน์ แต่ Thunderbit อ่านความหมาย ไม่ใช่โครงสร้าง DOM — ดังนั้นการดึงข้อมูลจึงยังทำงานต่อได้แม้ HTML จะเปลี่ยนไป
กรณีใช้งาน
สิ่งที่คุณสร้างได้ด้วย Thunderbit
AI Agents ที่เข้าถึงเว็บได้
ให้ agent ของคุณอ่านและเข้าใจเว็บเพจใดก็ได้ คำขอ API เพียงครั้งเดียวก็คืนบริบทแบบมีโครงสร้าง พร้อมสำหรับขั้นตอนถัดไปของ agent
RAG และคลังความรู้
แปลง URL ใดก็ได้เป็น Markdown ที่สะอาด แล้วส่งตรงเข้า vector database ของคุณ ไม่ต้องแยกวิเคราะห์ HTML ไม่ต้องมีสคริปต์ทำความสะอาดเนื้อหา
เปลี่ยนทุกเว็บไซต์ให้เป็น API
กำหนด schema ชี้ไปที่ URL แล้วรับ JSON กลับมา สร้าง API ราคาสินค้า API รายการงาน หรือ API ฟีดข่าวได้ — โดยไม่ต้องเขียน scraper เลยแม้แต่ตัวเดียว
การเสริมข้อมูลฐานข้อมูล
ทำให้ฐานข้อมูลของคุณอัปเดตเสมอด้วยข้อมูลเว็บแบบเรียลไทม์ ดึงโปรไฟล์บริษัท ข้อมูลติดต่อ หรือรายละเอียดรายการตามกำหนดเวลา — schema เดิมแม้แหล่งข้อมูลจะเปลี่ยน
การติดตามคู่แข่ง
ติดตามราคา สินค้าคงคลัง รีวิว หรือการเปลี่ยนแปลงเนื้อหาข้ามหลายร้อยหน้า Schema เดิม ไปป์ไลน์เดิม เพิ่มแหล่งข้อมูลใหม่ได้ในไม่กี่วินาที
การสร้างชุดข้อมูล
สร้างชุดฝึกสอน เกณฑ์ประเมิน หรือชุดข้อมูลวิจัยจากเว็บสาธารณะ ประมวลผล URL นับพันแบบแบตช์ให้เป็นผลลัพธ์ที่มีโครงสร้างสม่ำเสมอ
เราใช้ API นี้สร้าง Thunderbit
API เดียวกับที่คุณกำลังดูนี้เป็นพลังให้กับ Chrome Extension และเว็บแอปของ Thunderbit — ซึ่งมีผู้ใช้กว่า 100,000+ คนใช้ดึงข้อมูลจากหน้าเว็บนับสิบล้านหน้าทุกเดือน
นี่ไม่ใช่โปรเจกต์เสริม แต่มันคือโครงสร้างพื้นฐาน ที่เราลงเดิมพันด้วยผลิตภัณฑ์ของเราเอง
0M+
จำนวนหน้าที่ประมวลผลต่อเดือนและยังเพิ่มขึ้นเรื่อย ๆ
0K+
ผู้ใช้บนส่วนขยาย Thunderbit
ราคา
เริ่มใช้ฟรี จ่ายตามการเติบโต
วิธีทดลองดึงข้อมูลแบบเบา ๆ ไม่มีค่าใช้จ่าย ไม่ต้องใช้บัตร ไม่ยุ่งยาก
เหมาะสำหรับโปรเจกต์เสริมและเครื่องมือขนาดเล็ก รวดเร็ว เรียบง่าย ไม่เกินความจำเป็น
$16/เดือน
เรียกเก็บเงินรายปี ชำระหน่วยทั้งหมดล่วงหน้า
สร้างมาเพื่อปริมาณงานสูงและความเร็ว Thunderbit ในศักยภาพเต็มที่
$40/เดือน
เรียกเก็บเงินรายปี ชำระหน่วยทั้งหมดล่วงหน้า
คำถามที่พบบ่อย
ทุกสิ่งที่คุณควรรู้เกี่ยวกับผลิตภัณฑ์และการเรียกเก็บเงิน