Satu panggilan API untuk mengubah halaman web apa pun menjadi Markdown atau tabel. Beri agen Anda data web langsung, bangun RAG, dan perkaya database — kami yang menangani infrastrukturnya.
Dipercaya oleh lebih dari 100.000+ pengguna di seluruh dunia
Siap digunakan dalam hitungan menit
Coba langsung di terminal Anda sekarang.
>_
URL ke Markdown
1importrequests
2
3resp=requests.post(
4"https://open.thunderbit.com/v1/distill",
5headers={"Authorization":f"Bearer {API_KEY}"},
6json={"url":"https://example.com/article"}
7)
8
9markdown=resp.json()["data"]["markdown"]
Core API
Dua kemampuan inti
Distill untuk konten bersih, Extract untuk data terstruktur
Distill
URL→Markdown
Menghapus iklan, navigasi, dan gangguan — hanya menyisakan konten yang penting
Rendering JS penuh dan bypass anti-bot sudah terintegrasi
Batch hingga 100 URL per permintaan
Extract
URL + Skema→JSON / CSV
Satu skema bekerja di semua situs web — tanpa perawatan per situs
Tetap bekerja secara otomatis saat situs didesain ulang
Batch hingga 50 URL per permintaan
Keunggulan
Mengapa menggunakan Thunderbit
Infrastruktur scraping / ekstraksi data yang layak untuk agen AI Anda
Tentukan apa, bukan bagaimana
Tanpa CSS selector, tanpa XPath, tanpa aturan per situs. Jelaskan data yang Anda butuhkan dengan JSON Schema — AI akan menentukan letaknya dan cara mendapatkannya.
Satu skema, untuk semua situs web
Skema yang sama bekerja di situs e-commerce, listing penjualan, atau URL apa pun yang Anda berikan. Menambahkan sumber data baru hanyalah perubahan konfigurasi, bukan proyek engineering besar.
Tetap berfungsi saat situs berubah
Scraper tradisional gagal setiap kali desain diubah. Thunderbit membaca makna, bukan struktur DOM — jadi ekstraksi tetap berfungsi meskipun HTML di bawahnya berubah.
Industri
Contoh penggunaan
Apa yang bisa Anda bangun dengan Thunderbit
Agen AI dengan Akses Web
Berikan agen Anda kemampuan untuk membaca dan memahami halaman web apa pun. Satu panggilan API menghasilkan konteks terstruktur, siap untuk langkah berikutnya.
RAG & Basis Pengetahuan
Ubah URL apa pun menjadi Markdown bersih dan kirim langsung ke vector database Anda. Tanpa parsing HTML, tanpa skrip pembersihan konten.
Ubah Situs Web Apa Pun Menjadi API
Tentukan skema, arahkan ke URL, lalu dapatkan JSON. Bangun API harga produk, API lowongan kerja, atau API berita — tanpa menulis satu scraper pun.
Pengayaan Database
Jaga database Anda tetap segar dengan data web langsung. Ambil profil perusahaan, info kontak, atau detail listing secara terjadwal — skema tetap sama meskipun sumber berubah.
Pemantauan Kompetitor
Lacak harga, stok, ulasan, atau perubahan konten di ratusan halaman. Skema sama, pipeline sama, tambahkan sumber baru dalam hitungan detik.
Pembuatan Dataset
Bangun set pelatihan, benchmark evaluasi, atau dataset riset dari web terbuka. Proses ribuan URL sekaligus menjadi output dengan struktur yang konsisten.
Kami membangun Thunderbit di atas API ini
API yang sedang Anda lihat ini juga mendukung Ekstensi Chrome dan web app Thunderbit — digunakan oleh 100.000+ pengguna untuk mengekstrak puluhan juta halaman setiap bulan.
Ini bukan proyek sampingan. Ini adalah infrastruktur yang kami jadikan dasar produk kami sendiri.
0M+
Halaman yang diproses setiap bulan dan terus bertambah
0K+
Pengguna di Ekstensi Thunderbit
0%
Waktu aktif
Paket
Harga
Mulai gratis, bayar seiring pertumbuhan
Gratis
Cara ringan untuk mencoba scraping. Gratis, tanpa kartu, tanpa ribet.