Satu panggilan API untuk mengubah halaman web apa pun menjadi Markdown atau tabel. Beri agen Anda data web langsung, bangun RAG, dan perkaya database — kami yang menangani infrastrukturnya.
Dipercaya oleh lebih dari 100.000+ pengguna di seluruh dunia
Siap digunakan dalam hitungan menit
Coba sekarang di terminal Anda.
>_
URL ke Markdown
1importrequests
2
3resp=requests.post(
4"https://open.thunderbit.com/v1/distill",
5headers={"Authorization":f"Bearer {API_KEY}"},
6json={"url":"https://example.com/article"}
7)
8
9markdown=resp.json()["data"]["markdown"]
Core API
Dua kemampuan inti
Distill untuk konten bersih, Extract untuk data terstruktur
Distill
URL→Markdown
Menghapus iklan, navigasi, dan gangguan — hanya menyisakan konten yang penting
Rendering JS penuh dan bypass anti-bot sudah terpasang
Batch hingga 100 URL per permintaan
Extract
URL + Skema→JSON / CSV
Satu skema berlaku di semua situs web — tanpa perawatan per situs
Tetap bertahan secara otomatis saat situs didesain ulang
Batch hingga 50 URL per permintaan
Keunggulan
Mengapa menggunakan Thunderbit
Infrastruktur scraping / ekstraksi data yang layak didapatkan agen AI Anda
Tentukan apa, bukan bagaimana
Tanpa selector CSS, tanpa XPath, tanpa aturan per situs. Jelaskan data yang Anda butuhkan dengan JSON Schema — AI akan menentukan lokasinya dan cara mendapatkannya.
Satu skema, untuk semua situs web
Skema yang sama berfungsi di situs E-commerce, daftar penjualan, atau URL apa pun yang Anda berikan. Menambahkan sumber data baru hanyalah perubahan konfigurasi, bukan proyek engineering besar.
Tetap berfungsi saat situs berubah
Scraper tradisional gagal setiap kali ada desain ulang. Thunderbit membaca makna, bukan struktur DOM — jadi ekstraksi tetap berfungsi bahkan saat HTML di baliknya berubah.
Industri
Contoh penggunaan
Apa yang bisa Anda bangun dengan Thunderbit
Agen AI dengan Akses Web
Berikan agen Anda kemampuan untuk membaca dan memahami halaman web apa pun. Satu panggilan API menghasilkan konteks terstruktur, siap untuk langkah berikutnya dari agen Anda.
RAG & Basis Pengetahuan
Ubah URL apa pun menjadi Markdown yang bersih dan kirim langsung ke vector database Anda. Tanpa parsing HTML, tanpa skrip pembersih konten.
Ubah Situs Web Apa Pun Menjadi API
Tentukan skema, arahkan ke URL, lalu dapatkan JSON. Bangun API harga produk, API lowongan kerja, atau API feed berita — tanpa menulis satu pun scraper.
Pengayaan Database
Jaga database Anda tetap segar dengan data web langsung. Ambil profil perusahaan, info kontak, atau detail listing sesuai jadwal — skema tetap sama meskipun sumber berubah.
Pemantauan Kompetitor
Lacak harga, stok, ulasan, atau perubahan konten di ratusan halaman. Skema sama, pipeline sama, tambahkan sumber baru dalam hitungan detik.
Pembuatan Dataset
Buat set pelatihan, benchmark evaluasi, atau dataset riset dari web terbuka. Proses ribuan URL secara batch menjadi output yang terstruktur secara konsisten.
Kami membangun Thunderbit di atas API ini
API yang sama yang sedang Anda lihat ini menggerakkan Chrome Extension dan web app Thunderbit — digunakan oleh 100.000+ pengguna untuk mengekstrak puluhan juta halaman setiap bulan.
Ini bukan proyek sampingan. Ini adalah infrastruktur yang menjadi dasar produk kami sendiri.
0M+
Halaman yang diproses setiap bulan dan terus bertambah
0K+
Pengguna di Thunderbit Extension
0%
Waktu aktif
Paket
Harga
Mulai gratis, bayar sesuai kebutuhan
Gratis
Cara ringan untuk mencoba scraping. Tanpa biaya, tanpa kartu, tanpa ribet.