Yapay Zeka Destekli Web Scraper API

Sıfır bakım. Sonsuza kadar.

Herhangi bir web sayfasını Markdown veya tablolara dönüştürmek için tek bir API çağrısı yeterlidir. Ajanınızı canlı web verisiyle besleyin, RAG oluşturun ve veritabanlarını zenginleştirin — altyapıyı biz yönetiyoruz.

Dünya genelinde 100.000’den fazla kullanıcı tarafından güveniliyor

harvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logo

Dakikalar içinde kullanıma hazır

Hemen terminalinizde deneyin.

>_
URL'den Markdown'a
1import requests
2
3resp = requests.post(
4 "https://open.thunderbit.com/v1/distill",
5 headers={"Authorization": f"Bearer {API_KEY}"},
6 json={"url": "https://example.com/article"}
7)
8
9markdown = resp.json()["data"]["markdown"]
Core API

İki temel yetenek

Temiz içerik için Distill, yapılandırılmış veri için Extract

Distill
URLMarkdown
Reklamları, gezinmeyi ve gereksiz öğeleri kaldırır — yalnızca önemli içeriği bırakır
Tam JS oluşturma ve anti-bot engel aşma yerleşik olarak sunulur
İstek başına 100’e kadar URL’yi toplu işleyin
Extract
URL + ŞemaJSON / CSV
Tek şema tüm web sitelerinde çalışır — site bazında bakım gerekmez
Site tasarım değişikliklerine otomatik olarak dayanır
İstek başına 50’ye kadar URL’yi toplu işleyin
Avantajlar

Neden Thunderbit kullanmalı

AI ajanın hak ettiği kazıma / veri çıkarma altyapısı

Nasıl değil, ne olduğunu tanımlayın
CSS seçiciler yok, XPath yok, siteye özel kurallar yok. İhtiyacınız olan veriyi bir JSON Schema ile tanımlayın — AI, onun nerede olduğunu ve nasıl alınacağını bulur.
Tek şema, tüm web siteleri
Aynı şema e-ticaret sitelerinde, satış listelerinde veya verdiğiniz herhangi bir URL’de çalışır. Yeni bir veri kaynağı eklemek bir mühendislik sprinti değil, bir yapılandırma değişikliğidir.
Siteler bozulsa da çalışmaya devam eder
Geleneksel scraper’lar her yeniden tasarımda bozulur. Thunderbit DOM yapısını değil, anlamı okur — bu yüzden HTML altta değişse bile çıkarma işlemi çalışmaya devam eder.
Sektörler

Kullanım senaryoları

Thunderbit ile neler yapabilirsiniz

Web erişimli AI ajanları
Ajanınıza herhangi bir web sayfasını okuma ve anlama yeteneği verin. Tek bir API çağrısı, ajanın bir sonraki adımına hazır yapılandırılmış bağlam döndürür.
RAG ve Bilgi Tabanları
Herhangi bir URL’yi temiz Markdown’a dönüştürün ve doğrudan vektör veritabanınıza aktarın. HTML ayrıştırma yok, içerik temizleme betikleri yok.
Herhangi bir web sitesini API’ye dönüştürün
Bir şema tanımlayın, bir URL gösterin, JSON alın. Tek bir scraper yazmadan bir ürün fiyatı API’si, iş ilanı API’si veya haber akışı API’si oluşturun.
Veritabanı zenginleştirme
Veritabanınızı canlı web verileriyle güncel tutun. Şirket profillerini, iletişim bilgilerini veya ilan detaylarını planlı şekilde çekin — kaynaklar değişse bile şema aynı kalır.
Rakip takibi
Yüzlerce sayfa boyunca fiyatları, envanteri, yorumları veya içerik değişikliklerini takip edin. Aynı şema, aynı işlem hattı; yeni kaynakları saniyeler içinde ekleyin.
Veri seti oluşturma
Açık web’den eğitim setleri, değerlendirme kıyaslamaları veya araştırma veri setleri oluşturun. Binlerce URL’yi toplu işleyerek tutarlı biçimde yapılandırılmış çıktı elde edin.

Thunderbit’i bu API üzerine inşa ediyoruz

Gördüğünüz aynı API, Thunderbit’in Chrome Uzantısı ve web uygulamasını güçlendiriyor — her ay on milyonlarca sayfayı çıkarmak için 100.000’den fazla kullanıcı tarafından kullanılıyor. Bu bir yan proje değil. Bu, kendi ürünümüzü üzerine inşa ettiğimiz altyapıdır.

0M+
Aylık işlenen sayfalar ve artış eğilimi
0K+
Thunderbit Uzantısını Kullananlar
0%
Çalışma süresi
Plan

Fiyatlandırma

Ücretsiz başlayın, büyüdükçe ödeyin

Ücretsiz
Kazımayı denemek için hafif bir yol. Ücretsiz, kart gerekmez, zahmetsiz.
600 birim / tek seferlik
$0tek seferlik
 
600 sayfayı Distill
30 sayfayı Extract
2 eşzamanlı istek
Başlangıç
Yan projeler ve küçük araçlar için harika. Hızlı, basit, gereksiz karmaşa yok.
60,000 API birimi / yıl
$16/ay
Yıllık faturalandırılır. Tüm birimler peşin.
60,000 sayfayı Distill
3,000 sayfayı Extract
30 eşzamanlı istek
Temel destek
Pro1En popüler
Yüksek hacim ve hız için tasarlandı. Thunderbit tam kapasiteyle.
600,000 API birimi / yıl
$40/ay
Yıllık faturalandırılır. Tüm birimler peşin.
600K1200K2400K4800K
600,000 sayfayı Distill
30,000 sayfayı Extract
50 eşzamanlı istek
Öncelikli destek

Sıkça sorulan sorular

Ürün ve faturalandırma hakkında bilmeniz gereken her şey.