AI Destekli Web Scraper API

Sıfır bakım. Sonsuza kadar.

Herhangi bir web sayfasını Markdown'a veya tablolara dönüştürmek için tek bir API çağrısı yeterlidir. Ajanınızı canlı web verileriyle besleyin, RAG kurun ve veritabanlarını zenginleştirin — altyapıyı biz yönetiriz.

Dünya çapında 100.000'den fazla kullanıcı tarafından güveniliyor

harvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logo

Dakikalar içinde kullanıma hazır

Hemen terminalinizde deneyin.

>_
URL'den Markdown'a
1import requests
2
3resp = requests.post(
4 "https://open.thunderbit.com/v1/distill",
5 headers={"Authorization": f"Bearer {API_KEY}"},
6 json={"url": "https://example.com/article"}
7)
8
9markdown = resp.json()["data"]["markdown"]
Core API

İki temel özellik

Temiz içerik için Distill, yapılandırılmış veri için Extract

Distill
URLMarkdown
Reklamları, gezinmeyi ve gereksiz öğeleri kaldırır — sadece önemli içeriği bırakır
Tam JS render desteği ve anti-bot aşma özelliği yerleşik
İstek başına en fazla 100 URL'yi toplu işleyin
Extract
URL + ŞemaJSON / CSV
Tek bir şema tüm web sitelerinde çalışır — site başına bakım gerekmez
Site tasarım değişikliklerine otomatik olarak dayanır
İstek başına en fazla 50 URL'yi toplu işleyin
Avantajlar

Neden Thunderbit kullanmalı?

AI ajanın hak ettiği kazıma / veri çıkarma altyapısı

Nasıl değil, neyi tanımlayın
CSS seçiciler yok, XPath yok, siteye özel kurallar yok. İhtiyacınız olan veriyi bir JSON Schema ile tanımlayın — AI, verinin nerede olduğunu ve nasıl alınacağını belirler.
Tek şema, her web sitesi
Aynı şema e-ticaret sitelerinde, satış listelerinde veya verdiğiniz herhangi bir URL'de çalışır. Yeni bir veri kaynağı eklemek bir mühendislik süreci değil, bir yapılandırma değişikliğidir.
Siteler bozulduğunda da çalışmaya devam eder
Geleneksel scraper'lar her yeniden tasarımda bozulur. Thunderbit DOM yapısını değil, anlamı okur — böylece HTML altta değişse bile çıkarma çalışmaya devam eder.
Sektörler

Kullanım alanları

Thunderbit ile neler oluşturabilirsiniz

Web erişimli AI ajanları
Ajanınıza herhangi bir web sayfasını okuma ve anlama yeteneği verin. Tek bir API çağrısı, ajanın bir sonraki adımı için hazır yapılandırılmış bağlam döndürür.
RAG ve Bilgi Tabanları
Herhangi bir URL'yi temiz Markdown'a dönüştürün ve doğrudan vektör veritabanınıza aktarın. HTML ayrıştırma yok, içerik temizleme betikleri yok.
Herhangi bir web sitesini API'ye dönüştürün
Bir şema tanımlayın, bir URL gösterin, JSON alın. Tek bir kazıma betiği yazmadan bir ürün fiyatı API'si, iş ilanı API'si veya haber akışı API'si oluşturun.
Veritabanı zenginleştirme
Canlı web verileriyle veritabanınızı güncel tutun. Şirket profillerini, iletişim bilgilerini veya ilan ayrıntılarını planlı şekilde çekin — kaynaklar değişse bile şema aynı kalır.
Rakip takibi
Yüzlerce sayfa boyunca fiyatları, stokları, yorumları veya içerik değişikliklerini takip edin. Aynı şema, aynı iş akışı; yeni kaynakları saniyeler içinde ekleyin.
Veri seti oluşturma
Açık web'den eğitim setleri, değerlendirme ölçütleri veya araştırma veri setleri oluşturun. Binlerce URL'yi toplu işleyerek tutarlı yapıdaki çıktılar elde edin.

Thunderbit'i bu API üzerine kuruyoruz

Şu anda baktığınız aynı API, Thunderbit'in Chrome Uzantısı ve web uygulamasını destekler — her ay on milyonlarca sayfayı çıkarmak için 100.000'den fazla kullanıcı tarafından kullanılır. Bu bir yan proje değil. Bu, kendi ürünümüzü üzerine kurduğumuz altyapıdır.

0M+
Aylık işlenen sayfalar ve artış
0K+
Thunderbit Uzantısı kullanıcıları
0%
Çalışma süresi
Plan

Fiyatlandırma

Ücretsiz başlayın, büyüdükçe ödeyin

Ücretsiz
Kazımayı denemenin hafif bir yolu. Ücret yok, kart yok, zahmet yok.
600 birim / tek seferlik
$0tek seferlik
 
600 sayfayı Distill
30 sayfayı Extract
2 eşzamanlı istek
Başlangıç
Yan projeler ve küçük araçlar için harika. Hızlı, basit, gereksiz değil.
60,000 API birimi / yıl
$16/ay
Yıllık faturalandırılır. Tüm birimler peşin.
60,000 sayfayı Distill
3,000 sayfayı Extract
30 eşzamanlı istek
Temel destek
Pro1En popüler
Yüksek hacim ve hız için tasarlandı. Thunderbit tam güçte.
600,000 API birimi / yıl
$40/ay
Yıllık faturalandırılır. Tüm birimler peşin.
600K1200K2400K4800K
600,000 sayfayı Distill
30,000 sayfayı Extract
50 eşzamanlı istek
Öncelikli destek

Sıkça Sorulan Sorular

Ürün ve faturalandırma hakkında bilmeniz gereken her şey.