AI-Powered Web Scraper API

Нульове обслуговування. Назавжди.

Один виклик API, щоб перетворити будь-яку вебсторінку на Markdown або таблиці. Забезпечте свого агента актуальними вебданими, створюйте RAG і збагачуйте бази даних — ми беремо інфраструктуру на себе.

Нам довіряють понад 100 000+ користувачів у всьому світі

harvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logo

Запуск за лічені хвилини

Спробуйте прямо зараз у своєму терміналі.

>_
URL у Markdown
1import requests
2
3resp = requests.post(
4 "https://open.thunderbit.com/v1/distill",
5 headers={"Authorization": f"Bearer {API_KEY}"},
6 json={"url": "https://example.com/article"}
7)
8
9markdown = resp.json()["data"]["markdown"]
Core API

Дві ключові можливості

Distill — для чистого контенту, Extract — для структурованих даних

Distill
URLMarkdown
Прибирає рекламу, навігацію та зайве — залишає лише важливий контент
Повний рендеринг JS і вбудоване обходження антибот-захисту
Пакетно до 100 URL за запит
Extract
URL + СхемаJSON / CSV
Одна схема працює на всіх сайтах — без обслуговування для кожного сайту
Автоматично витримує редизайн сайтів
Пакетно до 50 URL за запит
Переваги

Чому варто використовувати Thunderbit

Інфраструктура для збору та витягування даних, на яку заслуговує ваш AI-агент

Визначте що, а не як
Без CSS-селекторів, без XPath, без правил для кожного сайту. Опишіть потрібні дані за допомогою JSON Schema — AI сам визначить, де вони знаходяться і як їх отримати.
Одна схема, будь-який сайт
Та сама схема працює на e-commerce сайтах, у списках продажів або з будь-яким URL, який ви їй дасте. Додавання нового джерела даних — це зміна конфігурації, а не інженерний спринт.
Працює, навіть коли сайти ламаються
Традиційні скрапери ламаються після кожного редизайну. Thunderbit читає зміст, а не структуру DOM — тому витяг даних продовжує працювати, навіть коли HTML змінюється під капотом.
Галузі

Сценарії використання

Що можна створити з Thunderbit

AI-агенти з доступом до вебу
Надайте своєму агенту можливість читати й розуміти будь-яку вебсторінку. Один виклик API повертає структурований контекст, готовий до наступного кроку вашого агента.
RAG і бази знань
Перетворюйте будь-який URL на чистий Markdown і подавайте його напряму у вашу векторну базу даних. Без аналізу HTML, без скриптів очищення контенту.
Перетворіть будь-який сайт на API
Визначте схему, вкажіть URL, отримайте JSON у відповідь. Створіть API цін на товари, вакансій або новинної стрічки — без написання жодного скрапера.
Збагачення бази даних
Оновлюйте свою базу даних за допомогою актуальних вебданих. За розкладом отримуйте профілі компаній, контактну інформацію або деталі оголошень — схема залишається незмінною, навіть якщо джерела змінюються.
Моніторинг конкурентів
Відстежуйте ціни, запаси, відгуки або зміни контенту на сотнях сторінок. Та сама схема, той самий процес — додавайте нові джерела за секунди.
Створення наборів даних
Створюйте навчальні набори, оціночні бенчмарки або дослідницькі набори даних з відкритого вебу. Пакетно обробляйте тисячі URL у послідовно структурований результат.

Ми створюємо Thunderbit на основі цього API

Той самий API, який ви зараз переглядаєте, працює в розширенні Chrome Thunderbit і вебзастосунку — його використовують 100 000+ користувачів, щоб щомісяця витягувати десятки мільйонів сторінок. Це не побічний проєкт. Це інфраструктура, на яку ми поставили свій продукт.

0M+
Сторінки, що обробляються щомісяця, і їх кількість зростає
0K+
Користувачі розширення Thunderbit
0%
Час безвідмовної роботи
Тариф

Ціни

Почніть безкоштовно, платіть у міру зростання

Безкоштовно
Легкий спосіб спробувати збір даних. Безкоштовно, без картки, без клопоту.
600 одиниць / одноразово
$0одноразово
 
Distill 600 сторінок
Extract 30 сторінок
2 одночасні запити
Початковий
Чудово підходить для pet-проєктів і невеликих інструментів. Швидко, просто, без надмірності.
60,000 API-одиниць / рік
$16/місяць
Оплата щороку. Усі одиниці наперед.
Distill 60,000 сторінок
Extract 3,000 сторінок
30 одночасних запитів
Базова підтримка
Професіонал1Найпопулярніше
Створено для великих обсягів і швидкості. Thunderbit у повну силу.
600,000 API-одиниць / рік
$40/місяць
Оплата щороку. Усі одиниці наперед.
600K1200K2400K4800K
Distill 600,000 сторінок
Extract 30,000 сторінок
50 одночасних запитів
Пріоритетна підтримка

Часті запитання

Усе, що вам потрібно знати про продукт і оплату.