AI-Powered Web Scraper API

Ноль обслуживания. Всегда.

Один API-запрос, чтобы превратить любую веб-страницу в Markdown или таблицы. Обеспечьте своего агента актуальными веб-данными, стройте RAG и обогащайте базы данных — инфраструктуру мы берем на себя.

Нам доверяют более 100 000 пользователей по всему миру

harvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logo

Запуск за считанные минуты

Попробуйте прямо сейчас в вашем терминале.

>_
Из URL в Markdown
1import requests
2
3resp = requests.post(
4 "https://open.thunderbit.com/v1/distill",
5 headers={"Authorization": f"Bearer {API_KEY}"},
6 json={"url": "https://example.com/article"}
7)
8
9markdown = resp.json()["data"]["markdown"]
Core API

Две ключевые возможности

Distill — для чистого контента, Extract — для структурированных данных

Distill
URLMarkdown
Убирает рекламу, навигацию и лишний шум — оставляет только важный контент
Полная отрисовка JS и встроенный обход антибот-защиты
Обрабатывайте до 100 URL за запрос
Extract
URL + СхемаJSON / CSV
Одна схема работает на всех сайтах — без обслуживания для каждого сайта
Автоматически переживает редизайн сайтов
Обрабатывайте до 50 URL за запрос
Преимущества

Почему стоит использовать Thunderbit

Инфраструктура для парсинга и извлечения данных, которой заслуживает ваш AI-агент

Определяйте что, а не как
Никаких CSS-селекторов, никакого XPath, никаких правил для каждого сайта. Опишите нужные данные с помощью JSON Schema — AI сам определит, где они находятся и как их получить.
Одна схема, любой сайт
Та же схема работает на сайтах электронной коммерции, в списках продаж и на любом URL, который вы ей дадите. Добавление нового источника данных — это изменение конфигурации, а не инженерный проект.
Продолжает работать, когда сайты меняются
Традиционные парсеры ломаются при каждом редизайне. Thunderbit считывает смысл, а не структуру DOM — поэтому извлечение продолжает работать, даже когда HTML меняется.
Отрасли

Сценарии использования

Что можно создать с Thunderbit

AI-агенты с доступом к вебу
Дайте вашему агенту возможность читать и понимать любую веб-страницу. Один API-запрос возвращает структурированный контекст, готовый для следующего шага агента.
RAG и базы знаний
Преобразуйте любой URL в чистый Markdown и сразу отправляйте его в вашу векторную базу данных. Без разбора HTML и без скриптов очистки контента.
Превратите любой сайт в API
Определите схему, укажите URL и получите JSON. Создайте API цен на товары, API вакансий или API новостной ленты — без написания ни одного парсера.
Обогащение базы данных
Поддерживайте вашу базу данных актуальной с помощью живых веб-данных. По расписанию получайте профили компаний, контактную информацию или детали объявлений — схема остается прежней, даже если источники меняются.
Мониторинг конкурентов
Отслеживайте цены, запасы, отзывы или изменения контента на сотнях страниц. Та же схема, тот же процесс, новые источники добавляются за секунды.
Создание датасетов
Создавайте обучающие наборы, оценочные бенчмарки или исследовательские датасеты из открытого веба. Пакетно обрабатывайте тысячи URL в единообразно структурированный результат.

Мы строим Thunderbit на этом API

Тот же API, который вы сейчас видите, лежит в основе расширения Chrome и веб-приложения Thunderbit — его используют более 100 000 пользователей, чтобы ежемесячно извлекать десятки миллионов страниц. Это не побочный проект. Это инфраструктура, на которую мы делаем ставку, создавая собственный продукт.

0M+
Страницы, обрабатываемые ежемесячно, и рост
0K+
Пользователи расширения Thunderbit
0%
Время бесперебойной работы
Тариф

Цены

Начните бесплатно, платите по мере роста

Бесплатно
Простой способ попробовать парсинг. Без оплаты, без карты, без лишних хлопот.
600 единиц / разово
$0разово
 
Distill 600 страниц
Extract 30 страниц
2 одновременных запроса
Starter
Отлично подходит для побочных проектов и небольших инструментов. Быстро, просто, без излишеств.
60,000 API-единиц / год
$16/месяц
Оплата ежегодно. Все единицы сразу.
Distill 60,000 страниц
Extract 3,000 страниц
30 одновременных запросов
Базовая поддержка
Pro1Самый популярный
Создано для больших объемов и высокой скорости. Thunderbit на полную мощность.
600,000 API-единиц / год
$40/месяц
Оплата ежегодно. Все единицы сразу.
600K1200K2400K4800K
Distill 600,000 страниц
Extract 30,000 страниц
50 одновременных запросов
Приоритетная поддержка

Часто задаваемые вопросы

Все, что нужно знать о продукте и оплате.