AI-Powered Web Scraper API

Никакого обслуживания. Никогда.

Один API-вызов, чтобы превратить любую веб-страницу в Markdown или таблицы. Подпитывайте вашего агента актуальными веб-данными, стройте RAG и обогащайте базы данных — инфраструктуру мы берем на себя.

Нам доверяют более 100 000+ пользователей по всему миру

harvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logoharvard_university logobcg logoadidas logored_bull_technology logored_hat logowix logosams_club logopatagonia logocarvana logoarmis logoflywire logomit logocolliers logomonster_energy logo

Запуск за считанные минуты

Попробуйте прямо сейчас в вашем терминале.

>_
URL в Markdown
1import requests
2
3resp = requests.post(
4 "https://openapi.thunderbit.com/openapi/v1/distill",
5 headers={"Authorization": f"Bearer {API_KEY}"},
6 json={"url": "https://example.com/article"}
7)
8
9markdown = resp.json()["data"]["markdown"]
Core API

Две ключевые возможности

Distill — для чистого контента, Extract — для структурированных данных

Distill
URLMarkdown
Убирает рекламу, навигацию и лишнее — оставляет только важный контент
Полная рендеринга JS и обход антибот-защиты встроены
До 100 URL за один запрос
Extract
URL + схемаJSON / CSV
Одна схема работает на всех сайтах — без поддержки для каждого сайта
Автоматически переживает редизайн сайтов
До 50 URL за один запрос
Преимущества

Почему стоит использовать Thunderbit

Инфраструктура для парсинга и извлечения данных, которой заслуживает ваш AI-агент

Определяйте что, а не как
Никаких CSS-селекторов, никакого XPath и никаких правил для каждого сайта. Опишите нужные данные с помощью JSON Schema — AI сам определит, где они находятся и как их получить.
Одна схема — для любого сайта
Одна и та же схема работает для e-commerce сайтов, объявлений о продажах или любого другого URL. Добавление нового источника данных — это изменение конфигурации, а не инженерный спринт.
Продолжает работать, даже если сайты меняются
Традиционные парсеры ломаются при каждом редизайне. Thunderbit считывает смысл, а не структуру DOM — поэтому извлечение продолжает работать, даже когда HTML меняется.
Отрасли

Сценарии использования

Что можно создать с помощью Thunderbit

AI-агенты с доступом к вебу
Дайте вашему агенту возможность читать и понимать любую веб-страницу. Один API-вызов возвращает структурированный контекст, готовый для следующего шага агента.
RAG и базы знаний
Преобразуйте любой URL в чистый Markdown и сразу отправляйте его в вашу векторную базу данных. Без разбора HTML и без скриптов очистки контента.
Превратите любой сайт в API
Определите схему, укажите URL и получите JSON. Создайте API цен на товары, вакансий или новостной ленты — без написания ни одного парсера.
Обогащение базы данных
Поддерживайте вашу базу данных актуальной с помощью живых веб-данных. Регулярно получайте профили компаний, контактную информацию или детали объявлений — схема остается той же, даже если источники меняются.
Мониторинг конкурентов
Отслеживайте цены, запасы, отзывы или изменения контента на сотнях страниц. Одна и та же схема, один и тот же конвейер, новые источники — за секунды.
Создание наборов данных
Создавайте обучающие наборы, оценочные бенчмарки или исследовательские датасеты из открытого веба. Пакетно обрабатывайте тысячи URL в единообразно структурированный результат.

Мы создали Thunderbit на основе этого API

Тот же API, который вы видите здесь, лежит в основе расширения Chrome и веб-приложения Thunderbit — его используют более 100 000 пользователей, чтобы ежемесячно извлекать десятки миллионов страниц. Это не побочный проект. Это инфраструктура, на которую мы поставили наш собственный продукт.

0M+
Страниц обрабатывается ежемесячно и это число растет
0K+
Пользователи расширения Thunderbit
0%
Время безотказной работы
Тариф

Цены

Начните бесплатно, платите по мере роста

Бесплатно
Легкий способ попробовать парсинг. Без затрат, без карты, без лишних хлопот.
600 единиц / разово
$0разовый
 
Distill 600 страниц
Extract 30 страниц
2 одновременных запроса
Базовый
Отлично подходит для побочных проектов и небольших инструментов. Быстро, просто, без излишеств.
60,000 API-единиц / год
$16/месяц
Оплата ежегодно. Все единицы сразу.
Distill 60,000 страниц
Extract 3,000 страниц
30 одновременных запросов
Базовая поддержка
Профессиональный1Самый популярный
Создано для больших объемов и высокой скорости. Thunderbit на полную мощность.
600,000 API-единиц / год
$40/месяц
Оплата ежегодно. Все единицы сразу.
600K1200K2400K4800K
Distill 600,000 страниц
Extract 30,000 страниц
50 одновременных запросов
Приоритетная поддержка

Часто задаваемые вопросы

Все, что нужно знать о продукте и оплате.