Один API-запрос, чтобы превратить любую веб-страницу в Markdown или таблицы. Обеспечьте своего агента актуальными веб-данными, стройте RAG и обогащайте базы данных — инфраструктуру мы берем на себя.
Нам доверяют более 100 000 пользователей по всему миру
Запуск за считанные минуты
Попробуйте прямо сейчас в вашем терминале.
>_
Из URL в Markdown
1importrequests
2
3resp=requests.post(
4"https://open.thunderbit.com/v1/distill",
5headers={"Authorization":f"Bearer {API_KEY}"},
6json={"url":"https://example.com/article"}
7)
8
9markdown=resp.json()["data"]["markdown"]
Core API
Две ключевые возможности
Distill — для чистого контента, Extract — для структурированных данных
Distill
URL→Markdown
Убирает рекламу, навигацию и лишний шум — оставляет только важный контент
Полная отрисовка JS и встроенный обход антибот-защиты
Обрабатывайте до 100 URL за запрос
Extract
URL + Схема→JSON / CSV
Одна схема работает на всех сайтах — без обслуживания для каждого сайта
Автоматически переживает редизайн сайтов
Обрабатывайте до 50 URL за запрос
Преимущества
Почему стоит использовать Thunderbit
Инфраструктура для парсинга и извлечения данных, которой заслуживает ваш AI-агент
Определяйте что, а не как
Никаких CSS-селекторов, никакого XPath, никаких правил для каждого сайта. Опишите нужные данные с помощью JSON Schema — AI сам определит, где они находятся и как их получить.
Одна схема, любой сайт
Та же схема работает на сайтах электронной коммерции, в списках продаж и на любом URL, который вы ей дадите. Добавление нового источника данных — это изменение конфигурации, а не инженерный проект.
Продолжает работать, когда сайты меняются
Традиционные парсеры ломаются при каждом редизайне. Thunderbit считывает смысл, а не структуру DOM — поэтому извлечение продолжает работать, даже когда HTML меняется.
Отрасли
Сценарии использования
Что можно создать с Thunderbit
AI-агенты с доступом к вебу
Дайте вашему агенту возможность читать и понимать любую веб-страницу. Один API-запрос возвращает структурированный контекст, готовый для следующего шага агента.
RAG и базы знаний
Преобразуйте любой URL в чистый Markdown и сразу отправляйте его в вашу векторную базу данных. Без разбора HTML и без скриптов очистки контента.
Превратите любой сайт в API
Определите схему, укажите URL и получите JSON. Создайте API цен на товары, API вакансий или API новостной ленты — без написания ни одного парсера.
Обогащение базы данных
Поддерживайте вашу базу данных актуальной с помощью живых веб-данных. По расписанию получайте профили компаний, контактную информацию или детали объявлений — схема остается прежней, даже если источники меняются.
Мониторинг конкурентов
Отслеживайте цены, запасы, отзывы или изменения контента на сотнях страниц. Та же схема, тот же процесс, новые источники добавляются за секунды.
Создание датасетов
Создавайте обучающие наборы, оценочные бенчмарки или исследовательские датасеты из открытого веба. Пакетно обрабатывайте тысячи URL в единообразно структурированный результат.
Мы строим Thunderbit на этом API
Тот же API, который вы сейчас видите, лежит в основе расширения Chrome и веб-приложения Thunderbit — его используют более 100 000 пользователей, чтобы ежемесячно извлекать десятки миллионов страниц.
Это не побочный проект. Это инфраструктура, на которую мы делаем ставку, создавая собственный продукт.
0M+
Страницы, обрабатываемые ежемесячно, и рост
0K+
Пользователи расширения Thunderbit
0%
Время бесперебойной работы
Тариф
Цены
Начните бесплатно, платите по мере роста
Бесплатно
Простой способ попробовать парсинг. Без оплаты, без карты, без лишних хлопот.