Скрапер WordPress.org Scraper от Thunderbit превращает страницы WordPress.org в аккуратные, структурированные наборы данных с помощью ИИ. Вы можете собирать статистику из каталога плагинов и метаданные из библиотеки паттернов блоков, а затем экспортировать всё в Excel, Google Sheets, Airtable или Notion. Инструмент рассчитан на скорость: нажмите AI Suggest Columns, затем Scrape — и ИИ сам разложит данные по колонкам.
🧩 Что такое WordPress.org Scraper
WordPress.org Scraper — это , который позволяет собирать данные с с помощью ИИ — без кода. Достаточно открыть нужную страницу (например, каталог плагинов или библиотеку паттернов), нажать AI Suggest Columns, чтобы получить готовую схему, и затем Scrape, чтобы собрать строки в таблицу.

В Thunderbit также есть Subpage Scraping: можно автоматически заходить на страницу каждого плагина или паттерна и обогащать датасет более глубокими полями (распределение оценок, версия, дата последнего обновления, теги, категории паттернов и т. д.). Если вы только начинаете, пригодятся эти материалы: и .
🗂️ Что можно собирать с WordPress.org
На WordPress.org много структурированной, но «разбросанной» информации: списки плагинов, страницы плагинов, галереи паттернов и страницы отдельных паттернов. ИИ Thunderbit анализирует разметку страницы и предлагает подходящие колонки под вашу задачу, а затем вы можете выгрузить результат в привычные инструменты.
Ниже — два самых распространённых сценария.
📈 Сбор доли рынка и динамики роста плагинов WordPress
На странице можно собрать сигналы «успешности» плагинов и отслеживать изменения со временем — полезно для конкурентного анализа, поиска партнёров и планирования продукта.

Шаги:
- Установите и зарегистрируйте аккаунт.
- Откройте нужную страницу, например: .
- Нажмите AI Suggest Columns — инструмент предложит названия колонок.
- Нажмите Scrape, чтобы запустить сбор, получить данные и скачать файл.
Названия колонок
| Колонка | Описание |
|---|---|
| 🧩 Plugin Name | Отображаемое название плагина в списке каталога. |
| 🔗 Plugin URL | Ссылка на страницу плагина (удобно для обогащения через подстраницы). |
| 🏷️ Slug | Слаг плагина (часто используется в URL и внутренних ссылках). |
| ⭐ Rating | Средняя оценка в звёздах, показанная в списке. |
| 🗳️ Rating Count | Количество отзывов/оценок, из которых складывается рейтинг. |
| ⬇️ Active Installs | Число активных установок (важный показатель распространённости). |
| 🕒 Last Updated | Значение «Last updated», указанное для плагина. |
| 🧑💻 Author | Автор плагина или название организации. |
| 🧾 Short Description | Короткое однострочное описание из карточки в списке. |
| 🏷️ Tags | Теги/категории, связанные с плагином (если доступны). |
| 🧠 WP Version Tested | Данные о совместимости вроде «Tested up to» (часто на подстраницах). |
| 🧱 Requires PHP / WP | Требования (обычно на странице плагина). |
| 🧾 Current Version | Актуальная версия (обычно на странице плагина). |
Совет: После сбора списка используйте Scrape Subpages, чтобы дополнить каждую строку полями со страницы плагина — полным описанием, ключевыми изменениями, статистикой поддержки и совместимостью. Если вы фиксируете изменения еженедельно, добавьте Scheduled Scraper для построения временного ряда.
🎨 Сбор данных из WordPress Block Pattern Library
На странице можно собрать метаданные паттернов — для вдохновения, контент-операций, исследования тем или создания внутренней дизайн-библиотеки.

Шаги:
- Установите и зарегистрируйте аккаунт.
- Откройте нужную страницу, например: .
- Нажмите AI Suggest Columns — инструмент предложит названия колонок.
- Нажмите Scrape, чтобы запустить сбор, получить данные и скачать файл.
Названия колонок
| Колонка | Описание |
|---|---|
| 🧩 Pattern Name | Название паттерна, как оно показано в библиотеке. |
| 🔗 Pattern URL | Ссылка на страницу паттерна для более подробных метаданных. |
| 🗂️ Category | Категория паттерна (например, headers, testimonials), если отображается. |
| 🏷️ Tags | Теги паттерна (часто доступны на подстраницах). |
| 🖼️ Preview Image | URL миниатюры превью паттерна. |
| 🧱 Block Types | Типы блоков, используемые в паттерне (обычно на странице паттерна). |
| 🧑🎨 Creator / Source | Авторство/источник, если указаны. |
| 📝 Description | Короткое описание или резюме. |
| 📄 Pattern Content | Разметка/контент паттерна (лучше собирать со страницы паттерна). |
| 🕒 Last Updated | Дата/время обновления, если присутствует. |
Совет: Экспортируйте в Notion или Airtable, чтобы сделать внутренний каталог паттернов с поиском. Thunderbit поддерживает поля изображений, поэтому превью останутся визуальными в вашей базе.
🎯 Зачем использовать инструмент для WordPress.org
Сбор данных с WordPress.org особенно полезен, когда вам нужны повторяемые и структурированные данные для анализа, мониторинга или подбора решений — и ручное копирование превращается в регулярную рутину.
Зачем команды обычно собирают данные с WordPress.org:
- Product & Growth команды: отслеживают сигналы популярности плагинов (активные установки, рейтинги, частоту обновлений), чтобы понимать лидеров категории и новые тренды.
- Ecommerce и агентства: формируют шорт-листы плагинов для клиентских стеков, сравнивают альтернативы и фиксируют требования по совместимости.
- Маркетинг: находят цели для партнёрств (авторы/компании), собирают списки для аутрича и мониторят позиционирование конкурентов.
- Команды тем и дизайна: подбирают block patterns, классифицируют их и создают переиспользуемую библиотеку для ускорения сборки страниц.
- Исследователи и аналитики: строят датасеты для анализа трендов по категориям, тегам и частоте обновлений.
Thunderbit ориентирован на бизнес-задачи: поддерживает пагинацию, умеет обогащать данные с подстраниц и экспортирует в инструменты, которыми вы уже пользуетесь. Больше приёмов — в статьях и .
🧭 Как пользоваться WordPress.org Chrome Extension
- Установите Thunderbit Chrome Extension: скачайте в и создайте аккаунт на .
- Откройте страницу WordPress.org: например, список или .
- Запустите AI-скрапер: нажмите AI Suggest Columns, настройте типы данных (текст, число, дата, URL, изображение) и при необходимости добавьте инструкции для полей.
- Соберите данные и экспортируйте: нажмите Scrape, затем выгрузите в Excel/CSV/JSON, Google Sheets, Airtable или Notion (экспорт бесплатный).
Если нужен регулярный мониторинг (например, динамика установок или изменения рейтинга), используйте Scheduled Scraper — он будет запускаться автоматически с выбранной периодичностью.
💳 Стоимость WordPress.org
В Thunderbit действует система кредитов: 1 кредит = 1 строка результата. Если вы собрали 200 плагинов со страницы списка — это примерно 200 кредитов (обогащение через подстраницы может потребовать больше, только если вы создаёте дополнительные таблицы; обогащение той же строки обычно считается по числу итоговых строк, которые вы формируете).
Что можно попробовать бесплатно:
- Free tier: сбор 6 страниц в месяц (бесплатный лимит по страницам).
- Free trial: 10 страниц бесплатно перед выбором платного плана.
- Полный AI-процесс (AI Suggest Columns + Scrape), чтобы быстро проверить, подходит ли сценарий.
Платные планы (помесячно и ежегодно) масштабируются под объём, а годовая подписка выгоднее за счёт скидки. Подробности — на странице .
| Тариф | Цена в месяц | Цена в год (в месяц) | Итого за год | Кредиты (в месяц) | Кредиты (в год) |
|---|---|---|---|---|---|
| Free | Free | Free | Free | 6 pages | N/A |
| Starter | $15 | $9 | $108 | 500 | 5,000 |
| Pro 1 | $38 | $16.5 | $199 | 3,000 | 30,000 |
| Pro 2 | $75 | $33.8 | $398 | 6,000 | 60,000 |
| Pro 3 | $125 | $68.4 | $796 | 10,000 | 120,000 |
| Pro 4 | $249 | $137.5 | $1,592 | 20,000 | 240,000 |
❓ FAQ
-
Что такое AI Powered WordPress.org Scraper?
AI Powered WordPress.org Scraper — это сценарий в Thunderbit, который с помощью ИИ «читает» страницы WordPress.org и превращает их в структурированные таблицы. Вы нажимаете AI Suggest Columns, чтобы сгенерировать поля, затем Scrape, чтобы собрать данные по плагинам или паттернам и экспортировать их. -
Что такое Thunderbit?
— это AI-инструмент для веб-скрейпинга и повышения продуктивности в формате Chrome Extension. Он помогает извлекать данные с сайтов, PDF и изображений в структурированном виде. Решение рассчитано на бизнес-команды: быстрый старт, стабильное извлечение и удобный экспорт в Google Sheets, Airtable и Notion. -
Можно ли собирать данные со страниц плагинов, а не только со списка?
Да. После сбора списка (например, Popular) используйте Subpage Scraping, чтобы зайти на страницу каждого плагина и дополнить таблицу полями вроде версии, требований, даты обновления и т. д. Это удобно, когда на странице списка не хватает нужных данных. -
Поддерживает ли Thunderbit пагинацию в каталогах WordPress.org?
Да. Thunderbit умеет собирать данные с пагинацией, включая переходы по страницам кликами и варианты с бесконечной прокруткой, если они встречаются. Это позволяет собрать больше, чем видно на первой странице, без ручной навигации. -
В какие форматы можно экспортировать результаты?
Можно выгрузить CSV/JSON для локального использования или отправить данные напрямую в Excel, Google Sheets, Airtable или Notion. Экспорт рассчитан на аналитику и операционные задачи: дашборды, отслеживание изменений, внутренние каталоги. -
Насколько точно AI Suggest Columns определяет поля для плагинов и паттернов?
Обычно AI Suggest Columns быстро находит ключевые поля в карточках списков (названия, URL, рейтинги, установки, изображения) и за секунды предлагает рабочую схему. При необходимости вы можете переименовать колонки, задать типы данных и добавить инструкции (например, извлекать только число из поля “Active installs”). -
Можно ли автоматически отслеживать рост плагинов во времени?
Да. Используйте Scheduled Scraper, чтобы запускать сбор одного и того же списка по расписанию (ежедневно/еженедельно/ежемесячно) и выгружать результаты в таблицу для временных рядов. Так удобно мониторить установки, изменения рейтинга и частоту обновлений. -
Можно ли скрейпить WordPress.org — это нормально?
На WordPress.org размещены публичные страницы, и многие команды собирают открытые веб-данные для исследований и операционных задач. Тем не менее стоит ознакомиться с условиями WordPress.org и соблюдать применимые законы, уважать лимиты запросов и не собирать чувствительные данные. -
Если WordPress.org изменит дизайн, скрапер перестанет работать?
Классические скраперы часто ломаются при изменениях HTML, но ИИ Thunderbit каждый запуск анализирует контекст страницы и способен адаптироваться ко многим обновлениям. Если изменения существенные, достаточно заново запустить AI Suggest Columns и обновить схему за минуту.
📚 Узнать больше
- Начать работу:
- Гайды и статьи:
- База:
- Масштабный сбор списков:
- Экспорт в Excel:
- Обзор инструментов:
- Тарифы:
- Туториалы и демо:
