Google News extrae contenido de más de de todo el mundo, lo que lo convierte en uno de los escaparates de noticias en tiempo real más completos de internet. Pero hay algo que casi nadie te cuenta al principio: Google eliminó su API oficial de News en 2011 y nunca la sustituyó.
Eso deja en una situación complicada a los equipos de PR que hacen seguimiento de menciones de marca, a los comerciales que vigilan señales del sector y a los analistas que montan paneles de inteligencia competitiva. Necesitas datos estructurados de noticias —titulares, fuentes, fechas, texto de los artículos—, pero Google desaconseja activamente el scraping automatizado con CAPTCHAs, limitación de solicitudes y cambios constantes en el diseño de las páginas. Llevo años creando y probando herramientas de extracción de datos en Thunderbit, y puedo decirte que la distancia entre “voy a scrapear Google News rapidito” y conseguir datos fiables y estructurados de verdad es mucho mayor de lo que la mayoría imagina.
Esta guía recopila los 10 mejores scrapers de Google News que he encontrado entre APIs, herramientas sin código y planes gratuitos, con comparativas de precios honestas, un desglose anti-bots y el nivel de detalle por campos que de verdad te ayuda a elegir la herramienta adecuada.
Por qué Google News es difícil de scrapear (y por qué no existe una API oficial)
Google en 2011. Desde entonces, cualquier herramienta que se presente como “Google News API” es una capa de terceros: hace scraping o actúa como proxy de los resultados de Google News en tu nombre. La opción programática oficial más cercana es la , que ofrece 100 consultas gratis al día y cobra 5 USD por cada 1.000 consultas. Pero requiere configurar un motor de búsqueda personalizado y no sustituye directamente a Google News.
Mientras tanto, las defensas anti-scraping de Google son reales:
- Limitación de solicitudes por IP: si golpeas Google News demasiado rápido, verás .
- Páginas de consentimiento e intersticiales: según tu ubicación, Google puede mostrar pantallas de cookies que rompen la mayoría de los analizadores.
- Contenido renderizado con JavaScript: gran parte de Google News se carga dinámicamente, así que las peticiones HTTP simples devuelven HTML incompleto.
- URLs envueltas en redirecciones: los enlaces de Google News suelen pasar por la propia capa de redirección de Google antes de llegar a la página del editor.
- Deriva del diseño: Google cambia con frecuencia la forma en que se estructuran las tarjetas de noticias, los clústeres de historias y las secciones temáticas.
En marzo de 2025, Google además , lo que hace que la plataforma sea todavía más dinámica. Los hilos de la comunidad en y están llenos de desarrolladores compartiendo soluciones para páginas de consentimiento, selectores rotos y formatos de URL cambiantes.
Entonces, ¿por qué sigue haciéndolo la gente? Porque , y de ellas son consultas que Google nunca había visto antes. Para monitorización de marca, análisis de tendencias, detección de señales de negocio e inteligencia competitiva, Google News sigue siendo uno de los escaparates de noticias más amplios y flexibles en cuanto a consultas.
RSS vs. API vs. scraping sin código: cómo elegir el método adecuado
No todos los scrapers de Google News funcionan igual. Antes de elegir una herramienta, conviene entender los tres enfoques principales y cuándo tiene sentido cada uno.
| Enfoque | Ideal para | Limitaciones | Herramientas de ejemplo |
|---|---|---|---|
| Fuentes RSS de Google News | Seguimiento simple de titulares, gratis, bajo volumen | Sin texto completo, máximo ~100 resultados, filtrado limitado | Lectores RSS integrados, n8n |
| SERP / News API | Monitorización escalable por palabras clave, metadatos estructurados | Coste continuo, normalmente solo titulares + fragmentos | SerpApi, Scrapingdog, Newsdata.io |
| Scraping directo (sin código) | Contenido completo de artículos, campos personalizados, investigaciones puntuales | Necesita manejo anti-bots, menos escalable que las APIs | Thunderbit, Octoparse, Apify |
| Scraping directo (con código) | Máximo control, flujos personalizados | Mantenimiento alto, gestión de CAPTCHA, fallos frecuentes | Scrapy, BeautifulSoup + Selenium |
La mayoría de los artículos de la competencia solo cubren APIs y bibliotecas de Python. Pero los datos de intención de usuario que he visto cuentan otra historia: una gran parte de quienes buscan “los mejores scrapers de Google News” no son desarrolladores, sino responsables de PR, líderes de operaciones y equipos de ventas que necesitan una solución de apuntar y hacer clic, no un proyecto de programación. Por eso esta lista incluye extensiones de navegador y plataformas sin código junto a los pesos pesados de las APIs.
Conviene tener en cuenta que las fuentes RSS de Google News siguen siendo gratuitas y útiles para un seguimiento ligero de titulares. Puedes suscribirte a una fuente por tema o palabra clave y obtener unos 100 resultados con títulos, enlaces y fechas de publicación. Pero si necesitas texto completo del artículo, nombres de autor, análisis de sentimiento o más de cien resultados, necesitarás una de las herramientas de abajo.
Cómo evaluamos los mejores scrapers de Google News
Apliqué los mismos criterios a todas las herramientas de esta lista:
- Facilidad de uso: sin código vs. requiere código vs. solo API
- Manejo anti-bots / CAPTCHA: crítico para Google
- Campos de datos extraídos: titular, fuente, fecha, fragmento, URL, texto completo, autor, imágenes, sentimiento
- Disponibilidad y limitaciones del plan gratuito
- Coste normalizado por 1.000 solicitudes: porque cada proveedor presenta los precios de forma distinta (por mes, por crédito, por solicitud), lo normalicé a coste por 1.000 resultados correctos en el nivel de pago más bajo
- Formatos de exportación: JSON, CSV, Google Sheets, Airtable, Notion, etc.
- Escalabilidad: límites diarios de volumen, rate limits, concurrencia
- Caso de uso ideal
Normalizar el precio importa más de lo que parece. Una herramienta cobra por “búsqueda” (que devuelve 10 resultados), otra por “crédito” (donde 1 crédito = 1 fila) y una tercera por “solicitud” (donde renderizar JavaScript cuesta más). Sin normalizar, estás comparando peras con orangutanes.
Los 10 mejores scrapers de Google News de un vistazo
Aquí tienes la tabla comparativa principal. Más abajo entraré en detalle con cada herramienta, pero esto debería ayudarte a acotar rápido.
| Herramienta | Tipo | Plan gratuito | ~Coste por 1K resultados | Manejo anti-bots | Extracción de artículo completo | Formatos de exportación | Ideal para |
|---|---|---|---|---|---|---|---|
| Thunderbit | Extensión de Chrome / IA sin código | Plan gratuito (6 páginas) | ~$6–$30 por 1K filas (según plan) | Modo navegador (tu sesión) + modo nube | Sí (scraping de subpáginas) | Excel, CSV, Sheets, Airtable, Notion, JSON | Usuarios no técnicos, equipos de negocio |
| SerpApi | API de SERP | 250 búsquedas/mes | ~$5–$15 por 1K resultados | Antidetección específica para SERP | No (titulares + fragmentos) | JSON | Desarrolladores, flujos de API estructurados |
| ScraperAPI | API genérica de scraping | 1.000 créditos/mes + 5.000 de prueba | ~$0,10–$0,49 por 1K solicitudes | Rotación de proxies, renderizado JS | No tiene analizador específico | JSON, HTML | Desarrolladores con presupuesto ajustado, scraping genérico |
| Apify | Plataforma de scraping en la nube | Prueba de 7 días | Varía según actor/cómputo | Renderizado JS, navegador sin interfaz | Depende del actor | JSON, CSV, Excel, API | Equipos técnicos, flujos preconstruidos |
| Bright Data | Scraper/dataset empresarial | 1K solicitudes de prueba | ~$1,30–$2,50 por 1K registros | Proxies, resolución de CAPTCHA, renderizado en navegador | Sí (producto News Scraper) | JSON, CSV | Flujos empresariales |
| Octoparse | Plataforma visual sin código | Plan gratuito (limitado) | ~$9–$25 por 1K filas (prorrateado) | Ejecución en la nube, anti-bloqueo | Sí (la plantilla incluye texto del cuerpo) | CSV, Excel, JSON, bases de datos | Quienes crean flujos visuales |
| ScrapingBee | API de scraping | Créditos de prueba | Varía (basado en créditos, el JS cuesta más) | Headless Chrome, rotación de proxies, CAPTCHA | No tiene analizador específico | JSON, HTML | Desarrolladores que necesitan renderizado JS |
| Oxylabs | API de SERP / scraper | Hasta 2.000 resultados de prueba | ~$1,00–$2,35 por 1K resultados | Más de 100M de proxies, resolución de CAPTCHA | No (datos SERP) | JSON | Scraping a gran escala y por geolocalización |
| Scrapingdog | API de SERP económica | 1.000 créditos gratis | ~$0,10 por 1K solicitudes | Antidetección específica para SERP | No (titulares + fragmentos) | JSON | Desarrolladores con presupuesto limitado |
| Newsdata.io | API de noticias dedicada | 200 solicitudes/día | Varía según el plan | N/A (no hace scraping directo de Google) | Sí (planes premium) | JSON | Funciones NLP específicas para noticias |
Saltan a la vista varias cosas. ¿El coste más bajo por solicitud? Scrapingdog y ScraperAPI. ¿La configuración sin código más sencilla? Thunderbit y Octoparse. ¿Fiabilidad de nivel empresarial con geolocalización? Bright Data y Oxylabs.
Vamos con el análisis detallado.
1. Thunderbit — el mejor scraper de Google News sin código para usuarios de negocio
es la herramienta que construimos en nuestra empresa, así que lo diré sin rodeos. Pero también seré específico sobre lo que hace y lo que no hace, porque creo que la honestidad es más útil que el hype.
Thunderbit es una impulsada por IA y diseñada para personas que necesitan datos estructurados de sitios web sin escribir código. Para Google News, el flujo es este:
- Abre los resultados de Google News en Chrome.
- Haz clic en “AI Suggest Fields”: la IA lee la página y detecta automáticamente columnas como titular, fuente, fecha, fragmento y URL.
- Haz clic en “Scrape” para extraer los datos estructurados en una tabla.
Esa es la página de listado. El verdadero valor para casos de uso de noticias llega después: tras scrapear los resultados de Google News, puedes hacer clic en “Scrape Subpages” para visitar cada URL de artículo y extraer el texto completo, el autor, las imágenes y más. Esto resuelve directamente el problema de “ya tengo enlaces, pero todavía necesito rastrear y extraer el contenido real”, que aparece constantemente en los foros.
Field AI Prompt te permite añadir instrucciones personalizadas de IA por columna. Por ejemplo, podrías añadir una columna de “Sentimiento” con una instrucción como “Clasifica este artículo como positivo, negativo o neutral respecto a [marca]”. Eso significa que extraes datos y los enriqueces en una sola pasada, algo que ninguna de las herramientas puramente API ofrece.
Thunderbit admite tanto Browser Scraping (se ejecuta en tu sesión de Chrome, heredando tus cookies y tu estado de inicio de sesión, lo que evita muchos disparadores de detección de bots) como Cloud Scraping (gestiona hasta 50 páginas a la vez con infraestructura anti-bot integrada). También puedes configurar para monitorización recurrente de noticias.
Funciones clave
- AI Suggest Fields detecta automáticamente columnas de titular, fuente, fecha y URL
- Scraping de subpáginas para contenido completo, autor e imágenes
- Field AI Prompt para análisis de sentimiento, traducción o etiquetado personalizado
- Modos de scraping en nube y en navegador
- Scraping programado para monitorización diaria/semanal
- Exportación gratuita a Google Sheets, Airtable, Notion, Excel, CSV y JSON
Precio
- Plan gratuito: 6 páginas
- Prueba gratuita: 10 páginas
- Los planes de pago empiezan en ~9 USD/mes (basado en créditos, 1 crédito = 1 fila de salida)
- Coste normalizado por 1K filas: entre ~$6 y $30 según el plan
Ideal para
Equipos de ventas, profesionales de PR, responsables de operaciones y cualquiera que necesite datos estructurados de Google News sin escribir una sola línea de código. Especialmente útil cuando necesitas el contenido completo del artículo más campos enriquecidos con IA, como el sentimiento.
2. SerpApi — la mejor API estructurada de Google News para desarrolladores
es la opción ideal si quieres un endpoint dedicado de Google News que devuelva JSON limpio y estructurado. Tiene dos endpoints relevantes: uno para news.google.com (la página de Google News) y otro para la pestaña de noticias tbm=nws en la Búsqueda de Google estándar.
La documentación de campos es inusualmente detallada: obtienes title, source, authors, link, thumbnail, topic_token, story_token, related_topics y related_publications. El soporte de story-token y topic-token es realmente útil para desduplicar historias agrupadas, un punto débil que la mayoría de herramientas ignora.
En mi experiencia, el tiempo de respuesta de SerpApi es rápido (normalmente por debajo de 2 segundos) y la disponibilidad es sólida. La principal limitación es que es solo API, así que necesitas código o una integración sin código para consumir los datos. No hay texto completo del artículo, solo titulares, fragmentos y metadatos.
Funciones clave
- Endpoint dedicado de búsqueda de Google News con JSON estructurado
- Segmentación por ubicación e idioma
- Consultas históricas de noticias mediante el parámetro
tbs - Soporte de tokens de historias y temas para agrupación
Precio
- Gratis:
- Developer: 75 USD/mes por 5.000 búsquedas
- Production: 150 USD/mes por 15.000 búsquedas
- Coste normalizado por 1K resultados: ~$5–$15 (suponiendo ~10 resultados por búsqueda)
Ideal para
Desarrolladores que construyen flujos automatizados de monitorización de noticias y necesitan datos SERP fiables y estructurados con buena cobertura de campos.
3. ScraperAPI — la mejor API genérica económica para Google News
ScraperAPI es una API de scraping de propósito general, no una herramienta específica para Google News. Pero la incluimos aquí porque es una de las formas más baratas de acceder a páginas de Google News a escala si no te importa escribir tu propio analizador.
ScraperAPI gestiona la rotación de proxies, el renderizado de JavaScript y la resolución de CAPTCHA detrás de una simple API REST. Tú envías una URL y te devuelve el HTML renderizado. La pega es que no hay un analizador específico para Google News, así que tendrás que extraer los campos por tu cuenta o combinarlo con una biblioteca de parsing.
Algunos usuarios informan de tiempos de respuesta más lentos (7–23 segundos en benchmarks), y el sistema de créditos hace que cada tipo de solicitud cueste un número distinto. Pero para desarrolladores que ya saben cómo analizar el HTML de Google News, el precio de ScraperAPI es difícil de superar.
Funciones clave
- Rotación automática de proxies y geolocalización
- Renderizado de JavaScript
- Modelo basado en créditos (100K créditos en el plan básico)
- + 5.000 créditos de prueba
Precio
- Gratis: 1.000 créditos/mes
- Hobby: 49 USD/mes (100.000 créditos)
- Startup: 149 USD/mes (1.000.000 de créditos)
- Coste normalizado por 1K solicitudes: ~$0,10–$0,49 según el plan
Ideal para
Desarrolladores con presupuesto ajustado que necesitan una capa barata de proxy/renderizado y están cómodos construyendo su propio analizador de Google News.
4. Apify — la mejor plataforma en la nube con actores de Google News preconstruidos
Apify es una plataforma de scraping en la nube con un marketplace de “Actors”: scrapers preconstruidos que puedes ejecutar sin programar. Hay varios actores de Google News Scraper aportados por la comunidad, y la plataforma se encarga de la ejecución en la nube, la programación y el almacenamiento.
Puedes empezar rápidamente con un actor ya hecho. La contrapartida es que los actores de la comunidad varían en calidad y mantenimiento. Algunos pueden fallar cuando Google cambia el diseño, y dependes del autor para corregirlos. La infraestructura de Apify es sólida, pero la experiencia específica con Google News depende del actor que elijas.
Funciones clave
- Actores específicos de Google News en la Apify Store
- Ejecuciones programadas en la nube
- Integraciones con API y webhooks
- Exportación a JSON, CSV, Excel y vía API
Precio
- Prueba gratuita: 7 días
- Planes de pago desde 49 USD/mes
- Coste normalizado por 1K solicitudes: varía según el actor y el uso de cómputo
Ideal para
Equipos técnicos que quieren flujos de scraping ya hechos sin construir desde cero, y que necesitan programación e integraciones con API en la nube.
5. Bright Data — el mejor scraper de Google News de nivel empresarial
Bright Data es el gigante empresarial. Su producto News Scraper admite explícitamente Google News e incluye gestión automatizada de proxies, renderizado completo en navegador, resolución de CAPTCHA y procesamiento por lotes de hasta 5.000 URLs. Los campos incluyen ID, URL, titular, autor, temas y más.
Bright Data también vende un dataset de Google News ya recopilado desde 2,50 USD por cada 100.000 registros, una opción útil para equipos que no quieren scrapear en vivo.
La red de más de 72 millones de proxies residenciales es lo que marca la diferencia en el manejo anti-bots. Si estás scrapeando Google News desde varios países y con alto volumen, Bright Data absorbe la complejidad.
Funciones clave
- News Scraper con soporte para Google News
- Más de 72M de proxies residenciales con geolocalización
- Resolución de CAPTCHA integrada
- Web Scraper IDE (visual, semisin código)
- Opciones de pago por uso y suscripción
Precio
- Prueba gratuita: 1.000 solicitudes
- Pago por uso: ~$2,50/1K registros
- Scale: 499 USD/mes (384K registros incluidos, ~$1,30/1K adicionales)
Ideal para
Grandes empresas y organizaciones que necesitan datos de Google News de alto volumen y alta fiabilidad, con cobertura geográfica global e infraestructura de cumplimiento.
6. Octoparse — el mejor scraper de escritorio sin código para Google News
Octoparse ofrece tanto una plantilla normal de Google News Scraper como una plantilla en la nube. La lista de campos es inusualmente transparente: palabra clave, fuente, título, fecha de publicación, URL, texto del cuerpo, autor, resumen, imágenes y campos de mensaje de error.
La plantilla en la nube incluso publica una tarifa de 0,1 USD por cada 1.000 líneas en Run Mode, algo poco habitual en cuanto a transparencia de precios en una herramienta sin código. Pero el coste real depende del nivel de suscripción que necesites para la programación en la nube y las funciones anti-bloqueo.
El constructor visual de flujos de Octoparse encaja bien con quienes quieren control explícito sobre los pasos de extracción sin escribir código. La curva de aprendizaje es más pronunciada que la de Thunderbit, pero algunos usuarios prefieren ese nivel de detalle.
Funciones clave
- Plantilla preconstruida de Google News con extracción detallada de campos
- Constructor visual de flujos de trabajo de apuntar y hacer clic
- Ejecución en la nube y local
- Extracciones programadas y recurrentes
- Exportación a CSV, Excel, JSON y bases de datos
Precio
- Plan gratuito con funciones limitadas
- Planes de pago desde 69 USD/mes
- Coste normalizado: ~$9–$25 por 1K filas (prorrateado con el coste del plan)
Ideal para
Usuarios no técnicos que prefieren una herramienta visual de escritorio con control paso a paso sobre la extracción y que necesitan scraping recurrente de Google News.
7. ScrapingBee — la mejor API para páginas de Google News con mucho JavaScript
ScrapingBee se especializa en renderizado con navegador sin interfaz, rotación de proxies y evasión anti-bots. Es una gran opción cuando las páginas de Google News necesitan ejecución completa de JavaScript para renderizar resultados, algo cada vez más frecuente.
La API es sencilla: envías una URL y recibes HTML renderizado o una captura de pantalla. ScrapingBee se encarga en segundo plano de la rotación de proxies y la resolución de CAPTCHA. Pero, igual que ScraperAPI, no tiene un analizador específico para Google News; tendrás que extraer los campos tú mismo.
El sistema de créditos hace que las solicitudes renderizadas con JavaScript cuesten más que las peticiones HTTP simples, así que tenlo en cuenta al estimar costes para Google News.
Funciones clave
- Renderizado con Chrome sin interfaz para páginas pesadas en JS
- Rotación automática de proxies y bypass de CAPTCHA
- Soporte de scraping de Google Search / News
- API REST sencilla con respuesta JSON/HTML
Precio
- Planes desde 49 USD/mes
- Basado en créditos (el renderizado JS cuesta más por solicitud)
- Coste normalizado por 1K solicitudes: varía según las necesidades de renderizado
Ideal para
Desarrolladores que necesitan renderizado fiable de JavaScript y manejo anti-bots para páginas de Google News a través de una API sencilla.
8. Oxylabs — el mejor scraper de Google News para resultados geolocalizados
Oxylabs tiene una API dedicada de Google News Scraper dentro de su stack SERP, respaldada por un pool de más de 100M de proxies en 195 países. La propuesta: fiabilidad de nivel empresarial con resultados específicos por geografía.
Oxylabs admite salida JSON estructurada, modos de scraping en tiempo real y por lotes, y lógica de parsing personalizada con XPath y selectores CSS. El precio específico para Google es claro: unos ~$2,00/1K resultados en el plan Micro, bajando a ~$0,90/1K en niveles superiores.
La prueba gratuita te da hasta , suficiente para comprobar si la calidad de los datos encaja con tus necesidades.
Funciones clave
- API de SERP Scraper con soporte para Google News
- Más de 100M de proxies en 195 países
- Entrega JSON estructurada
- Modos de scraping en tiempo real y por lotes
Precio
- Prueba gratuita: hasta 2.000 resultados
- Micro: ~$2,00/1K resultados de Google (~$2,35/1K con renderizado JS)
- Niveles superiores: ~$0,90/1K
- Planes empresariales personalizados disponibles
Ideal para
Equipos empresariales y de mercado medio que necesitan resultados de Google News geolocalizados a escala y con alta fiabilidad.
9. Scrapingdog — la mejor API económica para Google News
Scrapingdog se posiciona como una alternativa rentable a SerpApi, con un endpoint dedicado de Google News API. La respuesta JSON estructurada incluye título, fuente, fecha, fragmento y enlace.
El precio es realmente agresivo: algunos planes ofrecen 400K solicitudes por 40 USD, lo que equivale a unos 0,10 USD por cada 1.000 solicitudes. El tiempo de respuesta suele rondar los 2 segundos y tienes 1.000 créditos gratis para probar.
La contrapartida: Scrapingdog es una empresa más pequeña, con menos documentación y menos integraciones que los grandes actores. Pero para startups y builders con presupuesto ajustado, la economía resulta muy atractiva.
Funciones clave
- Endpoint dedicado de Google News Scraper API
- Respuesta JSON estructurada (título, fuente, fecha, fragmento, enlace)
- Datos históricos de noticias mediante el parámetro
tbs - 1.000 créditos gratis para probar
Precio
- Gratis: 1.000 créditos
- Planes de pago desde 40 USD/mes
- Coste normalizado por 1K solicitudes: ~$0,10
Ideal para
Desarrolladores y startups con presupuesto ajustado que necesitan datos de Google News de alto volumen al menor coste posible por solicitud.
10. Newsdata.io — la mejor API de noticias dedicada (más allá de Google News)
es una API de datos de noticias diseñada específicamente para agregar información de más de 50.000 fuentes globales. No es un scraper de Google News en sentido estricto: no hace scraping directo de Google News. En su lugar, agrega de forma independiente a partir de las mismas fuentes de editores (y algunas adicionales), devolviendo JSON estructurado con búsqueda de noticias en tiempo real e histórica.
Los planes premium incluyen extracción de texto completo, análisis de sentimiento y filtrado por categorías, funciones que la mayoría de herramientas de scraping SERP no ofrecen de forma nativa. El plan gratuito ofrece , una cantidad generosa para probar.
Si tu objetivo es “obtener datos de noticias sobre un tema” y no específicamente “scrapear Google News”, Newsdata.io puede encajar mejor que cualquier herramienta SERP de esta lista.
Funciones clave
- API de búsqueda de noticias en tiempo real e histórica
- Extracción completa del texto del artículo (premium)
- Análisis de sentimiento (premium)
- Filtros por categoría, idioma y país
- Plan gratuito de 200 solicitudes/día
Precio
- Gratis: 200 solicitudes/día
- Planes de pago desde 99,99 USD/mes
- Coste normalizado por 1K solicitudes: varía según el plan
Ideal para
Equipos que necesitan una fuente dedicada de datos de noticias con funciones NLP integradas (sentimiento, categorización) y no necesitan específicamente scrapear Google News.
Comparativa de scrapers de Google News: anti-bots, campos de datos y precio
Hay tres dimensiones de comparación que importan más que ninguna otra al elegir un scraper de Google News. No he encontrado otra guía que cubra las tres de forma sistemática.
Cómo maneja cada herramienta las protecciones anti-bot de Google
El manejo anti-bot es la preocupación número 1 para cualquiera que scrapee Google News. Así es como aborda cada herramienta el problema:
| Estrategia | Herramientas que la usan |
|---|---|
| Rotación de proxies integrada | Bright Data, ScrapingBee, Oxylabs, ScraperAPI |
| Resolución de CAPTCHA incluida | Bright Data, ScrapingBee, Oxylabs |
| Renderizado JS / navegador sin interfaz | Apify, Octoparse, ScrapingBee |
| Basado en navegador (usa tu sesión) | Thunderbit (modo Browser Scraping) |
| Antidetección específica para SERP | SerpApi, Scrapingdog |
Vale la pena explicar con más detalle el modo Browser Scraping de Thunderbit. Como se ejecuta dentro de tu sesión real de Chrome, hereda tus cookies y tu estado de inicio de sesión. Eso significa que evita muchos de los disparadores de detección de bots que afectan a los scrapers sin interfaz: páginas de consentimiento, desafíos CAPTCHA y verificaciones de fingerprinting. Para necesidades de alto volumen, Cloud Scraping de Thunderbit procesa 50 páginas a la vez con su propia infraestructura anti-bot.
¿Qué campos de datos devuelve cada scraper de Google News?
Esta es la comparación que nadie más publica, y es la que más importa para elegir herramienta. Algunas solo te dan titulares y enlaces. Otras pueden extraer texto completo, nombres de autor e incluso sentimiento.
| Herramienta | Titular | Fuente | Fecha | Fragmento | URL del artículo | Texto completo | Autor | Imágenes | Sentimiento |
|---|---|---|---|---|---|---|---|---|---|
| Thunderbit | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ (vía subpágina) | ✅ (vía IA) | ✅ | ✅ (vía Field AI Prompt) |
| SerpApi | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ✅ | ✅ | ❌ |
| ScraperAPI | ✅ (parseo personalizado) | ✅ (parseo personalizado) | ✅ (parseo personalizado) | ✅ (parseo personalizado) | ✅ (parseo personalizado) | ❌ | ❌ | ❌ | ❌ |
| Apify | ✅ | ✅ | ✅ | ✅ | ✅ | Depende del actor | Depende del actor | ✅ | ❌ |
| Bright Data | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ (News Scraper) | ✅ | ✅ | ❌ |
| Octoparse | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ (plantilla) | ✅ | ✅ | ❌ |
| ScrapingBee | ✅ (parseo personalizado) | ✅ (parseo personalizado) | ✅ (parseo personalizado) | ✅ (parseo personalizado) | ✅ (parseo personalizado) | ❌ | ❌ | ❌ | ❌ |
| Oxylabs | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ✅ | ❌ |
| Scrapingdog | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ | ❌ |
| Newsdata.io | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ (premium) | ✅ | ✅ | ✅ (premium) |
Lo más destacable aquí es que Thunderbit puede extraer el texto completo del artículo mediante Scraping de subpáginas y, además, añadir campos enriquecidos con IA como el sentimiento en la misma pasada. Newsdata.io también ofrece sentimiento y texto completo, pero mediante una API de noticias dedicada, no mediante scraping de Google News. La mayoría de las APIs SERP solo devuelven lo visible en la página de listado de Google News: titulares, fragmentos y enlaces.
Coste normalizado por cada 1.000 resultados
Esta es la tabla que yo quería cuando estaba evaluando herramientas y no la encontraba por ningún sitio. Cada proveedor presenta el precio de manera distinta, así que lo normalicé todo a coste por 1.000 resultados correctos en el nivel de pago más bajo.
| Herramienta | Plan gratuito | Plan de pago más bajo | ~Coste por 1K resultados | Notas |
|---|---|---|---|---|
| Thunderbit | 6 páginas gratis / prueba: 10 páginas | Desde ~$9/mes (basado en créditos) | ~$6–$30 | 1 crédito = 1 fila; extracción con IA incluida |
| SerpApi | 250 búsquedas/mes | 75 USD/mes (5.000 búsquedas) | ~$15 | JSON estructurado, endpoint de Google News |
| ScraperAPI | 1.000 créditos/mes | 49 USD/mes (100K créditos) | ~$0,49 | No tiene analizador específico para Google News |
| Apify | Prueba de 7 días | 49 USD/mes | Varía | Depende del actor y del cómputo |
| Bright Data | 1K solicitudes de prueba | Pago por uso | ~$1,30–$2,50 | Nivel empresarial, opción de dataset disponible |
| Octoparse | Plan gratuito (limitado) | $69/mes | ~$9–$25 | Plantilla en la nube: $0,1/1K líneas (base) |
| ScrapingBee | Créditos de prueba | 49 USD/mes | Varía (el JS cuesta más) | Basado en créditos, sin analizador dedicado |
| Oxylabs | Hasta 2.000 resultados | Plan Micro | ~$1,00–$2,35 | Geolocalización, JSON estructurado |
| Scrapingdog | 1.000 créditos | 40 USD/mes | ~$0,10 | Opción económica, endpoint dedicado de News |
| Newsdata.io | 200 req/día | 99,99 USD/mes | Varía según el plan | No hace scraping directo de Google; incluye funciones NLP |
Algunas conclusiones. Scrapingdog es, con diferencia, la opción más barata por solicitud, pero solo devuelve datos a nivel SERP (sin texto completo). Bright Data y Oxylabs están en la franja media en coste, pero ofrecen la infraestructura anti-bot más robusta. Thunderbit es más caro por fila que las APIs más baratas, pero es la única herramienta que te da extracción completa de artículos más enriquecimiento con IA sin escribir código.
¿Qué scraper de Google News deberías elegir?
Mi recomendación según el caso:
- ¿Solo necesitas titulares para monitorizar y tienes poco presupuesto? → Scrapingdog o el plan gratuito de Newsdata.io
- ¿Usuario no técnico que necesita texto completo + enriquecimiento? →
- ¿Desarrollador construyendo un pipeline estructurado de noticias? → SerpApi (mejor cobertura de campos) o Scrapingdog (mejor precio)
- ¿Empresa, alto volumen, geolocalización? → Bright Data u Oxylabs
- ¿Quieres un flujo visual de escritorio? → Octoparse
- ¿Necesitas datos de noticias más allá de Google News con funciones NLP? → Newsdata.io
- ¿Necesitas la capa genérica más barata de proxy/renderizado? → ScraperAPI
La herramienta correcta depende de tres factores: tu nivel técnico, el volumen que necesitas y si te basta con titulares o requieres el contenido completo del artículo. Si no lo tienes claro, empieza por un plan gratuito —la mayoría de estas herramientas lo ofrecen— y comprueba cómo aguanta la calidad de los datos en tu caso concreto.
Si quieres probar la vía sin código más rápida, el de Thunderbit te permite scrapear resultados de Google News en un par de clics y exportarlos directamente a Google Sheets o Airtable. Para ver el proceso paso a paso, visita nuestro o la .
Y que tus titulares siempre estén estructurados, tus CAPTCHAs sean pocos y tus exportaciones salgan limpias.
Preguntas frecuentes
¿Google tiene una API oficial de News?
No. Google y nunca la ha reemplazado. La opción oficial más cercana es la Custom Search JSON API, que ofrece 100 consultas gratis al día y cobra 5 USD por cada 1.000 consultas, pero requiere configurar un motor de búsqueda personalizado y no es un producto dedicado a Google News. Hoy, cualquier herramienta que se llame “Google News API” es un servicio de terceros.
¿Puedo usar las fuentes RSS de Google News en lugar de un scraper?
Sí, para casos sencillos. Las fuentes RSS de Google News ofrecen titulares y enlaces de forma gratuita, pero están limitadas a unos 100 resultados, no incluyen texto completo del artículo y tienen opciones de filtrado mínimas. Si necesitas datos más ricos —contenido completo, nombres de autor, análisis de sentimiento o más de 100 resultados— necesitarás un scraper o una API dedicada de esta lista.
¿Cómo obtengo el texto completo de los artículos a partir de resultados de Google News?
Los listados de Google News solo muestran titulares y fragmentos. Para obtener el contenido completo, necesitas una herramienta que siga el enlace del artículo y extraiga el contenido de la página. Scraping de subpáginas de Thunderbit hace esto automáticamente después de scrapear la página de listado de Google News. Las herramientas de API como Newsdata.io ofrecen texto completo en planes premium. La mayoría de las APIs SERP (SerpApi, Scrapingdog, Oxylabs) solo devuelven lo que se ve en la página de listado.
¿Es legal scrapear Google News?
Extraer datos visibles públicamente no suele considerarse un acceso no autorizado según la ley de EE. UU. (según el precedente ), pero eso no significa que no haya riesgos de cumplimiento. Los términos de servicio de Google desaconsejan las consultas automatizadas, y Google sirve activamente cuando detecta tráfico con aspecto de bot. Los usuarios deben ceñirse a datos disponibles públicamente, respetar los derechos de autor sobre el texto de los artículos y consultar asesoría legal para usos a escala comercial.
¿Qué es lo que más suele romper los scrapers de Google News?
Los culpables habituales son la detección de consultas automatizadas (CAPTCHAs y errores 429), la deriva de localización (resultados distintos según país/idioma), las páginas de consentimiento e intersticiales, los cambios de marcado en el diseño de las tarjetas de noticias y la normalización de URLs de redirección. La capa de datos más estable es la de metadatos del artículo (título, fuente, fecha, URL). La menos estable es la superficie de presentación: la agrupación de historias, las miniaturas y la organización de secciones cambian con frecuencia.
Más información