¿Alguna vez te has visto en la necesidad de recolectar información sobre productos y precios de diferentes sitios web para luego organizarla en hojas de Excel? Hacerlo a mano es un proceso lento, pesado y propenso a errores. Para que no pierdas tiempo ni cometas equivocaciones, aquí te comparto las formas más sencillas y efectivas de importar datos web directamente a Excel, tanto si estás empezando como si ya tienes experiencia.
Usando herramientas de extracción web sin programar
Si no quieres complicarte con código, existen herramientas no-code como que te permiten extraer datos de páginas web a Excel sin tener que escribir ni una línea de programación. Estas plataformas están pensadas para que cualquier persona pueda definir de manera visual las reglas de extracción, sin necesidad de saber de tecnología.
Thunderbit utiliza modelos avanzados de lenguaje natural para entender la estructura y el contenido de las páginas, sin depender de selectores fijos. La mayoría de las herramientas requieren que aprendas a usar plantillas y funciones de arrastrar y soltar, lo que puede llevarte horas antes de poder automatizar tus tareas de extracción.
Además, puedes exportar los datos a Google Sheets, Airtable o Notion con un solo clic, no solo a Excel.
3 pasos para recolectar datos de productos con Thunderbit
Paso 1: Abre la web y haz clic en “Raspador Web IA” en la barra lateral.
Cuando tengas Thunderbit instalado en tu navegador, abre la página de la que quieres extraer datos y busca la opción “Raspador Web IA” en la barra lateral de Thunderbit.
Paso 2: Personaliza los campos de datos que quieres extraer con ayuda de la IA.
Al usar la función “Sugerir columnas con IA”, se creará automáticamente una plantilla de extracción. Puedes modificarla con el apoyo de la IA para ajustarla a lo que necesitas. Elige dónde guardar los datos: puedes copiarlos como tabla o enviarlos a otras plataformas.
Paso 3: Exporta los datos extraídos a Excel
Cuando hayas revisado todos los campos, ejecuta el raspador. Podrás copiar o descargar los datos y luego importarlos fácilmente a Excel.
Prueba la extracción web con IA
¡Anímate a probarlo! Puedes hacer clic, explorar y ejecutar el flujo de trabajo mientras lo ves.
Usando consultas web de Excel
Excel tiene una función llamada Consulta Web que te permite extraer datos directamente de páginas web. Es ideal para importar tablas bien estructuradas y mantener los datos actualizados de forma periódica. Eso sí, esta función solo está disponible en la versión de Excel para Windows.
Pasos para recolectar datos de productos con Consultas Web de Excel:
- Abre Excel: Inicia un libro nuevo y ve a la pestaña Datos.
- Selecciona "Desde web": Haz clic en "Obtener datos externos" y elige "Desde web".
- Introduce la URL: Escribe la dirección de la web que quieres extraer y haz clic en OK.
- Elige los datos: Excel te mostrará las tablas que encontró en la página. Selecciona la que te interese y haz clic en Cargar.
- Revisa el resultado: Decide dónde quieres colocar los datos en tu hoja y comprueba si cumplen con lo que necesitas.
Descubre cómo Thunderbit va más allá de la extracción de datos. Usa IA para extraer, resumir y rellenar páginas web automáticamente. .
Usando VBA en Excel para extracción personalizada
Si tienes conocimientos de programación, puedes usar VBA (Visual Basic for Applications) para hacer extracciones más avanzadas. VBA es un lenguaje que viene integrado en las aplicaciones de Microsoft Office, incluido Excel. Esta función solo está disponible en Excel para Windows.
Pasos para recolectar datos de productos con VBA en Excel:
- Activa la pestaña Desarrollador:
- Abre Excel, haz clic en "Excel" > "Preferencias" > "Ver".
- Marca la opción "Desarrollador" en la parte inferior.
- Agrega referencias:
- En la pestaña Desarrollador, haz clic en "Visual Basic" para abrir el editor de VBA.
- Ve a "Herramientas" > "Referencias" y selecciona:
- Microsoft Internet Controls
- Microsoft HTML Object Library
- Escribe el código VBA para extraer datos
- Haz clic en "Insertar" > "Módulo"
- Escribe el código VBA en el editor.
Aquí tienes un ejemplo básico para extraer el título, precio y valoración de un producto de una página de Amazon:
Sub ScrapeAmazonPage()
Dim IE As Object
Dim html As Object
Dim productTitle As String
Dim productPrice As String
Dim productRating As String
' Crear objeto Internet Explorer
Set IE = CreateObject("InternetExplorer.Application")
' Navegar a la página de producto de Amazon
IE.Visible = True
IE.navigate "Pon aquí tu URL"
' Esperar a que la página cargue
Do While IE.Busy Or IE.readyState <> 4
DoEvents
Loop
' Obtener el documento HTML
Set html = IE.document
' Extraer el título del producto
On Error Resume Next
productTitle = html.getElementById("productTitle").innerText
On Error GoTo 0
' Extraer el precio del producto
On Error Resume Next
productPrice = html.getElementsByClassName("a-price-whole")(0).innerText
On Error GoTo 0
' Extraer la valoración del producto
On Error Resume Next
productRating = html.getElementsByClassName("a-icon-alt")(0).innerText
On Error GoTo 0
' Volcar los datos extraídos en Excel
With ThisWorkbook.Sheets(1)
.Cells(1, 1).Value = "Título del producto"
.Cells(1, 2).Value = "Precio"
.Cells(1, 3).Value = "Valoración"
.Cells(2, 1).Value = productTitle
.Cells(2, 2).Value = productPrice
.Cells(2, 3).Value = productRating
End With
' Limpiar
IE.Quit
Set IE = Nothing
Set html = Nothing
End Sub
- Ejecuta y prueba el script VBA
- Ejecuta el script desde el editor de Visual Basic o asígnalo a un botón en tu hoja de Excel.
- Revisa los datos en tu hoja para asegurarte de que el formato es el correcto.
Deja que la IA se encargue de la extracción de datos sin complicaciones de código. Libera tu tiempo y concéntrate en lo importante. Descubre el potencial de nuestro !
Preguntas frecuentes
-
¿Qué es la extracción web y para qué sirve?
La extracción web es el proceso de recolectar datos de páginas web y organizarlos en formatos como tablas. Es muy útil para reunir información de diferentes fuentes, como precios de productos, y así facilitar la comparación y el análisis.
-
¿Cómo funciona Thunderbit?
Thunderbit te permite extraer datos sin programar. A través de interfaces visuales, puedes seleccionar los campos que quieres extraer y la herramienta automatiza el proceso, haciendo mucho más fácil la recolección de información.
-
¿Puedo exportar datos a otras plataformas además de Excel con Thunderbit?
Sí, Thunderbit te deja exportar datos a Google Sheets, Airtable y Notion, dándote flexibilidad para gestionar la información más allá de Excel.
-
¿Por qué los datos de la Consulta Web no se actualizan automáticamente?
Asegúrate de que la opción “Actualizar todo” esté activada en la pestaña Datos de Excel. Puedes programar actualizaciones automáticas desde “Propiedades de conexión” en Consultas y conexiones.
-
¿Por qué el código VBA no funciona correctamente?
Verifica que hayas activado la pestaña Desarrollador y seleccionado las referencias necesarias (Microsoft Internet Controls y HTML Object Library).
Más información: