FR

La méthode la plus simple pour extraire des données de site web vers Excel

Last Updated on January 3, 2025

Avez-vous déjà eu besoin de collecter des informations sur des produits et des données de prix à partir de plusieurs sites web et de les organiser dans des feuilles Excel ? Naviguer et organiser ces informations manuellement est non seulement chronophage et laborieux, mais aussi sujet aux erreurs. Pour résoudre ce problème, nous allons explorer certaines des méthodes les plus simples et efficaces pour extraire des données de sites web directement dans Excel, avec des options adaptées aussi bien aux débutants qu'aux utilisateurs avancés.

Utilisation d'outils d'extraction web sans code

Pour les utilisateurs qui préfèrent ne pas coder, des outils d'extraction web sans code comme peuvent vous aider à extraire des données de sites web vers Excel sans aucun codage. Ces outils sont conçus pour simplifier le processus en permettant aux utilisateurs de définir visuellement les règles d'extraction de données sans avoir besoin de compétences en programmation.

Thunderbit utilise des modèles avancés de langage naturel pour comprendre les mises en page et le contenu des sites web sans se baser sur des sélecteurs fixes. La plupart des outils, cependant, utilisent des fonctionnalités de glisser-déposer et des modèles personnalisables, nécessitant des heures d'apprentissage avant de pouvoir configurer et automatiser les tâches d'extraction web.

De plus, vous pouvez exporter des données vers Google Sheets, Airtable ou Notion en un clic, pas seulement vers Excel.

3 étapes pour collecter des données produits avec Thunderbit

Étape 1 : Ouvrez le site web et cliquez sur "Extracteur Web IA" dans la barre latérale.

Après avoir facilement installé Thunderbit sur votre navigateur, ouvrez le site web que vous souhaitez extraire et trouvez l'option "Extracteur Web IA" dans la barre latérale de Thunderbit.

thunderbit_collect_data_step_1

Étape 2 : Personnalisez les champs de données que vous souhaitez extraire avec l'aide de l'IA.

Un modèle d'extraction sera automatiquement généré lorsque vous utiliserez la fonction "IA Suggérer des Colonnes". Vous pouvez ensuite modifier ce modèle avec le soutien de l'IA pour répondre à vos besoins. Vous aurez des options pour savoir où enregistrer vos données—soit en les sortant sous forme de tableau à copier, soit en les enregistrant sur d'autres plateformes.

thunderbit_collect_data_step_2.gif

Étape 3 : Exportez les données extraites vers Excel

Une fois que vous avez vérifié tous les champs de données, exécutez l'extracteur. Vous pouvez copier ou télécharger les données extraites et les importer dans Excel.

thunderbit_collect_data_step_3.gif

Utilisation des requêtes web Excel

Excel dispose d'une fonctionnalité intégrée appelée Requête Web qui permet aux utilisateurs d'extraire des données directement à partir de pages web. Cette méthode est particulièrement utile pour importer des données structurées et tabulaires directement depuis des sites web, et elle vous permet de maintenir la pertinence des données avec des mises à jour périodiques. Veuillez noter, cependant, que cette fonctionnalité est disponible uniquement sur les versions Windows d'Excel.

Étapes pour collecter des données produits avec les requêtes web Excel :

  1. Ouvrez Excel : Démarrez un nouveau classeur et accédez à l'onglet Données.
  2. Sélectionnez "Depuis le Web" : Cliquez sur "Obtenir des données externes" et choisissez "Depuis le Web".
  3. Entrez l'URL : Saisissez l'adresse du site web que vous souhaitez extraire et cliquez sur OK.

excel_web queries_enter_url.png

  1. Choisissez les données : Excel affichera les tableaux trouvés sur la page. Sélectionnez le tableau souhaité et cliquez sur Charger.

excel_web queries_enter_choose_data.png

  1. Vérifiez le résultat : Vous pouvez spécifier où charger les données dans votre classeur et voir si elles répondent à vos besoins.

thunderbit_collect_data_step_1.gif

Découvrez comment Thunderbit peut faire plus que simplement extraire des données. Utilisez l'IA pour extraire, résumer et remplir automatiquement les pages web. .

Utilisation de VBA Excel pour une extraction personnalisée

Pour ceux qui ont des connaissances en programmation, l'utilisation de VBA (Visual Basic for Applications) permet des tâches d'extraction plus complexes. VBA est un langage de programmation intégré aux applications Microsoft Office, y compris Excel. Cette fonctionnalité est uniquement disponible dans Excel pour Windows.

Étapes pour collecter des données produits avec Excel VBA :

  1. Activez l'onglet Développeur :
    • Ouvrez Excel, cliquez sur "Excel" > "Préférences" > "Affichage".
    • Cochez l'option "Développeur" dans le volet inférieur.
  2. Ajoutez des références :
    • Dans l'onglet Développeur, cliquez sur "Visual Basic" pour ouvrir l'éditeur VBA.
    • Allez dans "Outils" > "Références" et cochez les éléments suivants :
      • Microsoft Internet Controls
      • Microsoft HTML Object Library
  3. Écrivez le code VBA pour l'extraction de données
    • Cliquez sur "Insérer" > "Module"
    • Écrivez le code VBA dans l'éditeur.

excel_vba_insert.png

Voici un exemple de base pour extraire le titre du produit, le prix et la disponibilité d'une page produit Amazon :

    Sub ScrapeAmazonPage()
        Dim IE As Object
        Dim html As Object
        Dim productTitle As String
        Dim productPrice As String
        Dim productRating As String
        
        ' Créez un objet Internet Explorer
        Set IE = CreateObject("InternetExplorer.Application")
        
        ' Naviguez vers la page produit Amazon
        IE.Visible = True
        IE.navigate "Mettez votre URL ici"
        
        ' Attendez que la page se charge
        Do While IE.Busy Or IE.readyState <> 4
            DoEvents
        Loop
        
        ' Obtenez le document HTML
        Set html = IE.document
        
        ' Extrayez le titre du produit
        On Error Resume Next
        productTitle = html.getElementById("productTitle").innerText
        On Error GoTo 0
        
        ' Extrayez le prix du produit
        On Error Resume Next
        productPrice = html.getElementsByClassName("a-price-whole")(0).innerText
        On Error GoTo 0
        
        ' Extrayez la note du produit
        On Error Resume Next
        productRating = html.getElementsByClassName("a-icon-alt")(0).innerText
        On Error GoTo 0
        
        ' Sortez les données extraites vers Excel
        With ThisWorkbook.Sheets(1)
            .Cells(1, 1).Value = "Titre du produit"
            .Cells(1, 2).Value = "Prix"
            .Cells(1, 3).Value = "Note"
            .Cells(2, 1).Value = productTitle
            .Cells(2, 2).Value = productPrice
            .Cells(2, 3).Value = productRating
        End With
        
        ' Nettoyez
        IE.Quit
        Set IE = Nothing
        Set html = Nothing
    End Sub
  1. Exécutez et testez le script VBA
    • Exécutez votre script dans l'éditeur Visual Basic ou assignez le script à un bouton dans votre feuille Excel.
    • Vérifiez la sortie des données dans votre feuille Excel pour vous assurer qu'elles sont formatées comme prévu.

excel_vba_result.png

Laissez l'IA gérer votre extraction de données sans les tracas du codage. Libérez votre temps pour vous concentrer sur ce qui est important. Découvrez la puissance de notre !

FAQ

  1. Qu'est-ce que l'extraction web et pourquoi est-ce utile ?

    L'extraction web collecte des données à partir de sites web et les organise sous des formats comme des tableaux. Elle est bénéfique pour rassembler des informations de plusieurs sources, telles que les prix des produits, permettant une comparaison et une analyse faciles.

  2. Comment fonctionne Thunderbit ?

    Thunderbit permet l'extraction de données sans codage. En utilisant des interfaces visuelles, les utilisateurs peuvent sélectionner les champs de données à extraire, que l'outil automatise ensuite, simplifiant ainsi la collecte de données.

  3. Puis-je exporter des données vers d'autres plateformes que Excel avec Thunderbit ?

    Oui, Thunderbit prend en charge l'exportation de données vers des plateformes comme Google Sheets, Airtable et Notion, offrant une flexibilité dans la gestion des données au-delà d'Excel.

  4. Pourquoi les données de la requête web ne se rafraîchissent-elles pas automatiquement ?

    Assurez-vous que l'option "Actualiser tout" est activée sous l'onglet Données dans Excel. Vous pouvez configurer un intervalle de rafraîchissement automatique en sélectionnant "Propriétés de connexion" sous Requêtes et connexions.

  5. Pourquoi le code VBA ne fonctionne-t-il pas correctement ?

    Assurez-vous d'avoir activé l'onglet Développeur et sélectionné les références requises (Microsoft Internet Controls et HTML Object Library).

En savoir plus :

Utilisez l'IA pour travailler sans effort.
Shuai Guan
Shuai Guan
Co-founder/CEO @ Thunderbit. Passionate about cross section of AI and Automation. He's a big advocate of automation and loves making it more accessible to everyone. Beyond tech, he channels his creativity through a passion for photography, capturing stories one picture at a time.
Topics
ExcelExtracteur Web IA
Extract your data without code
Easily transfer data to Google Sheets, Airtable, or Notion
Chrome Store Rating
PRODUCT HUNT#1 Product of the Week