ネット上のいろんなサイトから商品情報や価格データを集めて、Excelにまとめて管理したいと思ったこと、ありませんか?手作業でコピペして整理するのは、正直かなり面倒だし、ミスも起こりがちですよね。今回は、初心者でも上級者でも使える、ウェブサイトのデータを直接Excelに取り込むための、手軽で効率的な方法をまとめてご紹介します。
ノーコードのウェブスクレイピングツールを活用しよう
プログラミングが苦手な人には、のようなノーコード型のウェブスクレイピングツールがぴったりです。こういったツールなら、難しい知識がなくても、画面上で欲しいデータを選ぶだけで、誰でも簡単にウェブサイトからExcelへデータを取り込めます。
Thunderbitのは、従来のような細かい設定やセレクター指定をしなくても、AIがページの内容や構造を理解して、必要なデータを自動で抽出してくれます。多くのツールはドラッグ&ドロップやテンプレートのカスタマイズが必要ですが、Thunderbitなら直感的な操作だけでOKです。
しかも、Excelだけじゃなく、Google SheetsやAirtable、Notionなどにもワンクリックでデータをエクスポートできるのも魅力です。
Thunderbitで商品データを集める3ステップ
ステップ1:ウェブサイトを開いてThunderbitの「AIウェブスクレイパー」を選択
Thunderbitをブラウザにインストールしたら、データを集めたいウェブサイトを開き、Thunderbitのサイドバーから「AIウェブスクレイパー」をクリックします。
ステップ2:AIの提案をもとに抽出したいデータ項目をカスタマイズ
「AIでカラムを提案」機能を使えば、スクレイパーテンプレートが自動で作成されます。必要に応じてAIのサポートを受けながらテンプレートを編集し、保存先もテーブル形式でコピーしたり、他のサービスに保存したり選べます。
ステップ3:抽出したデータをExcelにエクスポート
データ項目を確認したら、スクレイパーを実行。抽出したデータはコピーやダウンロードができるので、Excelにそのまま貼り付けるだけでOKです。
AIの力でウェブスクレイピングを体験しよう
実際にクリックして、ワークフローを体験しながら操作できます。
ExcelのWebクエリ機能を使う
Excelには「Webクエリ」という機能があり、ウェブページから直接データを取り込むことができます。特に、表形式で整理されたデータを定期的に更新したいときに便利です。ただし、この機能はWindows版Excel限定なので注意してください。
Excel Webクエリで商品データを集める手順
- Excelを開く:新しいワークブックを作成し、データタブを選びます。
- 「Webから」を選択:「外部データの取り込み」から「Webから」をクリック。
- URLを入力:データを取り込みたいウェブサイトのアドレスを入力してOKを押します。
- データを選択:ページ内のテーブルが表示されるので、必要なテーブルを選んで「読み込み」をクリック。
- 出力を確認:データの取り込み先を指定し、内容が希望通りかチェックします。
Thunderbitなら、データ抽出だけじゃなく、AIによる要約や自動入力も可能です。
Excel VBAでカスタムスクレイピング
プログラミングに慣れている人なら、VBA(Visual Basic for Applications)を使って、より細かいデータ抽出もできます。VBAはMicrosoft Officeに標準搭載されている言語で、Excelの自動化にもよく使われています。こちらもWindows版Excel限定の機能です。
Excel VBAで商品データを集める手順
- 開発タブを有効化:
- Excelを開き、「Excel」>「環境設定」>「表示」をクリック。
- 下の方にある「開発」オプションにチェックを入れます。
- 参照設定を追加:
- 開発タブから「Visual Basic」を開きます。
- 「ツール」>「参照設定」で以下をチェック:
- Microsoft Internet Controls
- Microsoft HTML Object Library
- データ抽出用のVBAコードを書く
- 「挿入」>「標準モジュール」を選択。
- エディタにVBAコードを記述します。
以下はAmazonの商品ページから商品名・価格・評価を抽出する基本例です:
Sub ScrapeAmazonPage()
Dim IE As Object
Dim html As Object
Dim productTitle As String
Dim productPrice As String
Dim productRating As String
' Internet Explorerオブジェクトを作成
Set IE = CreateObject("InternetExplorer.Application")
' Amazonの商品ページに移動
IE.Visible = True
IE.navigate "Put Your URL Here"
' ページの読み込みを待つ
Do While IE.Busy Or IE.readyState <> 4
DoEvents
Loop
' HTMLドキュメントを取得
Set html = IE.document
' 商品名を抽出
On Error Resume Next
productTitle = html.getElementById("productTitle").innerText
On Error GoTo 0
' 価格を抽出
On Error Resume Next
productPrice = html.getElementsByClassName("a-price-whole")(0).innerText
On Error GoTo 0
' 評価を抽出
On Error Resume Next
productRating = html.getElementsByClassName("a-icon-alt")(0).innerText
On Error GoTo 0
' 抽出データをExcelに出力
With ThisWorkbook.Sheets(1)
.Cells(1, 1).Value = "Product Title"
.Cells(1, 2).Value = "Price"
.Cells(1, 3).Value = "Rating"
.Cells(2, 1).Value = productTitle
.Cells(2, 2).Value = productPrice
.Cells(2, 3).Value = productRating
End With
' 後処理
IE.Quit
Set IE = Nothing
Set html = Nothing
End Sub
- VBAスクリプトを実行・テスト
- Visual Basic Editorでスクリプトを実行するか、Excelシート上のボタンに割り当てて動作を確認します。
- データが正しく出力されているかExcelでチェックしましょう。
AIにデータ抽出を任せれば、面倒なコーディングは不要。大切な業務に集中できます。の力を体感してください!
よくある質問(FAQ)
-
ウェブスクレイピングって何?どんなメリットがあるの?
ウェブスクレイピングは、ウェブサイトからデータを集めて、表などの形で整理する技術です。いろんなサイトから商品価格などをまとめて比較・分析したいときにとても便利です。
-
Thunderbitはどんな仕組みで動くの?
Thunderbitは、コーディング不要でデータ抽出ができるツールです。画面上で欲しい項目を選ぶだけで、AIが自動でデータを集めてくれます。
-
ThunderbitでExcel以外にもデータをエクスポートできる?
はい、ThunderbitはGoogle SheetsやAirtable、Notionなど、いろんなサービスへのエクスポートに対応しています。
-
Webクエリのデータが自動で更新されないのはなぜ?
Excelのデータタブで「すべて更新」が有効になっているか確認してください。クエリと接続の「接続プロパティ」から自動更新の間隔も設定できます。
-
VBAコードがうまく動かない場合は?
開発タブが有効になっているか、必要な参照設定(Microsoft Internet ControlsとHTML Object Library)が選択されているか確認しましょう。
参考リンク: