Product Info Scraper của Thunderbit giúp bạn biến những trang thương mại điện tử “lộn xộn” thành bộ dữ liệu sản phẩm gọn gàng, có cấu trúc nhờ AI. Bạn có thể lấy tên sản phẩm, giá, đánh giá, SKU, hình ảnh… từ cả trang danh sách lẫn trang chi tiết, sau đó xuất sang Excel, Google Sheets, Airtable hoặc Notion. Với AI Suggest Fields, hỗ trợ phân trang và subpage scraping để làm giàu dữ liệu, bạn có thể chuyển từ bước duyệt web sang phân tích chỉ trong vài phút.
🛍️ Product Info Scraper là gì
Product Info Scraper là một AI Web Scraper được thiết kế cho nghiên cứu và vận hành e-commerce. Với , bạn chỉ cần mở trang danh sách sản phẩm hoặc trang kết quả tìm kiếm, bấm AI Suggest Fields, rồi bấm Scrape để lấy dữ liệu dạng bảng.
Công cụ này phù hợp với các nhu cầu thực tế như theo dõi đối thủ, xây dựng catalog và giám sát giá trên các sàn như , và . AI của Thunderbit “đọc” bố cục trang và xuất ra bảng dữ liệu để bạn có thể xuất ngay lập tức.


🧾 Bạn có thể thu thập gì với Product Info Scraper
Bạn có thể thu thập dữ liệu từ cả trang danh sách (kết quả tìm kiếm, trang danh mục) và trang chi tiết sản phẩm (PDP). Thunderbit cũng hỗ trợ pagination scraping (bấm chuyển trang và cuộn vô hạn) và subpage scraping để mở từng sản phẩm, bổ sung thêm thuộc tính chuyên sâu cho bộ dữ liệu.
🟠 Trích xuất dữ liệu sản phẩm trên Amazon
Dùng quy trình này để lấy dữ liệu sản phẩm có cấu trúc từ trang kết quả tìm kiếm Amazon, ví dụ:
Cách này hữu ích khi bạn cần nhanh một dataset để nghiên cứu cạnh tranh, nghiên cứu từ khóa, phân tích danh mục hàng, hoặc lập kế hoạch quảng cáo.

Các bước:
- Cài và đăng ký tài khoản.
- Mở trang cần thu thập, ví dụ: .
- Bấm AI Suggest Columns để AI gợi ý tên cột và kiểu dữ liệu.
- Bấm Scrape để chạy thu thập, sau đó tải xuống hoặc xuất dữ liệu.
Tên cột
| Cột | Mô tả |
|---|---|
| 🏷️ Tên sản phẩm | Tên sản phẩm hiển thị trên thẻ listing. |
| 🌐 URL sản phẩm | Liên kết trực tiếp đến trang chi tiết sản phẩm. |
| 💲 Giá | Giá đang được niêm yết (nếu có). |
| 🧾 Giá gốc / Giảm giá | Giá gạch ngang, coupon hoặc thông tin giảm giá (nếu có). |
| ⭐ Điểm đánh giá | Điểm sao trung bình hiển thị trên listing. |
| 🧑🤝🧑 Số lượng đánh giá | Số review hiển thị cho sản phẩm. |
| 🚚 Vận chuyển / Giao hàng | Dự kiến giao hàng, huy hiệu Prime hoặc ghi chú vận chuyển (nếu thấy). |
| 🏪 Người bán / Thương hiệu | Tên thương hiệu hoặc thông tin người bán trên thẻ (tùy bố cục). |
| 🖼️ URL hình ảnh | Liên kết ảnh chính để làm catalog hoặc báo cáo. |
| 🆔 ASIN | Mã định danh sản phẩm của Amazon (nếu nhận diện được từ trang hoặc trang con). |
🟦 Thu thập dữ liệu listing trên eBay để phân tích thị trường
Dùng quy trình này để tạo dataset từ kết quả tìm kiếm/danh mục trên eBay và phân tích giá, tình trạng hàng, tín hiệu người bán và tốc độ listing. Thường được dùng cho nghiên cứu hàng resale, benchmark đối thủ và lập bản đồ thị trường.

Các bước:
- Cài và đăng ký tài khoản.
- Mở trang cần thu thập, ví dụ: trang kết quả tìm kiếm eBay (theo danh mục hoặc từ khóa).
- Bấm AI Suggest Columns để AI gợi ý tên cột và kiểu dữ liệu.
- Bấm Scrape để chạy thu thập, sau đó tải xuống hoặc xuất dữ liệu.
Tên cột
| Cột | Mô tả |
|---|---|
| 🏷️ Tiêu đề listing | Tiêu đề của listing trên eBay. |
| 🌐 URL listing | Liên kết đến trang chi tiết listing. |
| 💲 Giá | Giá hiện tại của listing. |
| 📦 Phí vận chuyển | Phí ship hoặc nhãn vận chuyển (ví dụ: free shipping). |
| 🏷️ Tình trạng | Nhãn tình trạng như New, Used, Pre-owned, Refurbished. |
| 🧑💼 Tên người bán | Tên shop/người bán (nếu hiển thị ở trang kết quả hoặc trang con). |
| ⭐ Đánh giá người bán | Điểm/phần trăm phản hồi của người bán (nếu có). |
| ⏳ Thời gian còn lại | Thời gian còn lại của phiên đấu giá (với listing dạng auction). |
| 🛒 Buy It Now | Listing là Buy It Now hay đấu giá (nếu nhận diện được). |
| 🖼️ URL hình ảnh | Ảnh chính của listing để phân tích hoặc làm catalog. |
🟡 Giám sát sản phẩm trên Walmart
Dùng quy trình này để theo dõi listing theo thời gian: biến động giá, tình trạng còn hàng và thay đổi danh mục. Bạn có thể thu thập từ trang danh sách, sau đó dùng Scheduled Scraper để chạy lại theo lịch nhằm giám sát liên tục.
Ví dụ trang dạng listing để thu thập:

Các bước:
- Cài và đăng ký tài khoản.
- Mở trang cần thu thập, ví dụ: trang danh mục Walmart, trang kết quả tìm kiếm hoặc trang listing marketplace.
- Bấm AI Suggest Columns để AI gợi ý tên cột và kiểu dữ liệu.
- Bấm Scrape để chạy thu thập, sau đó tải xuống hoặc xuất dữ liệu.
Tên cột
| Cột | Mô tả |
|---|---|
| 🏷️ Tên sản phẩm | Tiêu đề sản phẩm hiển thị trên trang listing. |
| 🌐 URL sản phẩm | Liên kết đến trang chi tiết để làm giàu dữ liệu. |
| 💲 Giá hiện tại | Giá đang hiển thị. |
| 🧾 Giá trước đó / Rollback | Giá cũ, rollback hoặc nhãn khuyến mãi (nếu có). |
| 📦 Tình trạng hàng | Còn hàng/hết hàng hoặc thông tin giao/nhận (delivery/pickup). |
| ⭐ Điểm đánh giá | Điểm sao hiển thị trên listing. |
| 🧑🤝🧑 Số lượng đánh giá | Số review hiển thị. |
| 🏪 Người bán | Người bán/merchant trên marketplace (nếu thấy). |
| 🆔 SKU / Item ID | Mã định danh sản phẩm Walmart (thường lấy được qua trang con). |
| 🖼️ URL hình ảnh | Liên kết ảnh chính của sản phẩm. |
📈 Vì sao nên dùng Product Info Scraper
Khi dữ liệu sản phẩm nằm rải rác trên nhiều sàn, việc copy/paste thủ công vừa chậm vừa dễ lệch định dạng. Với AI Web Scraper của Thunderbit (https://thunderbit.com/), bạn có thể chuẩn hóa dữ liệu về một bảng duy nhất và cập nhật thường xuyên.
Những lý do phổ biến để thu thập thông tin sản phẩm:
- Đội vận hành e-commerce: Theo dõi giá, khuyến mãi và tình trạng hàng của đối thủ trên Amazon/eBay/Walmart, rồi xuất sang để báo cáo hằng tuần.
- Đội sales: Tạo danh sách lead theo người bán/thương hiệu và làm giàu bằng subpage scraping để lấy thêm thông tin cửa hàng.
- Đội marketing: Thu thập tiêu đề, hình ảnh, số lượng review để định vị sản phẩm, viết brief sáng tạo và xây chiến lược từ khóa.
- Nhà phân tích & nghiên cứu: Tạo dataset để lập bản đồ thị trường, phân tích phân bố giá và so sánh danh mục.
- Bất động sản và các ngành khác: Áp dụng cùng cách tiếp cận AI để thu thập các dạng listing có cấu trúc/bán cấu trúc, không chỉ sản phẩm.
Thunderbit đặc biệt hữu ích khi:
- Bố cục trang thay đổi thường xuyên (AI thích nghi mà bạn không phải dựng lại selector)
- Bạn cần pagination scraping qua nhiều trang kết quả
- Bạn muốn subpage scraping để bổ sung chi tiết từ trang sản phẩm cho từng dòng
🧩 Cách dùng Product Info Scraper trên Chrome Extension
- Cài Thunderbit Chrome Extension: Tải từ và tạo tài khoản trên .
- Mở trang Amazon, eBay hoặc Walmart: Vào trang listing/tìm kiếm như hoặc trang kết quả eBay như .
- Kích hoạt trình thu thập dùng AI: Bấm AI Suggest Columns để tạo các trường, rồi chỉnh tên cột và kiểu dữ liệu nếu cần (Text, Number, Date, URL, Image, Email, Phone).
- Thu thập, làm giàu và xuất dữ liệu: Bấm Scrape. Nếu cần thuộc tính sâu hơn, dùng Scrape Subpages để mở từng URL sản phẩm và thêm cột mới. Xuất sang Excel, Google Sheets, Airtable hoặc Notion.
Gợi ý bài đọc nếu bạn muốn xây quy trình lặp lại ổn định:
💳 Giá cho Product Info Scraper
Thunderbit dùng hệ thống credit đơn giản:
- 1 credit = 1 dòng dữ liệu đầu ra trong bảng kết quả
- Xuất dữ liệu (CSV/JSON, Excel, Google Sheets, Airtable, Notion) là miễn phí
Bạn có thể bắt đầu mà không cần gói trả phí:
- Gói Free gồm 6 trang mỗi tháng
- Free trial cho phép thu thập 10 trang miễn phí, phù hợp để thử quy trình Amazon/eBay/Walmart trước khi quyết định
Nếu cần thu thập thường xuyên (ví dụ kiểm tra đối thủ hằng tuần hoặc theo dõi giá hằng ngày), bạn có thể chọn gói trả phí. Gói năm tiết kiệm hơn vì có chiết khấu so với trả theo tháng.
Bạn có thể xem các lựa chọn hiện tại tại . Nhìn chung:
- Starter phù hợp cho nhu cầu nhẹ và catalog nhỏ
- Các gói Pro phù hợp cho team thu thập thường xuyên, cần pagination scraping, làm giàu bằng trang con và giám sát theo lịch
Nếu bạn muốn theo dõi giá, hãy cân nhắc kết hợp Product Info Scraper với Scheduled Scraper để dataset tự làm mới theo lịch bạn mô tả bằng tiếng Anh tự nhiên.
❓ Câu hỏi thường gặp
-
Product Info Scraper chạy bằng AI là gì?
Đây là một quy trình dựa trên AI trong giúp trích xuất dữ liệu sản phẩm có cấu trúc từ trang danh sách và trang chi tiết. Bạn bấm AI Suggest Fields để tạo cột, rồi bấm Scrape để nhận bảng sạch và có thể xuất ngay. -
Thunderbit là gì?
Thunderbit là một AI Web Scraper dạng Chrome Extension giúp bạn thu thập dữ liệu từ website, PDF và hình ảnh, sau đó xuất sang Excel, Google Sheets, Airtable và Notion. Công cụ được xây cho các quy trình doanh nghiệp như tạo lead, vận hành e-commerce và nghiên cứu thị trường, với các tính năng như subpage scraping, pagination scraping và scheduled scraping. -
Tôi có thể thu thập cả trang danh sách và trang chi tiết sản phẩm không?
Có. Bạn có thể thu thập trang danh sách trước để lấy danh sách sản phẩm, sau đó dùng Scrape Subpages để truy cập từng URL và bổ sung các chi tiết như SKU/ASIN, biến thể, thông số hoặc thông tin người bán. Cách làm 2 bước này là một trong những cách nhanh nhất để tạo dataset chất lượng cao. -
Pagination scraping hoạt động thế nào với Amazon, eBay hoặc Walmart?
Thunderbit xử lý được các kiểu phân trang phổ biến, gồm nút sang trang và cuộn vô hạn. Sau khi thiết lập cột một lần, bạn có thể thu thập nhiều trang trong một lượt chạy—rất hữu ích khi cần lấy hàng trăm sản phẩm theo danh mục hoặc từ khóa. -
Những trường dữ liệu nào thường dùng nhất cho nghiên cứu sản phẩm?
Phần lớn team bắt đầu với tên sản phẩm, giá, điểm đánh giá, số lượng review, URL sản phẩm và URL hình ảnh. Nếu phân tích sâu hơn, hãy thêm người bán/thương hiệu, thông tin vận chuyển/giao hàng, tình trạng hàng và các mã định danh như ASIN/SKU—thường lấy qua subpage scraping. -
Tôi có thể xuất sang Google Sheets, Airtable hoặc Notion không?
Có. Thunderbit hỗ trợ xuất miễn phí sang Excel, Google Sheets, Airtable và Notion, đồng thời cho tải CSV và JSON. Nếu bạn xuất trường hình ảnh sang Airtable hoặc Notion, Thunderbit có thể tải ảnh lên thư viện ảnh của workspace để bạn xem trực tiếp trong database. -
Khác nhau giữa Cloud Scraping và Browser Scraping là gì?
Cloud Scraping chạy trên hạ tầng cloud của Thunderbit và thường nhanh hơn với các trang công khai, có thể xử lý tới 50 trang mỗi lần. Browser Scraping chạy trong phiên Chrome của bạn, phù hợp khi website yêu cầu đăng nhập hoặc khi bạn cần thu thập nội dung chỉ hiển thị trong chế độ đã xác thực. -
Chi phí để thu thập dữ liệu sản phẩm là bao nhiêu?
Chi phí tính theo credit, trong đó 1 credit tương ứng 1 dòng dữ liệu đầu ra. Nếu bạn thu thập 200 sản phẩm vào bảng, bạn sẽ dùng 200 credit. Bạn có thể thử bằng gói Free (6 trang/tháng) hoặc free trial (10 trang), rồi chọn gói phù hợp trên theo sản lượng. -
Thu thập dữ liệu trang sản phẩm Amazon, eBay hoặc Walmart có ổn không?
Quy định thu thập phụ thuộc vào điều khoản của từng website và luật áp dụng, vì vậy bạn nên luôn tuân thủ. Trên thực tế, nhiều team thu thập thông tin sản phẩm công khai để phân tích nội bộ, theo dõi giá và nghiên cứu catalog, đồng thời tránh dữ liệu cá nhân và tôn trọng giới hạn tốc độ cũng như yêu cầu tuân thủ.
📚 Tìm hiểu thêm
- Bắt đầu với
- Xem các hướng dẫn trên
- Kiến thức nền tảng:
- Tối ưu crawl danh sách:
- Quy trình cho Amazon:
- Quy trình với bảng tính:
- So sánh công cụ:
- Xem video hướng dẫn trên
