使用 (一款可读取网页并自动整理成清晰表格的 AI 网页爬虫),从 Welcome to the Jungle 的职位列表和公司主页中提取结构化数据。你只需点击 AI Suggest Fields 让 AI 推荐最合适的列,再点击 Scrape 开始采集结果。你还可以启用 子页面抓取(subpage scraping),自动访问每个职位或公司详情页,为数据集补充更完整的信息。
🧭 什么是 Welcome to the Jungle 爬虫
Welcome to the Jungle 爬虫 是 Thunderbit 的一套 工作流,专为从 抓取数据而设计,全程无需写代码。打开你想采集的页面(例如 或 ),点击 AI Suggest Fields,Thunderbit 会自动生成结构化的字段方案(列名 + 数据类型)。随后点击 Scrape 抓取行数据,并导出到 Excel、Google Sheets、Airtable 或 Notion。

🧰 Welcome to the Jungle 可以抓取哪些内容
Welcome to the Jungle 汇集了大量招聘与雇主品牌相关信息。借助 Thunderbit,你可以先抓取列表页(快速获取大量行),再通过 子页面抓取(Subpage Scraping) 深入每条职位或公司主页,补齐更细的字段。
抓取 Welcome to the Jungle 的职位列表
从 抓取岗位信息,可用于搭建可检索的职位数据库、追踪招聘趋势,或监控特定关键词、地区与公司。

操作步骤:
- 安装 并注册账号。
- 打开目标页面,例如:。
- 点击 AI Suggest Fields,生成推荐的列名与数据类型。
- 点击 Scrape 运行爬虫,然后导出到 Excel、Google Sheets、Airtable 或 Notion。
字段示例
| 列名 | 说明 |
|---|---|
| 🧑💻 职位名称 | 列表卡片上展示的岗位名称(如 Product Manager、Sales Executive)。 |
| 🏢 公司名称 | 该职位对应的雇主名称。 |
| 🌍 工作地点 | 列表中展示的城市/地区/国家或远程标识。 |
| 🧭 办公方式 | 线下、混合或远程(若列表提供)。 |
| 🕒 雇佣类型 | 全职、兼职、实习、合同制等(若提供)。 |
| 💰 薪资范围 | 列表中展示的薪资信息,或通过子页面抓取从详情页提取。 |
| 🗓️ 发布时间 | 发布日期或相对时间(如“3 days ago”),若可获取。 |
| 🏷️ 标签 / 关键词 | 技术栈、部门、级别或其他在列表中展示的标签。 |
| 🔗 职位链接 | 指向职位详情页的直达链接(便于子页面抓取)。 |
| 🖼️ 公司 Logo | Logo 图片链接(便于在 Airtable/Notion 中做信息补全)。 |
小贴士: 抓取完列表表格后,在 Thunderbit 中点击 Scrape Subpages,让工具逐个访问 职位链接,自动补充岗位职责、任职要求、福利、以及更完整的薪酬信息等字段。
抓取 Welcome to the Jungle 的公司主页
从 抓取雇主信息,可用于搭建线索名单、分析雇主品牌表现,或追踪哪些公司正在积极招聘。

操作步骤:
- 安装 并注册账号。
- 打开目标页面,例如:。
- 点击 AI Suggest Fields,生成推荐的列名与数据类型。
- 点击 Scrape 运行爬虫,然后导出到 Excel、Google Sheets、Airtable 或 Notion。
字段示例
| 列名 | 说明 |
|---|---|
| 🏢 公司名称 | 目录中展示的公司名称。 |
| 🔗 公司链接 | 公司主页链接(非常适合用于子页面抓取)。 |
| 🏷️ 行业 | 行业/类别标签(如 SaaS、FinTech、Marketplace),若可获取。 |
| 📍 总部 / 所在地 | 公司卡片或主页中展示的主要地点。 |
| 👥 公司规模 | 员工数量区间(若可获取)。 |
| 🧾 公司简介 | 目录中的简短介绍,或通过子页面抓取获取完整 About 内容。 |
| 💼 在招岗位数 | 当前开放职位数量(若页面展示)。 |
| 🌐 官网 | 公司官方网站链接(通常在公司主页中可找到)。 |
| 🧑🤝🧑 社交链接 | LinkedIn/Twitter/GitHub 等链接(若主页提供)。 |
| 🖼️ 公司 Logo | Logo 图片链接,便于 CRM 或数据库信息补全。 |
小贴士: 使用 Subpage Scraping 可进一步抓取使命愿景、福利、技术栈、融资信息(如页面包含)、以及在招岗位入口等更深层字段。
🎯 为什么要用 Welcome to the Jungle 工具
抓取 Welcome to the Jungle 能把庞大且动态变化的招聘市场,转化为可筛选、可分析、可落地执行的数据集。
常见用途包括:
- 招聘与人才团队: 按岗位、地点、资历与公司类型建立精准人才管道;持续追踪新发布职位,维护结构化职位源。
- 销售与合作拓展: 识别增长迅速的公司与招聘信号,并用公司链接、官网与社交账号等信息完善线索列表。
- 市场研究与分析: 按地区、行业与关键词监控招聘趋势,制作每周快照用于汇报。
- 求职者与职业教练: 将机会整理到 Google Sheets 或 Notion 的个人看板中,再按薪资、远程与公司规模等维度优先级排序。
- 电商/运营团队招聘: 追踪竞品招聘动向,推断其战略变化(新市场、新产品线、扩张等)。
Thunderbit 面向业务场景设计:几分钟内即可完成抓取、结构化与导出;并可借助 分页支持 与 定时爬虫(Scheduled Scraper) 持续保持数据更新。
🧩 如何使用 Welcome to the Jungle Chrome 扩展
- 安装 Thunderbit Chrome 扩展:在 获取,并在 创建账号。
- 打开 Welcome to the Jungle 页面:根据采集目标进入 或 。
- 启用 AI 驱动的爬取流程:点击 AI Suggest Fields 生成列,按需调整字段名或数据类型,然后点击 Scrape。
可选: 使用 Scrape Subpages 逐个访问职位/公司详情页,为表格补充更深层信息。
如果你刚开始接触 AI 抓取,这些指南会很有帮助:
💳 Welcome to the Jungle 爬虫的定价
Thunderbit 的 AI 驱动抓取 从免费档即可使用,并可根据所需行数灵活升级。
定价机制如下:
- AI Suggest Fields 属于核心 体验的一部分。
- Thunderbit 采用积分制:1 积分 = 结果表中的 1 行输出。
- 免费档:每月可抓取 6 个页面(免费档按页面计量)。
- 免费试用:可 免费抓取 10 个页面,适合在升级前测试“职位列表 + 子页面补全”的效果。
付费方案(按月/按年)面向不同数据量需求。如果你需要长期、规律性抓取(如每周职位监控、持续搭建线索库),通常 年付更划算,因为包含折扣。
最新方案请查看 。
❓ 常见问题(FAQ)
-
什么是 AI 驱动的 Welcome to the Jungle 爬虫?
这是 Thunderbit 中的一套工作流,用于从 Welcome to the Jungle 的职位列表与公司目录等页面提取结构化数据。它会用 AI 自动识别页面字段、生成表格并采集行数据,随后可导出到 Excel、Google Sheets、Airtable 或 Notion。 -
Thunderbit 是什么?
Thunderbit 是一款 AI 网页爬虫 Chrome 扩展,可从网站、PDF 与图片中采集信息并整理成结构化数据集。它面向业务用户,强调快速上手、稳定提取与便捷导出,适配日常工作流。 -
列表页和详情页(子页面)都能抓取吗?
可以。你可以先抓取列表页(职位或公司),再用 子页面抓取(Subpage Scraping) 逐个访问职位/公司主页链接并新增更多列。当薪资、福利或公司官网等关键字段只在详情页出现时,这种方式尤其有用。 -
我能把 Welcome to the Jungle 的哪些数据导出到 Google Sheets 或 Excel?
你可以导出你定义的任意列,例如职位名称、公司、地点、标签、职位链接等。Thunderbit 支持导出 Excel/CSV/JSON,并可直接导出到 Google Sheets、Airtable 与 Notion,非常适合做追踪表与内部数据库。 -
Thunderbit 如何处理职位列表的分页与无限滚动?
Thunderbit 支持 分页抓取,包括“点击下一页”的分页与无限滚动加载。如果职位页在下拉时持续加载更多结果,你可以持续采集行数据,直到达到目标数量。 -
在 Welcome to the Jungle 上使用 Thunderbit 需要会写代码吗?
不需要。核心流程就是:打开页面 → 点击 AI Suggest Fields → 点击 Scrape。如果你想更精细控制,也可以重命名列、调整数据类型(文本、URL、日期等)并添加字段说明,但依然是零代码。 -
如果 Welcome to the Jungle 改版,爬虫还能用吗?
基于 AI 的提取通常比依赖固定选择器的方式更抗变动,因为它每次运行都会重新理解页面结构。即使网站布局变化,你也可以重新运行 AI Suggest Fields 来生成匹配新页面的列,而不必从零重建爬虫。 -
抓取 Welcome to the Jungle 用云端抓取还是浏览器抓取更好?
如果页面公开且无需登录,通常 云端抓取(Cloud Scraping) 更快;如果内容依赖你的会话(例如个性化结果或登录后视图),浏览器抓取(Browser Scraping) 更合适,因为它在你的 Chrome 环境中运行。 -
如何让职位数据集自动保持更新?
使用 Thunderbit 的 定时爬虫(Scheduled Scraper),用自然语言描述运行频率,让它按计划重复抓取相同的职位或公司链接。这非常适合每周招聘报告、监控特定岗位,或长期追踪新进入市场的公司。
📚 了解更多
- 从 开始,并安装
- 阅读:
- 阅读:
- 阅读:
- 在 浏览更多教程,并在 观看视频
