大概是在第十五次,某个无头 Chrome 实例把竞争对手的定价页返回成一块空白白色矩形的时候,我决定不再假装自己那套自托管截图方案“已经够用了”。其实远远不够。更何况,从我这几个月一直在看的论坛帖子来看,我并不是唯一有这种感觉的人。
到了 2026 年,要稳定、大规模地抓取截图,本质上已经是浏览器基础设施问题,只是被包装成了一个简单的 API 调用。现在的网页会加载,还会有懒加载图片、Cookie 同意弹窗、反爬挑战,以及可能在 load 事件触发几秒后才完成的单页应用渲染。一个天真的“输入 URL,输出 PNG”调用,在这些场景下几乎都会失效。过去几周里,我拿同一组棘手 URL 测试了 10 款截图工具——SaaS API、自托管库,还有一款根本不走截图路线的工具。本文就是我得到的一切:真实的延迟观察、免费额度的坑、大规模成本模型,以及什么时候你其实根本不需要截图 API 的坦诚结论。

什么是截图 API?为什么它很重要?
截图 API 是一种托管服务(或自托管库),它接受一个 URL,然后返回该网页在真实浏览器中渲染出来的图像——PNG、JPEG、WebP 或 PDF。你发起请求,服务会启动无头 Chrome(或 Chromium,或 Firefox),加载页面,等待 JavaScript 执行,必要时滚动页面,然后截取视口或整页。
很多搜索“最佳截图 API”的人,真正需要的其实是页面上的信息,而不是一张图片。如果你在监控竞品价格、从目录里整理潜在客户名单、归档房源信息,或者跟踪产品目录,截图会迫使你再走一遍 OCR 或视觉模型流程,把数据从图片里重新提取出来。这样既贵,又慢,还容易出错。
Thunderbit 的本质上是一款由 AI 驱动的网页爬虫和数据提取工具。它不会返回页面的 PNG,而是直接返回页面上的结构化数据。
只需输入 URL 和 JSON schema,就能直接返回结构化字段——价格、名称、邮箱、图片、地址、评分等。 也能在两步内完成同样的事:打开扩展,点击“AI 推荐字段”,然后导出到 Excel、Google Sheets、Airtable 或 Notion。
常见用例包括:
- OG/社交卡片生成: 动态创建用于链接预览的 Open Graph 图片。 展示了这种模式有多普遍。
- 视觉回归测试: 对比不同部署版本的截图,捕捉界面 bug。 显示,34.8% 的大型组织已经在视觉回归中使用 AI。
- 合规归档: 保存带时间戳的页面状态视觉证据,以满足法律或监管需求。
- 竞品监控: 持续记录定价页、产品列表页或落地页的变化。
- 目录缩略图: 为链接聚合页、仪表盘或内部工具生成预览图。
为什么不直接自己跑浏览器?因为一旦上规模,维护无头 Chrome 集群意味着你得处理 Docker 字体配置、Lambda 冷启动、Chromium 版本更新、代理池、重试队列,以及为懒加载内容编写滚动脚本。,并且还在以 18.5% 的 CAGR 增长——而截图采集正是这类基础设施的核心组成部分。
我是如何测试这 10 款截图 API 的
我找不到任何一篇现有的对比文章,会真的公布跨多个 API 的响应时间基准或边缘场景通过率。大多数文章只是列功能和价格。
我想做得更有用一些。

我用一组具有代表性的页面类型测试了每款工具:
- 一个简单的静态 HTML 页面(基线)
- 一个 JavaScript 很重的 SPA(带客户端数据获取的 React 应用)
- 一个带显眼 GDPR Cookie 同意横幅的页面
- 一个懒加载图片库(折叠线下方的图片)
- 一个受反爬保护的页面(类似 Cloudflare 挑战)
对于每个页面,我测量了:
- 延迟: 从 API 调用到图片返回的时间(p50 估计)
- 硬成功率: API 是否至少返回了一张可解码的图片
- 视觉成功率: 图片里是否真的包含页面内容——而不是空白屏幕、骨架屏、验证码墙或 Cookie 遮罩
- Cookie 横幅处理: 是否无需手动配置就能屏蔽或关闭横幅
有几点说明。我是在单一区域、使用默认或推荐参数、在较短时间窗口内完成测试的。这只能说明趋势,不是严格的统计基准。不过它比竞品文章提供的内容多得多,而且模式很清晰。
基准测试摘要
| API | 静态页延迟 | SPA 是否渲染 | Cookie 横幅处理 | 懒加载图片是否加载 | 反爬是否通过 |
|---|---|---|---|---|---|
| Thunderbit(Extract) | 不适用(返回数据) | ✅(提取数据) | 不适用 | 不适用 | ✅(API 声称支持) |
| ScreenshotOne | ~1.5 秒 | ✅ | ✅(配合屏蔽参数) | ✅(配合滚动延迟) | ❌(无 CAPTCHA 绕过) |
| Urlbox | ~2 秒 | ✅ | ✅(点击/隐藏选项) | ✅(拼接模式) | 部分支持(Ultra 档) |
| CaptureKit | ~2 秒 | ✅ | ✅(可移除) | ✅ | 部分支持(声称有隐身模式) |
| Scrapingdog | ~2.5 秒 | ✅ | 文档有限 | ✅(基础支持) | 平台级声明 |
| ApiFlash | ~2 秒 | ✅ | ✅(隐藏选项) | ✅(标准) | ❌(较弱) |
| ScreenshotMachine | ~2 秒 | ✅ | 基础 | 基础 | ❌ |
| Screenshotlayer | ~3 秒 | 部分支持(JS 处理较差) | ❌ | 部分支持 | ❌ |
| Puppeteer(自托管) | ~1 秒 | ✅(完全可控) | 手动脚本 | 手动脚本 | 需要手动代理 |
| Playwright(自托管) | ~1 秒 | ✅(完全可控) | 手动脚本 | 手动脚本 | 需要手动代理 |
结论很明确:每个 SaaS API 处理静态页面都没问题。差异主要出现在 SPA、Cookie 横幅,尤其是反爬页面上。自托管工具控制力最强,但工程成本也最高。
什么才算最好的截图 API?(筛选标准)
以下是我重点权衡的标准,以及为什么它们比你想的更重要。
| 标准 | 重要原因 |
|---|---|
| 渲染引擎与 JS 支持 | SPA 和懒加载内容会让很多 API 失效;Cookie 横幅阻挡内容 是常见抱怨 |
| 延迟(出图时间) | 生产流程需要的是可预测的速度,而不只是便宜的平均成本 |
| 每 1K / 10K / 100K 截图成本 | 论坛用户经常抱怨定价不透明;有人甚至想要“10 万次渲染低于 100 美元” |
| 免费额度是否真诚 | 高严重度痛点:多个帖子提到,实际可用量比广告的额度更少 |
| 边缘场景处理 | Cookie 横幅、反爬、地区限制——论坛里有 4 条高严重度提及,而且几乎没有竞品测试覆盖这些 API |
| 输出格式 | PNG、JPEG、WebP、PDF——不同工具支持得很不一致 |
| SaaS 还是自托管 | 论坛里长期争论;只有一篇竞品文章认真讨论了这个问题 |
| 无代码集成 | Zapier、Make、n8n——有些工具会提,但往往只是浅浅一笔 |
| SDK/库支持 | 论坛里有人问:“你们有计划增加 Python 库吗?” |
| 运行稳定性/维护 | 论坛关切:“创始人最终会不会放弃维护 Chrome 的更新?” |
可靠性比价格更重要。这不是我的个人观点,而是我几个月来一直在看开发者论坛时感受到的稳定共识。一个 10% 概率返回空白图像的截图 API,会让你在调试和重试上付出的成本,远远高于每次多收几美分的 API。
1. Thunderbit——当你要的是数据,而不是像素时,最好的截图 API 替代方案
严格来说不是传统意义上的截图 API,这一点我先说明白。我们的团队把 Thunderbit 打造成了一款 AI 驱动的网页爬虫和数据提取工具。它不会返回页面的 PNG,而是直接返回页面上的结构化数据。
很多搜索“最佳截图 API”的人,真正需要的其实是页面上的信息,而不是图片。如果你在监控竞品价格、从目录里整理潜在客户名单、归档房源信息,或者跟踪产品目录,截图会迫使你再走一遍 OCR 或视觉模型流程,把数据从图片里重新提取出来。这样既贵,又慢,还容易出错。
Thunderbit 的 只需输入 URL 和 JSON schema,就能直接返回结构化字段——价格、名称、邮箱、图片、地址、评分等。 也能在两步内完成同样的事:打开扩展,点击“AI 推荐字段”,然后导出到 Excel、Google Sheets、Airtable 或 Notion。
什么时候 Thunderbit 比截图 API 更强
| 场景 | 截图 API | Thunderbit(数据提取) |
|---|---|---|
| 监控竞品价格 | 返回图片,你必须 OCR 或人工阅读 | 直接把结构化价格数据返回到 Google Sheets |
| 归档房源信息 | 静态图片,数据锁在像素里 | 可导出到 Airtable/Notion 的结构化字段(价格、卧室数、地址) |
| 从目录生成潜客名单 | 联系页面的图片 | 提取出姓名、邮箱、电话、职位,按行输出 |
| 生成 OG 社交卡片 | ✅ 最适合——需要真实图片 | ❌ 不合适 |
| 视觉回归测试 | ✅ 最适合——像素对比 | ❌ 不合适 |
坦白说:如果你确实需要一张真实渲染出来的图片,用于社交卡片、QA 或合规归档,那 Thunderbit 不是你的工具。请使用下面列出的截图 API 之一。但如果你的工作流最后只是把数据放进表格或 CRM,那你大概率是在用截图做过度工程。

主要特性
- 通过 Extract API 和 Chrome 扩展进行 AI 驱动的结构化数据提取
- 和数据增强(自动点击进入详情页)
- 定时爬虫,用于持续监控
- 免费导出到 Excel、Google Sheets、Airtable、Notion——导出没有付费墙
- 云端爬取(一次 50 页)或基于浏览器的爬取
定价
- 免费额度: 6 页(扩展);600 API 单位一次性(API)
- 扩展: 约 15 美元/月(按月)或约 9 美元/月(按年),按积分计费(1 积分 = 1 行输出)
- API: Extract = 每页 20 个 API 单位;Distill(Markdown)= 每页 1 个单位。入门计划:16 美元/月(按年),每年 3,000 页 Extract。Pro:40 美元/月(按年),每年 30,000 页 Extract。
完整定价见 。
最适合
销售、电商和运营团队,需要的是页面背后的数据,而不是页面图片。如果你想了解更多,或者看看 Thunderbit 和其他 的对比,我们也写过相关文章。
2. ScreenshotOne——最适合开发者友好默认配置的工具
是我会推荐给大多数开发者的通用截图 API。它拥有我见过最全面的参数集合、扎实的文档,以及可预测的计费方式。
主页显示它拥有,这比大多数竞品更透明。我的测试里,只要参数用对了(block_cookie_banners、wait_for_selector、滚动延迟),它对 SPA 和 Cookie 横幅的处理都很好。启用滚动拼接算法后,带懒加载图片的整页截图也能正常完成。
主要特性
- 输出格式: PNG、JPEG、WebP、GIF、JP2、TIFF、AVIF、HEIF、PDF、HTML、Markdown
- 内置 Cookie/广告/追踪器/聊天组件拦截
- 地理位置: 支持 的 IP 国家路由
- 自定义 JS/CSS 注入、 截图前点击/悬停、深色模式、减少动态效果
- 集成: 支持大多数语言的 SDK、Zapier/Make/Airtable
- 缓存、S3 上传、签名 URL、异步渲染
定价
| 方案 | 价格 | 截图数 | 超额费用 |
|---|---|---|---|
| 免费 | $0 | 每月 100 | — |
| 基础版 | $27/月 | 2,000 | $0.009/额外一张 |
| 增长版 | $79/月 | 10,000 | $0.006/额外一张 |
| 规模版 | $159/月 | 50,000 | $0.004/额外一张 |
HTTP/浏览器/网络错误导致的失败截图配额。视觉问题(页面加载了,但内容看起来不对)则可能会计入,除非人工审核。
优势与局限
- 优势: 在纯截图 API 里功能最全,失败请求政策合理,文档强,无代码集成完善
- 局限: ——反爬页面需要额外的代理/解锁服务
最适合
想要一款文档完善、功能丰富、默认配置合理且定价透明的截图 API 的开发者和团队。
3. Urlbox——最适合复杂页面的像素级高保真截图
是高端选项。如果你需要对 JavaScript 很重的 SPA 进行像素级渲染、视网膜级整页截图,或者企业级合规归档,这就是该重点看的工具。
Urlbox 的 是我找到的、对“为什么整页截图这么难”解释得最好的技术说明。它的拼接模式会滚动页面、触发懒加载元素、冻结粘性页眉、检测 100% 高度背景并进行分段拼接。对于无限滚动页面,除非你明确允许,否则默认会限制分段数量。
主要特性
- 输出格式: PNG、JPEG、WebP、AVIF、SVG、PDF、HTML、MP4、WebM、Markdown
- 视网膜(2x)渲染、 4K/5K、WebGL/GPU 支持
- 自定义 CSS/JS 注入、 深色模式、广告/Cookie 拦截、接受按钮点击、Esc 关闭弹窗
- Webhook 投递、S3 兼容存储、渲染链接(缓存命中,不占配额)
- Certified Archive 和企业 SLA 选项
定价
| 方案 | 价格 | 渲染次数 |
|---|---|---|
| Lo-Fi | $19/月 | 2,000(自有站点、缩略图) |
| Hi-Fi | $49/月 | 5,000 |
| Ultra | $99/月 | 15,000 |
| Business | $498/月 | 基础额度 + 每 1K 次 $3 |
| Enterprise | 起价 $3,000/月 | 定制 |
Urlbox 提供 7 天试用(无需信用卡),但没有永久免费计划。未能返回图片的请求不会收费。缓存的渲染链接不计入配额。
优势与局限
- 优势: 复杂页面输出质量最高,我测试过的整页拼接算法最好,Webhook/S3/归档集成完善,企业功能强
- 局限: 价格更高,没有永久免费额度,反爬处理在 Ultra 及以上会更好,但不是它的核心卖点
最适合
需要高保真视觉输出——合规、QA、企业仪表盘——并且愿意为渲染质量付费的团队。
4. CaptureKit——最适合按设备定制截图
是一款较新的独立开发工具,但实力相当能打。它最突出的功能是内置设备模拟:iPhone 14 Pro Max、Galaxy S23 Ultra、Pixel 7 Pro、iPad、Huawei P60 Pro,以及——都可以直接选预设,不用自己算 viewport。
基础截图配置下来大约花了 3 分钟,包括 playground 测试。playground 允许你在写代码前先试参数,这对快速原型很友好。
主要特性
- 设备模拟:20+ 预设(iOS、Android、平板、桌面)
- 输出格式: PNG、JPEG、WebP、PDF
- Cookie/广告/选择器移除、 资源拦截、隐身模式
- S3 上传、缓存、Zapier/Make 集成
- 附加功能: 页面内容 API、AI 总结 API、HTML 提取
定价
| 方案 | 价格 | 积分 |
|---|---|---|
| 免费 | $0(永久) | 100 积分 |
| Starter | $7/月 | 1,000 |
| Pro | $29/月 | 10,000 |
| Ultimate | $89/月 | 50,000 |
| Custom | 联系销售 | 超过 5 万 |
一张截图 = 1 积分。没有公开的 10 万级自助套餐——需要联系销售。
优势与局限
- 优势: 开箱即用的设备模拟,入门价格低,附加功能实用(内容 API、AI 总结器),playground 体验干净
- 局限: 服务较新,历史积累较短,地理位置选项更少,关于隐身/反爬效果的独立证据有限
最适合
需要特定设备截图、希望快速上手且价格友好的独立开发者和小团队。
5. Scrapingdog——最适合高流量低预算截图
把截图 API 打包进了更大的网页爬取平台里。截图功能每次消耗 5 个积分,而 Scrapingdog 的基础设施包括和无头 Chrome 渲染。
可视化定制选项比 ScreenshotOne 或 Urlbox 少很多——在公开截图文档里,你找不到视网膜模式、自定义 CSS 注入或拼接算法。但在大规模下,它的单次截图成本很难被打败。
主要特性
- 通过无头 Chrome 实现整页和视口截图
- 作为更大爬虫平台的一部分,支持代理轮换和指纹伪装
- 支持并发请求(随套餐等级扩展)
- 失败请求(重试后超时)返回 410,并且
定价
| 方案 | 价格 | 积分 | 截图等价 |
|---|---|---|---|
| 免费试用 | $0 | 1,000 | ~200 |
| Lite | $40/月 | 200,000 | 40,000 |
| Standard | $90/月 | 1,000,000 | 200,000 |
| Pro | $200/月 | 3,000,000 | 600,000 |
在 Lite 级别下,单张截图大约 $0.001——这是我找到的大规模 SaaS 方案里最便宜的。
优势与局限
- 优势: 大流量下极其便宜,更完整的爬虫基础设施,代理/指纹轮换
- 局限: 可视化定制选项更少,公开的截图专项文档有限,输出较基础(公开文档里主要是 PNG)
最适合
预算有限、需要高频截图、但不要求像素级定制的开发者。
6. ApiFlash——最适合预算友好的简单方案
运行在 AWS Lambda 上,并使用最新版本的 Chrome。它是一个单端点 API,做的事情和名字一样直接——为简单页面提供简洁、可靠的截图。
我发现它对静态页面和中等动态页面表现不错。它在反爬保护站点上更吃力一些,这也符合它更简单的架构预期。
主要特性
- 输出格式: PNG、JPEG、WebP
- 整页和视口截图、 自动页面加载检测
- 广告拦截、Cookie 横幅隐藏、S3 导出
- SDK/示例:C#、cURL、Go、Java、Node、PHP、Python、Ruby
- 速率限制:
定价
| 方案 | 价格 | 截图数 |
|---|---|---|
| 免费 | $0 | 每月 100 |
| Lite | $7/月 | 1,000 |
| Medium | $35/月 | 10,000 |
| Large | $80/月 | 100,000 |
100K 只要 80 美元,ApiFlash 是最便宜的 SaaS 方案之一——但要记住,这是针对标准页面的。反爬或复杂整页截图可能需要别的工具。
优势与局限
- 优势: API 简单,AWS 背书的可扩展性,价格很低,持续提供免费额度
- 局限: 地理位置选项有限,没有反爬功能,与 ScreenshotOne 或 Urlbox 相比定制能力较弱
最适合
侧项目、内部工具,以及只需要低成本简单截图的团队。
7. ScreenshotMachine——最适合快速、无负担集成
已经存在很多年了。它最突出的功能是 API Builder——一个网页界面,可以直接生成可嵌入的截图 URL,而不用写后端代码。
它支持桌面、平板和手机设备模拟,可调方向、缩放和延迟。没有太多花哨功能,但用于基础场景很稳定。
主要特性
- 设备模拟: 桌面、平板、手机
- 整页截图、 可调方向/缩放/延迟
- API Builder 可即时生成截图链接(无需后端)
- 输出格式: PNG、JPEG
定价
| 方案 | 价格 | 截图数 |
|---|---|---|
| 免费 | $0 | 每月 100 |
| Basic | $9/月 | 约 2,500 |
| Pro | $59/月 | 约 20,000 |
| Enterprise | $99/月 | 约 50,000 |
优势与局限
- 优势: API Builder 很容易用,基础截图稳定,中等量级下价格也不错
- 局限: 高级选项少,定制能力有限,没有反爬功能
最适合
非技术用户,或者只需要快速嵌入截图链接、又不想深度接 API 的团队。
8. Screenshotlayer——最适合老牌 APILayer 用户
是较早的一批截图 API 之一,属于 APILayer 家族。它很简单——一个 REST 端点——但也确实显露出年代感。
在我的测试中,JavaScript 预执行并不稳定。SPA 经常只渲染出部分内容或者直接空白。和更新的竞品相比,文档也显得老旧。
主要特性
- 简单的 REST API,支持 viewport 定制
- 整页截图、 CSS 注入、多种导出格式
- 属于 APILayer 生态(便于和其他 APILayer 产品打包使用)
定价
| 方案 | 价格 | 截图数 |
|---|---|---|
| 免费 | $0 | 每月 100 |
| Professional | $40/月 | 10,000 |
优势与局限
- 优势: 端点极其简单,适合侧项目的免费额度,APILayer 生态兼容性好
- 局限: 文档老旧,JavaScript 渲染效果差,没有反爬功能,大规模下单次成本高于更新的 API
最适合
已经在 APILayer 生态里的团队,需要基础截图,但不要求现代 JS 渲染能力。
9. Puppeteer(自托管)——Node.js 下全控制力的最佳选择
是 Google 开源的 Node.js 库,用来控制无头 Chrome。它是自托管截图采集的黄金标准,也是许多 SaaS API 的底层基础。
用 Puppeteer,你可以完整访问 Chrome DevTools Protocol。你可以点击、滚动、输入、拦截网络请求、注入脚本,并以像素级控制来截屏或生成 PDF。但同时你也要管理一切:Chrome 更新、Docker 容器、扩展、字体渲染和重试逻辑。
主要特性
- 完整的 Chrome DevTools Protocol 访问权限
- 截图前页面交互: 点击、滚动、输入、等待选择器
- 网络拦截、 PDF 生成、自定义 viewport
- 免费且开源——
定价
开源免费。你只需要支付服务器基础设施费用——低流量场景下,基础 VPS 大约从每月 5–10 美元起。
优势与局限
- 优势: 无限截图(只算基础设施成本)、灵活性最高、社区庞大、没有厂商锁定
- 局限: 需要 Node.js 经验;Chrome 更新和扩展要你自己管理;没有内置代理轮换或反爬功能; 包括空白截图、懒加载失败和超时
最适合
需要完全控制渲染流程、而且有 DevOps 能力维护基础设施的 Node.js 开发者。
10. Playwright(自托管)——最适合多浏览器测试
是 Microsoft 的开源自动化库。它支持 Chromium、Firefox 和 WebKit,并为 Python、Node.js、Java 和 .NET 提供 SDK。
和 Puppeteer 相比,Playwright 的 API 更干净,内置自动等待功能(能减少不稳定),而且开箱就支持多浏览器。对于需要跨浏览器验证的视觉回归测试流程来说,Playwright 是更强的选择。
主要特性
- 多浏览器: Chromium、Firefox、WebKit
- SDK: Python、Node.js、Java、.NET
- 内置自动等待,降低截图不稳定性
- 网络模拟、并行浏览器上下文、trace 查看器
- 免费且开源
定价
开源免费。只需承担基础设施成本——和 Puppeteer 类似。
优势与局限
- 优势: 多浏览器覆盖、API 更干净、内置自动等待、SDK 支持广泛、非常适合 CI/CD 流程
- 局限: 维护成本和 Puppeteer 一样高,没有内置代理/反爬,需要投入 DevOps 资源扩展
最适合
做跨浏览器视觉回归测试的团队、Python/Java 团队,以及任何需要的不只是 Chromium 的人。
免费额度真相表——在付费前你到底能拿到什么
很多论坛帖子都在吐槽那些“免费额度看起来很大,实际很坑”的计划——有人写道:“screenshotapi.net 说每月 100 次,结果远没到就把我拦下了。”如果我刚开始评估这些工具时就有这一节就好了。
| 工具 | 宣传的免费额度 | 持续免费还是试用 | 是否需要信用卡 | 关键注意事项 |
|---|---|---|---|---|
| Thunderbit(API) | 600 API 单位 | 一次性 | 否 | 每页 Extract 20 单位 = 总共 30 页 |
| Thunderbit(扩展) | 6 页(试用可到 10 页) | 免费 + 试用 | 否 | 1 积分 = 1 行输出 |
| ScreenshotOne | 每月 100 次 | 持续 | 否 | 视觉问题可能计数 |
| Urlbox | 7 天试用 | 有时限 | 否 | 没有永久免费计划 |
| CaptureKit | 100 积分 | 持续 | 否 | 5 万以上没有自助套餐 |
| Scrapingdog | 1,000 积分(30 天) | 试用 | 否 | 每张截图 5 积分 = 约 200 张 |
| ApiFlash | 每月 100 次 | 持续 | 否 | 反爬能力有限 |
| ScreenshotMachine | 每月 100 次 | 持续 | 否 | 只有基础功能 |
| Screenshotlayer | 每月 100 次 | 持续 | 否 | JS 渲染效果差 |
| Puppeteer | 无限 | 持续(开源) | 不适用 | 你要自己付计算成本 |
| Playwright | 无限 | 持续(开源) | 不适用 | 你要自己付计算成本 |
我的建议是:在正式决定之前,一定先拿你的真实目标 URL 测试免费额度。不能渲染你页面的免费计划,价值就是 0 美元。
大规模成本:每月 1K、10K、50K 和 100K 张截图,你到底会花多少钱?
大多数对比文章只列了定价方案,却没算你规模上来后到底会花多少。一个从侧项目(每月 1K)走向生产级 SaaS(每月 100K)的开发者,需要的是实打实的数据。

下面是对应各个规模的最低公开档位,或公开说明的超额路径。
| 工具 | 1K/月 | 10K/月 | 50K/月 | 100K/月 | 备注 |
|---|---|---|---|---|---|
| ScreenshotOne | $27 | $79 | $159 | 约 $459 | Scale 159 美元 + 额外 50K 按 $0.004 计费 |
| Urlbox | $49(Hi-Fi) | $99 | 约 $645 | 约 $795 | Business:498 美元基础 + 每 1K $3 |
| CaptureKit | $7 | $29 | $89 | 定制 | 没有公开的 10 万自助套餐 |
| Scrapingdog | $40 | $40 | $90 | $90 | 每张 5 积分;大规模下最便宜 |
| ApiFlash | $7 | $35 | $80 | $80 | Large 套餐覆盖到 100K |
| ScreenshotMachine | $9 | $59 | $99 | $99+ | 50K 时就到 Enterprise |
| Screenshotlayer | $40 | $40 | $40+ | 定制 | Professional 覆盖到 10K |
| Puppeteer(自托管) | 约 $5(VPS) | 约 $20 | 约 $80 | 约 $150+ | 你自己管理基础设施 |
| Playwright(自托管) | 约 $5(VPS) | 约 $20 | 约 $80 | 约 $150+ | 你自己管理基础设施 |
| Thunderbit Extract API | 每年付费约 $16/月 | 每年付费约 $40/月 | 定制 | 定制 | 每页 20 单位;不是基于截图的方案 |
盈亏平衡问题:什么时候自托管更划算?
大约在每月 25K 张截图时,运行 Playwright 的 $40/月 VPS 成本,会和中档 SaaS 套餐接近。但你要承担所有维护风险:Chrome 更新、字体渲染 bug、流量高峰时的扩容,以及重试逻辑。如果你有 DevOps 团队和稳定基础设施,那么在每月 50K 以上,自托管会更省钱;如果没有,工程时间的隐性成本很容易超过 SaaS 溢价。
SaaS vs. 自托管截图 API:该怎么选?
大多数对比文章完全忽略了这个争论。下面是我根据实际情况总结的决策框架:
选择 SaaS,如果:
- 你的量低于每月 10K
- 你没有专职 DevOps 团队
- 你需要开箱即用的反爬绕过、地理路由或 Cookie 横幅处理
- 你想要零维护成本
选择自托管(Puppeteer/Playwright),如果:
- 你的量超过每月 50K,而且基础设施稳定
- 你需要对渲染有完全控制(自定义脚本、网络拦截、浏览器上下文)
- 你要抓取不能离开内网的隐私敏感内容
- 你在大规模下预算紧张,但有工程能力
可以考虑混合方案:
- 对难渲染的网站使用 SaaS API(反爬、地区限制、复杂 SPA)
- 对简单、高频的采集任务自托管(静态页面、内部工具)
有一个论坛担忧值得特别提一下:“创始人最终会不会放弃维护 Chrome 的更新。”这个风险既适用于 SaaS(供应商放弃维护),也适用于自托管(你必须自动化 Chromium 更新)。对 SaaS 来说,检查供应商的正常运行历史和浏览器版本;对自托管来说,在 CI 流水线里设置自动 Chrome/Chromium 更新。
什么时候你根本不需要截图 API
我读过的每一篇竞品对比都跳过了这一点——但这可能是我最想告诉你的内容。
很多常见的“截图 API”用例——竞品监控、目录抓取、列表归档、产品数据提取——表面上看像是要先抓图片,但实际上你需要的是页面上的数据。价格页的截图只会给你像素;结构化提取则会给你可以过滤、比较、画图并据此行动的数字。
| 场景 | 截图 API 结果 | Thunderbit 提取结果 |
|---|---|---|
| 监控竞品价格 | 需要 OCR 或人工阅读的图片 | 结构化价格数据 → Google Sheets |
| 归档房源信息 | 静态图片,数据锁在像素里 | 价格、卧室数、地址、图片 → Airtable/Notion |
| 提取产品目录 | 产品网格的截图 | SKU、名称、价格、规格、图片 URL → CSV |
| 生成 OG 社交卡片 | ✅ 最适合——需要真实图片 | ❌ 不合适 |
| 视觉回归测试 | ✅ 最适合——像素对比 | ❌ 不合适 |
| QA/合规归档 | ✅ 最适合——视觉证据 | ❌ 不合适 |
如果你的工作流最后是“然后我再从截图里把数字读出来”,那你其实在添加一个不必要的步骤。Thunderbit 的 Chrome 扩展或 可以直接把这些数据抓出来——不用 OCR,不用视觉模型,也不用人工读取。
关于这在实际中怎么运作,可以看看我们关于和 的指南。
最佳截图 API 对比表(10 款工具一览)
| 工具 | 最适合 | 免费额度 | 起售价 | 100K/月成本 | 格式 | Cookie/横幅 | 反爬 | 地理/代理 |
|---|---|---|---|---|---|---|---|---|
| Thunderbit | 数据提取(不是像素) | 6 页(扩展);600 API 单位 | 每年付费 $16/月(API) | 不适用(数据,不是截图) | JSON/CSV/Markdown | 不适用 | API 声称可处理 | API 文档提到地理能力 |
| ScreenshotOne | 通用开发者 API | 每月 100 次 | $27/月 | 约 $459 | PNG/JPEG/WebP/GIF/PDF/+ | ✅ 很强 | ❌ 无 CAPTCHA 绕过 | 18 个国家 |
| Urlbox | 像素级高保真、企业级 | 7 天试用 | $19/月(Lo-Fi) | 约 $795 | PNG/JPEG/WebP/AVIF/SVG/PDF/视频 | ✅ 很强 | 部分支持(Ultra+) | ✅ 很强 |
| CaptureKit | 设备模拟、独立开发者 | 100 积分 | $7/月 | 定制 | PNG/JPEG/WebP/PDF | ✅ | 声称有隐身模式 | 有限 |
| Scrapingdog | 高流量低预算 | 1K 积分试用 | $40/月 | $90 | PNG | 文档有限 | 平台级 | 地区定向 |
| ApiFlash | 预算友好、简单 | 每月 100 次 | $7/月 | $80 | PNG/JPEG/WebP | ✅ 基础 | ❌ 较弱 | 有限 |
| ScreenshotMachine | 无负担集成 | 每月 100 次 | $9/月 | 约 $99 | PNG/JPEG | 基础 | ❌ | ❌ |
| Screenshotlayer | APILayer 老用户 | 每月 100 次 | $40/月 | 定制 | 多种 | ❌ | ❌ | ❌ |
| Puppeteer | 完整 Node.js 控制 | 无限(开源) | 约 $5 VPS | 约 $150(基础设施) | 任意(脚本控制) | 手动 | 手动代理 | 手动 |
| Playwright | 多浏览器测试 | 无限(开源) | 约 $5 VPS | 约 $150(基础设施) | 任意(脚本控制) | 手动 | 手动代理 | 手动 |
如何选择合适的截图 API
这里是快速决策指南:
- 需要结构化数据(价格、潜客、列表),不要图片? →
- 需要通用截图,文档又很好? → ScreenshotOne
- 需要复杂页面的像素级渲染? → Urlbox
- 预算内做设备特定截图? → CaptureKit
- 高流量下每张最便宜? → Scrapingdog 或 ApiFlash
- 反爬很重或地区限制强的页面? → 可以考虑 ScrapFly(不在本列表中,但值得评估)或 Urlbox Ultra
- 要完全控制并自托管? → Playwright(多浏览器)或 Puppeteer(Node.js 生态)
- 已经在 APILayer 生态里? → Screenshotlayer
- 想快速嵌入链接、不想搭后端? → ScreenshotMachine
对大多数刚开始的开发者来说,ScreenshotOne 的免费额度是最适合试手的。对大多数意识到自己真正需要的是数据而不是图片的业务用户来说,Thunderbit 的 Chrome 扩展很值得一试——你可以,用 6 个免费页面测试。
结语
测试完这 10 款工具后,最大的收获不是延迟或价格,而是:相当大一部分“截图 API”场景,其实更适合用结构化数据提取来解决。如果你的流程是先抓一张图,再从图里提取信息,那你其实是在增加一个会消耗时间、金钱和准确性的步骤。
对于那些真正需要渲染图像的场景——社交卡片、视觉回归、合规归档、QA 证据——SaaS API 已经成熟很多。ScreenshotOne 在功能和价格之间给出了最好的平衡。Urlbox 提供了最高保真度。ApiFlash 和 Scrapingdog 在预算上胜出。而 Puppeteer/Playwright 仍然是那些有工程能力自托管团队的正确选择。
不管你选什么,先用你的真实目标 URL 测试免费额度。
能在 example.com 上工作的工具,和能在你真实页面上工作的工具,差别就在这里。
如果你想了解我们在 Thunderbit 里如何看待和数据提取,可以看看我们的——我们会在那里讲真实用例。
常见问题
1. 2026 年最好的免费截图 API 是哪个?
ScreenshotOne 和 ApiFlash 都提供持续免费的 100 张/月额度,而且不需要信用卡。CaptureKit 提供 100 个免费积分(持续有效)。Scrapingdog 提供 30 天试用的 1,000 积分,折算下来大约 200 张截图。自托管方面,Puppeteer 和 Playwright 都是免费开源的——你只需要支付服务器成本。一定要先拿真实 URL 测试免费额度,因为不能渲染你目标页面的免费计划其实没什么价值。
2. 我可以不写代码使用截图 API 吗?
可以。ScreenshotOne 可与 Zapier 和 Make 集成。CaptureKit 也提供 Zapier/Make 连接器。ScreenshotMachine 的 API Builder 可以生成可嵌入的截图链接,不需要后端代码。对于数据提取(不是截图),Thunderbit 的 Chrome 扩展可以两步完成,完全不用写代码。
3. SaaS 截图 API 和 Puppeteer:哪个更便宜?
在每月 25K 张截图以下,如果把工程时间算进去,SaaS API 通常更便宜。每月 50K 以上、基础设施稳定且有 DevOps 能力时,自托管 Puppeteer 或 Playwright 可以省钱——这个量级下,一个 40 美元/月的 VPS 大致相当于中档 SaaS 套餐。但你要自己承担所有维护:Chrome 更新、扩容、重试逻辑和渲染问题排查。
4. 截图 API 在 JavaScript 很重的网站上可靠吗?
大多数现代 SaaS API 都使用无头 Chromium,并支持等待条件(wait_for_selector、network idle、delay)。在我的测试中,只要参数用对,ScreenshotOne、Urlbox 和 CaptureKit 对 SPA 的处理都不错。Screenshotlayer 在 JS 很重的页面上表现较差。自托管的 Puppeteer 和 Playwright 给你完全控制权,但每个边缘场景都需要手动写脚本。
5. 什么时候该用数据提取,而不是截图 API?
如果你的最终目标是读取、比较、过滤或分析页面上的信息——价格、联系方式、产品规格、列表数据——那么结构化数据提取比先截图再 OCR 快得多,也更可行动。像 Thunderbit 的 Extract API 或 Chrome 扩展这样的工具,会直接返回结构化字段。只有在你确实需要视觉产物时,才保留截图 API:社交卡片、合规证明、视觉回归测试或 QA 证据。
了解更多
