Firecrawl 已经成了 AI 开发圈里最受关注的网页爬取 API 之一——、Y Combinator 资助,客户名单里还有 Shopify、Zapier 和 Apple。可是在我翻完定价文档、用户吐槽、第三方基准测试和真实成本模型之后,宣传故事和实际体验之间的差距相当大。

这篇 Firecrawl 评测不是单纯列功能。如果你已经注册、跑过几次测试抓取,现在正想知道“规模化后到底会花我多少钱?”——或者你在判断 Firecrawl 到底是不是团队的合适工具——那你来对地方了。我会拆解真实成本(包括大多数评测都会跳过的双重计费陷阱)、Firecrawl 真正擅长的地方、它表现乏力的地方(尤其是有反爬保护的网站),以及什么时候该果断换成完全不同的工具——包括像 这样的无代码方案。我的目标很简单:帮你避开信用卡账单上的惊喜。
Firecrawl 是什么?适合谁用?
Firecrawl 是一个以 API 为先的网页爬取与抓取平台,能把网站转换成干净的 Markdown 或结构化 JSON。它主要面向正在构建 AI 和 LLM 应用的开发者——比如 RAG 流水线、聊天机器人知识库和 AI Agent 工作流。公司由 Caleb Peffer、Eric Ciarla 和 Nicolas Silberstein Camara 创立,最初是 Mendable.ai 的一个分拆项目。他们入选了 ,并在 2025 年 8 月完成了 ,由 Nexus Venture Partners 领投,Shopify CEO Tobias Lutke 参与投资。累计融资额达到 1620 万美元。团队 25 人,位于旧金山。
Firecrawl 提供四种核心模式,外加两项新功能:
| 模式 | 功能 |
|---|---|
| Scrape | 将单个 URL 转换为 Markdown、JSON 或截图 |
| Crawl | 抓取一个 URL 及其所有子页面 |
| Map | 在几秒内发现网站上的所有 URL(最多 10 万个) |
| Search | 支持网页搜索,并返回完整页面内容 |
| Extract | 通过提示词或 schema 进行 AI 驱动的结构化提取 |
| Agent(研究预览) | 不指定 URL 的自主网页研究 |
我想先说明白:Firecrawl 是开发者工具。它需要 API 调用、编码能力和技术配置。如果你是想不用写代码就从网站抓数据的业务用户,Firecrawl 不是为你设计的(后面我会讲替代方案)。但对正在构建 AI 应用的开发团队来说,它的卖点很强——干净、LLM 友好的网页数据,而且基础设施负担很小。
Firecrawl 评测:定价档位一览

表面上看,Firecrawl 的定价很直观。下面是 上列出的内容:
| 方案 | 月费 | 每月额度 | 并发数 | 年付价格 |
|---|---|---|---|---|
| 免费版 | $0 | 500(一次性,非每月) | 2 | — |
| Hobby | $19/月 | 3,000 | 10 | 年付折算 $16/月 |
| Standard | $99/月 | 100,000 | 50 | 年付折算 $83/月 |
| Growth | $399/月 | 500,000 | 100 | 年付折算 $333/月 |
| Scale | $749/月 | 1,000,000 | 1,000 | 年付折算 $599/月 |
有两点会立刻引人注意。免费版的 500 点额度是一次性的,不是每月刷新——很多用户都是把额度一次用完后才发现这一点。其次,这些档位看起来很简单,但实际成本会因为你用到哪些功能而大幅变化。标价只是起点,真正的账单要看下一节。
Firecrawl 的真实成本:按你的场景算一算
定价是 Firecrawl 真实用户最常抱怨的问题——“贵得离谱”“按我的使用量,我得上 99 美元/月的档位”“贵得过分”这些原话,出现在 Hacker News 和 Reddit 讨论里。原因就在于:它有一套大多数 Firecrawl 评测完全忽略的双重计费系统。
陷阱在这里:Firecrawl 的额度套餐覆盖 Scrape、Crawl、Map 和 Search。可 Extract——也就是 AI 驱动的结构化提取,也是 Firecrawl 的主要卖点之一——却跑在完全独立的 token 订阅上。
| Extract 方案 | 月费 | 年度 Token 数 | 每月 Token 数(约) |
|---|---|---|---|
| Starter | $89/月 | 1800 万 | ~150 万 |
| Standard | $189/月 | 4800 万 | ~400 万 |
| Growth | $389/月 | 1.08 亿 | ~900 万 |
| Pro | $719/月 | 1.92 亿 | ~1600 万 |
所以,一个使用 Standard 额度方案($99/月)同时又需要提取功能的初创公司,最低就要付 $99 + $89 = $188/月——而且还没算任何额度倍率。这个双重计费陷阱,常常让人措手不及。
大多数用户都会忽略的隐形额度倍率
“每页 1 点额度”的说法很误导。下面才是各功能的真实消耗:
| 功能 | 额度消耗 | 实际倍率 |
|---|---|---|
| 基础 Scrape/Crawl | 每页 1 点 | 1x |
| Search | 10 个结果 2 点 | 每组结果 2x |
| JSON 提取(通过 Scrape) | 每页 +4 点 | 总计 5x |
| 增强模式 | 每页 +4 点 | 总计 5x |
| JSON + 增强模式 | 每页 +8 点 | 总计 9x |
| 浏览器交互 | 每分钟 2 点 | 视情况而定 |
| Agent 模式(spark-1-mini) | 动态,约 100–500/次查询 | 100–500x |
| Agent 模式(spark-1-pro) | 动态,约 200–1,500+/次查询 | 200–1,500x |
还有几个重要细节:额度不会按月结转。请求失败仍然会消耗额度(用户反馈在不稳定网站上会浪费 20–30%)。Agent 模式没有运行前成本估算器——你只能设置一个 maxCredits 参数,但本质上还是在猜。免费版的 500 点终身额度,如果启用提取功能,大概只能处理 56 页左右。这不是试用版,只是尝鲜。
按用户画像计算的月成本示例
| 用户画像 | 每月页面数 | 使用功能 | 预估额度消耗 | 预估月成本 |
|---|---|---|---|---|
| 爱好者 / 副业项目 | 500 | 基础抓取 + 爬取 | ~500 点 | $19/月(Hobby 方案) |
| 爱好者 + JSON 提取 | 500 | Scrape + Extract | ~2,500 点 + $89 Extract | $108/月 |
| 初创公司 / AI 应用 | 5,000 | Scrape + Extract + Search | ~30,000 点 + $89 Extract | $188/月(Standard + Extract) |
| 企业 / 数据流水线 | 50,000 | 全功能 + Agent | ~250,000–450,000 点 + $389 Extract | $788–$1,138/月 |
一位在 Hacker News 上每月付 190 美元的开发者称这款产品“又贵又像半成品”,最后用 2700 行自定义 Elixir 代码替换了 Firecrawl。这已经是相当明确的信号了。
自托管 Firecrawl:哪些真免费,哪些只能云端用
“我能不能直接免费自托管 Firecrawl?”是我最常见到的问题之一。答案是:可以,但大概不是你期待的那种方式。
Firecrawl 有开源核心(AGPL-3.0 许可证),但一些重要功能只在云端提供。下面是完整拆分:
| 能力 | 自托管(免费) | 云端(付费) |
|---|---|---|
| 基础 Scrape/Crawl 转 Markdown | ✅ | ✅ |
| Map(URL 发现) | ✅ | ✅ |
| LLM 驱动的 Extract | ⚠️(需要自带 LLM key) | ✅(托管) |
| Agent 模式 | ❌ | ✅ |
| 浏览器沙盒 | ❌ | ✅ |
| Actions/Interact | ❌ | ✅ |
| 反爬 / 代理轮换(Fire-engine) | ❌(使用你的静态 IP) | ✅ |
| 批量处理 | ❌ | ✅ |
| 控制面板 / 分析 | ❌ | ✅ |
| 托管基础设施 | ❌(需要 Docker + PostgreSQL + Redis) | ✅ |
Fire-engine 是 Firecrawl 自家的反爬系统,已被 。自托管用户完全没有反爬能力,必须自己提供代理。
什么情况下自托管仍然说得通
如果你是开发者,只想要一个基础的“抓取到 Markdown”流水线,而且能熟练管理包含 5+ 服务的 Docker Compose,那么自托管是可行的。最低配置需求:4GB 内存、2 个 CPU 核心,以及用于提取功能的 LLM API key($0.01–$0.10/页);如果需要代理服务,也要自己准备。算下来,自托管的总成本大约是 $90–$340/月——在中等流量下,这个价格经常和云端套餐差不多。
为什么用户对自托管版本不满意
真实用户反馈描绘出一幅不太乐观的图景。多个 Reddit 和 GitHub 讨论串都提到,自托管版本会随着时间推移而退化,因为功能被逐步迁移到云端。有人直白地总结:公司“就是想把所有用户都赶去付费,让自托管变得没用”。社区甚至创建了一个 firecrawl-simple 分支来缓解这些痛点。如果你指望自托管能成为长期免费的解决方案,那最好调整预期——它适合做实验起步,但没法替代规模化的付费云产品。
Firecrawl 反爬表现:哪些站点能用,哪些不行
如果你最关心的是“Firecrawl 到底能不能在我需要抓的网站上跑起来?”,这一节最重要。
简短答案:完全取决于这些网站的防护强度。
基准测试数据
独立测试了 10 个网页爬取 API,在 15 个反爬很强的网站上进行对比。Firecrawl 的结果如下:
| 提供商 | 成功率(2 req/s) | 成功率(10 req/s) |
|---|---|---|
| Zyte | 93.14% | 89.2% |
| ScrapFly | 91.8% | 88.5% |
| Bright Data | 88.7% | 84.9% |
| Firecrawl | 33.69% | 26.69% |
在受保护网站上,Firecrawl 在 10 家提供商里。它平均 7.92 秒的快速响应,部分原因是“快速失败”策略——它会尽快返回失败,而不是反复重试。
更广泛、持续更新的基准测试给 Firecrawl 的总成功率是 65.4%(高于 59.5% 的行业平均),在容易目标上表现不错,但在受保护目标上很差。
网站难度分级:简单、中等、困难
| 难度 | 示例网站 | Firecrawl 成功率 | 建议 |
|---|---|---|---|
| 简单 | 博客、文档、公开 SaaS 页面 | 85–98% | 可以放心用 Firecrawl |
| 中等 | 商品目录、带基础反爬的新闻站、Etsy、Realtor.com | 53–65% | 谨慎测试,预计会有失败 |
| 困难 | Amazon、领英、Instagram、Cloudflare 防护很强的页面 | 0–33% | 不要依赖 Firecrawl——用专门的反爬提供商 |
受 Cloudflare 保护的网站,是最常见的失败点。多个 GitHub issue 记录了这个问题:即使使用 IP 轮换,Cloudflare 的指纹识别也会拦住 Firecrawl。自托管用户受影响最严重,因为他们没有 Fire-engine 的代理基础设施。
当 Firecrawl 不够用时该怎么办
对于防护很强的网站,用户通常会转向像 ScrapFly 或 Bright Data 这样的专用代理服务,或者使用带自定义隐身配置的无头浏览器工具。如果你是业务用户,不想去操心代理轮换或成功率计算,那像 这样的无代码工具会把反爬问题处理在后台——你只需要点几下,就能拿到数据。
Firecrawl 的优缺点:坦诚总结
Firecrawl 做得好的地方
- 干净、适合 LLM 的 Markdown 输出——格式一贯很漂亮,标题层级也很规范。这确实是 Firecrawl 最强的卖点。
- 云端用户几乎零基础设施负担——不用配浏览器、不用管理代理、不用折腾无头浏览器配置。
- 框架集成很广——LangChain、LlamaIndex、CrewAI、AutoGPT、Dify、、Flowise(7+ 个 AI 流水线集成)。
- Map 接口的 URL 发现很快——完整站点地图通常 2–3 秒就能扫完。
- 开源核心,拥有 ——透明度高,也有社区贡献。
- 支持 MCP 服务器,并配合 FIRE-1 模型用于 AI Agent 工作流。
- ,尤其适合 JS 很重的页面(React、Vue、Angular 的 SPA)。
Firecrawl 不足的地方
- 双重定价(额度 + 独立的 Extract token 方案)会带来没人预料到的账单惊喜。
- 额度倍率会让实际成本比宣传价高出 5–9 倍。
- 反爬表现:基准测试里垫底,Proxyway 结果显示它只有 ,而第一名是 93.14%。
- Agent 模式的额度消耗不可预测,而且没有运行前成本估算器。
- 请求失败仍然消耗额度——在不稳定网站上会浪费 20–30%。
- 自托管版本缺少 Agent、浏览器沙盒、Fire-engine 反爬和控制面板。
- 没有原生 CAPTCHA 解决能力——相比 Bright Data 和 Zyte,这是个明显缺口。
- 非技术用户无法直接上手——需要编码和 API 知识。
- 免费版的 500 点是终身额度,不是每月额度——不够认真测试用。
超越开发者工具:Firecrawl 评测里很少提到的无代码替代方案
我看过的每一篇 Firecrawl 评测,几乎都只拿它和其他开发者工具比较——Crawl4AI、Scrapy、Playwright、Apify。对于开发者来说,这很合理。但搜索网页爬取解决方案的人里,有很大一部分并不是开发者:销售团队在搭客户名单、电商运营在监控竞品价格、市场人员在收集内容数据、房产经纪人在追踪房源。
这正是一个值得补上的缺口。
Firecrawl 替代方案对比表
| 工具 | 最适合 | 需要代码吗? | LLM 友好输出 | 起步价 |
|---|---|---|---|---|
| Firecrawl | 构建 AI 应用的开发者 | 需要(API) | ✅ Markdown/JSON | $19/月 |
| Crawl4AI | 想要免费 / 开源方案的开发者 | 需要(Python) | ✅ Markdown | 免费 |
| Apify | 需要规模化和市场生态的开发者 | 需要(SDK) | ⚠️ 需配置 | $39/月 |
| Thunderbit | 业务用户(无代码) | 不需要(Chrome 扩展) | ✅ 结构化数据 | 有免费版 |
| ScrapingBee | 需要代理的开发者 | 需要(API) | ❌ 原始 HTML | $49/月 |
| Bright Data | 企业数据团队 | 需要(API/SDK) | ⚠️ 需配置 | $500+/月 |
为什么 Thunderbit 是非技术团队的首选
我在 Thunderbit 团队工作,所以这里我会坦诚说明。Thunderbit 应该出现在这份对比里,因为它解决的是和 Firecrawl 不同的问题,面向的是不同的人群,而且不需要任何代码。
Thunderbit 的流程只要两步:打开 ,点击“AI 智能推荐字段”,然后点“抓取”。AI 会读取页面,自动建议合适的列,并把结构化数据提取成表格。没有 API key,没有选择器,没有编码。你可以免费导出到 Excel、Google Sheets、Airtable 或 Notion。
对业务用户来说,关键差异包括:
- 子页面增强——点击详情页后自动抓取更多字段
- AI 适应页面布局变化——网站改版也不用维护
- 内置数据标注和翻译——对多语言数据集很有用
- 热门网站的即用模板——Amazon、Zillow、领英等
对于想要 API 替代方案的开发者,Thunderbit 也提供 ,定价比 Firecrawl 的双重额度/token 系统更简单。它不会取代 Firecrawl 在 LLM 流水线开发中的位置。但对销售、电商、市场和运营团队来说,如果你需要的是结构化数据,又不想写代码,那它更快,也更便宜。
自建还是购买:Firecrawl 什么时候值回票价,什么时候不值
“我想过自己写一个网页爬虫……比 Firecrawl 简单,但至少更便宜。”很多用户都提到了这一点。与其给主观判断,不如直接给你一个结构化决策框架。
决策框架表
| 因素 | 自建(Scrapy/Playwright) | 购买 Firecrawl Cloud | 使用 Thunderbit(无代码) |
|---|---|---|---|
| 搭建时间 | 10–40+ 小时 | 约 30 分钟 | 约 5 分钟 |
| 持续维护 | 高(选择器容易失效) | 几乎为零(托管) | 零(AI 自动适应) |
| 反爬处理 | 手动(代理、请求头、重试) | 内置(部分支持——对受保护站点较弱) | 内置(浏览器 + 云端模式) |
| 每月 1000 页成本 | $50–150(服务器 + 代理) | $19–$108(取决于功能) | $0–$15 |
| 每月 5 万页成本 | $500–$1,500(基础设施) | $399–$1,138 | $39–$249 |
| LLM 友好输出 | 需要自定义代码 | 内置(Markdown/JSON) | 结构化表格(可导出) |
| 最适合 | 全控制、冷门站点、DevOps 团队 | AI/LLM 开发者、RAG 流水线 | 销售、电商、市场、运营 |
对于大多数组织来说,三年内自建方案的成本会比 API 高出 。真正出现自建更便宜的交叉点,大约是每月 1000 万页以上——这个规模实际上很少有团队能达到。
诚实结论:你适合哪条路?
Firecrawl 值得买单的情况:
- 团队本来就用 Python/JS 开发,而且需要干净的 Markdown 供 LLM/RAG 流水线使用
- 目标站点大多没有强反爬,或者防护较弱
- 你想要托管基础设施,而不想承担 DevOps 额外负担
- 规模保持在每月约 5 万页以下
Firecrawl 不值这个价的情况:
- 你是业务用户,想在没有开发团队的情况下做提取 → Thunderbit 更简单、更快
- 你的目标站点反爬很强(Amazon、领英、Cloudflare 重度防护)→ 选 Bright Data 或 Zyte
- 你需要规模化下可预测的账单 → 额度倍率会让成本难以预测
- 你想要完整功能的自托管方案 → Agent、浏览器沙盒、Fire-engine 都只在云端提供
只有在这些情况下,自建才说得通:
- 团队有专门的 DevOps 能力
- 你已经到了超大规模(每月 1000 万页以上)
- 你需要对冷门或奇怪站点的处理方式拥有完全控制权
- 你能接受持续维护选择器
Firecrawl 评测:并排对比表
下面把关键信息放在一起看:
| 工具 | 类型 | 最适合 | 需要代码 | 反爬处理 | LLM 友好输出 | 可自托管 | 起步价 |
|---|---|---|---|---|---|---|---|
| Firecrawl | API | AI/LLM 开发者 | 需要 | 对受保护站点较弱 | ✅ Markdown/JSON | ✅(受限) | $19/月 |
| Crawl4AI | Python 库 | 以开源为先的开发者 | 需要 | 没有(自己搞定) | ✅ Markdown | ✅ | 免费 |
| Apify | 云平台 | 规模化 + 市场生态 | 需要 | 中等 | ⚠️ 需配置 | ✅ | $39/月 |
| Thunderbit | Chrome 扩展 + API | 业务用户、无代码 | 不需要 | 内置 | ✅ 结构化数据 | ❌ | 有免费版 |
| ScrapingBee | API | 以代理为主的开发者 | 需要 | 强 | ❌ 原始 HTML | ❌ | $49/月 |
| Bright Data | API + 代理网络 | 企业数据团队 | 需要 | 最强(约 99.9%) | ⚠️ 需配置 | ❌ | $500+/月 |
最终结论:Firecrawl 值不值得用?
Firecrawl 对特定场景来说是个不错的工具:如果你的团队在构建 LLM 应用、RAG 流水线或 AI Agent,需要中等规模下干净的网页数据,并且已经习惯 API 工作流,那它很合适。它的 Markdown 输出质量确实是一流,框架集成(LangChain、LlamaIndex、CrewAI)也已经成熟。如果你的团队本来就在用 Python 或 JavaScript,而且目标站点没有很强的反爬,Firecrawl 可以帮你省下不少工程时间。
但它的缺点也是真实存在的。双重定价系统(额度 + 独立 Extract 订阅)会带来实打实的账单惊喜。它在受保护站点上的 说明,你不能指望它稳定搞定 Amazon、领英或 Cloudflare 重度防护的目标。自托管版本缺少的功能太多,根本不能算真正的免费替代方案。而且如果你是非技术用户——比如销售、电商或市场人员——Firecrawl 压根不是为你设计的。
你可以先试试 Firecrawl 免费的 500 点额度,看看输出质量是否适合你的流水线。但在付费之前,一定要用上面的计算器估算真实月成本。如果你只是想从网站获取结构化数据,又不想写代码,那就先从 开始——你会在几分钟内完成抓取,而不是花几个小时。你现在就可以试试 ,或者看看 是否适合你的团队规模。想看视频教程的话, 里有一步一步的演示。
常见问题
Firecrawl 每抓取一页要多少钱?
基础 Scrape 或 Crawl 每页 1 点额度。JSON 提取会额外加 4 点/页(合计 5 点)。增强模式再加 4 点(最高 9 点)。Search 每 10 个结果消耗 2 点,Agent 模式每次查询可能消耗 100–1,500+ 点。除此之外,Extract 功能还需要单独的 token 订阅,起价 $89/月。想看按不同用户画像估算的真实成本,请参考上面的成本计算部分。
Firecrawl 可以免费自托管吗?
可以,开源核心(AGPL-3.0)可以免费自托管。但你会失去 Agent 模式、浏览器沙盒、反爬/代理轮换(Fire-engine 是闭源的)、批量处理和管理面板。提取功能需要你自带 LLM key,并自己维护 Docker、PostgreSQL 和 Redis。自托管适合基础的“抓取到 Markdown”流水线,但在生产规模下不能替代云端产品。
Firecrawl 适合抓 Amazon、领英或其他受保护网站吗?
显示,Firecrawl 在高反爬网站上的成功率只有 33.69%,在 10 家测试提供商里垫底。它在没有保护的页面上表现很好(博客、文档、SaaS 网站——成功率 85–98%),但对主流电商或社交平台并不可靠。对于这些目标,建议使用 Bright Data 或 Zyte 这类专门的反爬提供商,或者像 Thunderbit 这样把反爬处理放在后台的无代码工具。
非技术用户最好的 Firecrawl 替代品是什么?
是最好的无代码替代方案。它是一个 Chrome 扩展,你只需要点击“AI 智能推荐字段”,再点“抓取”——没有 API 调用,没有编码,没有选择器。数据可以免费导出到 Excel、Google Sheets、Airtable 或 Notion。它就是为销售、电商、市场和运营团队打造的,适合需要网页结构化数据但没有开发者支持的场景。
Firecrawl 提供免费试用吗?
Firecrawl 会送你 ,不需要信用卡。这足够你在少量页面上测试基础的 Scrape/Crawl 功能,但不够正式使用——尤其是如果你启用了提取功能(每页会消耗 5 点)。免费版的额度不会按月刷新。
了解更多