Firecrawl 已经成了 AI 开发者圈子里最火的网页抓取 API 之一——、Y Combinator 投资背书,以及 Shopify、Zapier、Apple 这样的客户名单,听起来确实很能打。但我在仔细看完定价文档、用户吐槽、第三方基准测试和真实成本模型之后发现,宣传故事和实际体验之间,落差其实相当大。

这篇 Firecrawl 评测,不是那种只会堆功能点的常规文章。如果你已经注册了账号,跑过几轮测试抓取,现在开始担心“规模化之后到底要花多少钱?”——或者你想先判断 Firecrawl 到底适不适合你的团队——那你来对地方了。我会带你看清真实成本(包括很多评测都没提到的双重计费坑)、Firecrawl 真正擅长什么、它在哪些场景下会拉胯(尤其是有反爬保护的网站),以及什么时候你其实应该直接换一类工具——比如像 这样的无代码方案。我的目标只有一个:帮你避开那张让人肉疼的信用卡账单。
Firecrawl 是什么?它适合谁?
Firecrawl 是一个以 API 为核心的网页抓取和爬取平台,能把网站内容转换成干净的 markdown 或结构化 JSON。它主要面向正在做 AI 和 LLM 应用的开发者,比如 RAG 流水线、聊天机器人知识库,以及 AI Agent 工作流。公司由 Caleb Peffer、Eric Ciarla 和 Nicolas Silberstein Camara 创立,最早来自 Mendable.ai 的一个拆分项目。他们曾入选 ,并在 2025 年 8 月完成由 Nexus Venture Partners 领投的 ,Shopify CEO Tobias Lutke 也参与了投资。累计融资总额:1,620 万美元。团队目前有 25 人,总部在旧金山。
Firecrawl 提供四个核心模式,外加两个新增能力:
| 模式 | 功能说明 |
|---|---|
| Scrape | 将单个 URL 转换为 markdown、JSON 或截图 |
| Crawl | 抓取一个 URL 及其所有子页面 |
| Map | 几秒内发现网站上的所有 URL(最多 100,000 个) |
| Search | 带完整页面内容获取的网页搜索 |
| Extract | 通过提示词或 schema 实现 AI 驱动的结构化提取 |
| Agent(研究预览) | 无需指定 URL 的自主网页研究 |
先说清楚:Firecrawl 是一个开发者工具。它需要 API 调用、编码能力和技术配置。如果你是业务人员,只想从网站上抓数据而不写代码,那 Firecrawl 不是为你设计的(后面我会讲替代方案)。但对于正在搭建 AI 应用的开发团队来说,它的吸引力确实很强——用尽量少的基础设施负担,拿到干净、适合 LLM 使用的网页数据。
Firecrawl 评测:价格档位一览

表面上看,Firecrawl 的定价结构还挺清楚。下面是它在 上列出的内容:
| 套餐 | 月费 | 每月积分 | 并发数 | 年付价格 |
|---|---|---|---|---|
| Free | $0 | 500(一次性,不是每月) | 2 | — |
| Hobby | $19/月 | 3,000 | 10 | 按年付则 $16/月 |
| Standard | $99/月 | 100,000 | 50 | 按年付则 $83/月 |
| Growth | $399/月 | 500,000 | 100 | 按年付则 $333/月 |
| Scale | $749/月 | 1,000,000 | 1,000 | 按年付则 $599/月 |
这里有两个特别容易被忽略的点。免费套餐的 500 credits 是一次性的,不是每月刷新——很多用户通常要等到一次测试就把它用完之后才发现。看上去这些档位并不复杂,但真实费用会非常依赖你到底用了哪些功能。页面上写的价格,其实只是起点。真正的账单?下一节会讲得很清楚。
Firecrawl 的真实成本:按你的使用场景算一算
在真实用户那里,价格是 Firecrawl 最大的槽点之一——“贵得离谱”“按我的使用量,我得直接上 $99/月 的套餐”“贵得夸张”,这些都是真实出现在 Hacker News 和 Reddit 里的原话。问题就在于:Firecrawl 有一套双重计费机制,而大多数评测都完全没提。
坑点在这里:Firecrawl 的积分套餐覆盖 Scrape、Crawl、Map 和 Search。但 Extract——这个 AI 驱动的结构化提取功能,也是 Firecrawl 的核心卖点之一——用的是完全独立的 token 订阅体系。
| Extract 套餐 | 月费 | 每年 Tokens | 每月 Tokens(约) |
|---|---|---|---|
| Starter | $89/月 | 1,800 万 | ~150 万 |
| Standard | $189/月 | 4,800 万 | ~400 万 |
| Growth | $389/月 | 1.08 亿 | ~900 万 |
| Pro | $719/月 | 1.92 亿 | ~1,600 万 |
所以,一个订了 Standard 积分套餐($99/月)又需要提取功能的初创公司,最低也要付 $99 + $89 = $188/月——而这还没算任何积分倍率。这个双重计费坑,往往会让人一下子懵住。
大多数用户都会忽略的隐藏积分倍率
“每页 1 个 credit”这个说法其实很容易误导人。下面才是各项功能的真实成本:
| 功能 | 积分消耗 | 实际倍率 |
|---|---|---|
| 基础 Scrape/Crawl | 每页 1 credit | 1 倍 |
| Search | 每 10 个结果 2 credits | 每组结果 2 倍 |
| JSON 提取(通过 Scrape) | 每页额外 +4 credits | 总计 5 倍 |
| Enhanced Mode | 每页额外 +4 credits | 总计 5 倍 |
| JSON + Enhanced Mode | 每页额外 +8 credits | 总计 9 倍 |
| 浏览器交互 | 每分钟 2 credits | 视情况而定 |
| Agent 模式(spark-1-mini) | 动态计费,约每次 100–500 credits | 100–500 倍 |
| Agent 模式(spark-1-pro) | 动态计费,约每次 200–1,500+ credits | 200–1,500 倍 |
还有几个很关键的细节:credits 不会按月结转。失败的请求也会扣 credits(用户反馈在不稳定的网站上会浪费 20–30%)。Agent 模式没有运行前的成本预估器——你只能设置一个 maxCredits 参数,但说实话,这基本就是在猜。免费套餐那 500 个 lifetime credits,如果启用提取功能,大概只能抓 56 页左右。那不算试用,最多只能说是浅尝辄止。
按用户画像估算的月度成本示例
| 用户画像 | 每月页面数 | 使用功能 | 估算 credit 消耗 | 估算月费 |
|---|---|---|---|---|
| 爱好者 / 副业项目 | 500 | 基础抓取 + 爬取 | ~500 credits | $19/月(Hobby 套餐) |
| 爱好者 + JSON 提取 | 500 | Scrape + Extract | ~2,500 credits + $89 Extract | $108/月 |
| 初创公司 / AI 应用 | 5,000 | Scrape + Extract + Search | ~30,000 credits + $89 Extract | $188/月(Standard + Extract) |
| 企业 / 数据流水线 | 50,000 | 全功能 + Agent | ~250,000–450,000 credits + $389 Extract | $788–$1,138/月 |
有一位在 Hacker News 上付费 $190/月 的开发者,直接把这套体验形容成“贵,而且像半成品”,最后用 2,700 行自己写的 Elixir 代码替代了 Firecrawl。这个信号已经很说明问题了。
Firecrawl 自托管:到底哪些能免费,哪些只能云端用?
“我能不能把 Firecrawl 自托管,然后免费用?”这是我最常听到的问题之一。答案是:理论上可以一部分,但大概率不是你期待的那种。
Firecrawl 有开源核心(AGPL-3.0 许可),但不少关键功能只在云端版本提供。下面是完整拆分:
| 能力 | 自托管(免费) | 云端(付费) | |---|---|---|---| | 基础 Scrape/Crawl 转 Markdown | ✅ | ✅ | | Map(URL 发现) | ✅ | ✅ | | LLM 驱动的 Extract | ⚠️(需自带 LLM Key) | ✅(托管版) | | Agent 模式 | ❌ | ✅ | | 浏览器沙盒 | ❌ | ✅ | | Actions/Interact | ❌ | ✅ | | 反爬 / 代理轮换(Fire-engine) | ❌(使用你的固定 IP) | ✅ | | 批处理 | ❌ | ✅ | | 控制面板 / 分析功能 | ❌ | ✅ | | 托管基础设施 | ❌(需要 Docker + PostgreSQL + Redis) | ✅ |
Fire-engine 是 Firecrawl 自家的反爬系统,已经被确认是 。自托管用户拿不到任何反爬能力,只能自己提供代理。
哪些场景下自托管仍然有意义
如果你只是想要一个基础的 crawl-to-markdown 流水线,而且你愿意自己维护一个包含 5+ 个服务的 Docker Compose,那自托管还是能用的。最低配置要求:4GB 内存、2 核 CPU,另外如果要做提取,还得准备 LLM API keys(每页 $0.01–$0.10),必要时还要代理服务。算下来,自托管的整体成本大约在 $90–$340/月——在中等规模下,这个价格往往已经和云端套餐差不多了。
为什么很多用户对自托管版本不满意
真实用户的反馈并不乐观。Reddit 和 GitHub 上有不少帖子都提到,随着功能慢慢迁到云端,自托管版本的可用性反而在下降。有用户直说:公司“想尽办法把所有用户都推去付费,并让自托管变得没什么用”。社区甚至还做了一个 firecrawl-simple 分支来缓解这些痛点。如果你指望把它当成长期免费的方案,最好先调整一下预期——它适合做实验起步,但并不能在规模化场景里替代付费云端产品。
Firecrawl 的反爬表现:哪些网站能用,哪些不行?
如果你最关心的问题是:“Firecrawl 到底能不能抓我想要的网站?”那这一节最重要。
简短回答:完全取决于目标网站的防护强度。
基准测试结果
独立测试了 10 个网页抓取 API,在 15 个高强度反爬网站上的表现。Firecrawl 的结果如下:
| 提供商 | 成功率(2 req/s) | 成功率(10 req/s) |
|---|---|---|
| Zyte | 93.14% | 89.2% |
| ScrapFly | 91.8% | 88.5% |
| Bright Data | 88.7% | 84.9% |
| Firecrawl | 33.69% | 26.69% |
在受保护网站上,Firecrawl 在 10 家供应商里排到了 。它平均 7.92 秒的快速响应时间,部分原因是采用了“快速失败”策略——也就是失败了就快速返回,而不是反复重试。
的长期基准测试给 Firecrawl 的总成功率是 65.4%(高于 59.5% 的行业平均值),在简单目标上表现不错,但一碰到受保护目标就明显吃力。
网站难度分级:简单、中等、困难目标
| 难度 | 示例网站 | Firecrawl 成功率 | 建议 |
|---|---|---|---|
| 简单 | 博客、文档站、公开 SaaS 页面 | 85–98% | 可以放心使用 Firecrawl |
| 中等 | 商品目录、带基础反爬的新闻站、Etsy、Realtor.com | 53–65% | 需要仔细测试,预期会有失败 |
| 困难 | Amazon、LinkedIn、Instagram、Cloudflare 防护很重的页面 | 0–33% | 不要依赖 Firecrawl,改用专门的反爬提供商 |
被 Cloudflare 保护的网站,是最常见的失败点。多个 GitHub issue 都记录了这个问题:即使使用了 IP 轮换,Cloudflare 基于指纹的检测还是会拦住 Firecrawl。自托管用户受影响最大,因为他们没有 Fire-engine 提供的代理基础设施。
当 Firecrawl 不够用时该怎么办
面对高强度防护的网站,用户通常会转向像 ScrapFly 或 Bright Data 这样的专用代理服务,或者使用带自定义隐身配置的无头浏览器工具。如果你是业务用户,不想折腾代理轮换或成功率公式,像 这样的无代码工具会在后台帮你处理反爬问题——你只需要点一下,然后拿数据。
Firecrawl 的优缺点:坦白总结
Firecrawl 做得好的地方
- 干净、适合 LLM 的 markdown 输出——格式稳定、标题层级清晰。这确实是 Firecrawl 最强的卖点。
- 云端用户几乎不用操心基础设施——不用自己搭浏览器、管代理、配无头浏览器。
- 框架集成很广——LangChain、LlamaIndex、CrewAI、AutoGPT、Dify、、Flowise(AI 流水线相关集成超过 7 个)。
- Map 接口能很快发现 URL——完整站点地图通常 2–3 秒就能出来。
- 开源核心,并拥有 ——透明度高,也有社区贡献。
- 支持 MCP server,并配合 FIRE-1 模型用于 AI Agent 工作流。
- 对 JS 重的网站有 (React、Vue、Angular SPA)。
Firecrawl 不足的地方
- 双重定价(积分 + 独立的 Extract 订阅)会带来没人预料到的账单惊喜。
- 积分倍率让真实成本比宣传价高出 5–9 倍。
- 反爬表现垫底:在 Proxyway 基准测试中排名最后( vs. 最高 93.14%)。
- Agent 模式消耗不可预测,而且没有运行前成本预估器。
- 失败请求仍会扣积分——在不稳定的网站上会浪费 20–30%。
- 自托管版本缺少 Agent、Browser Sandbox、Fire-engine 反爬和仪表盘。
- 没有原生 CAPTCHA 识别——相比 Bright Data 和 Zyte,这是明显短板。
- 对非技术用户不友好——需要编码和 API 知识。
- 免费套餐的 500 credits 是终身额度,不是每月刷新,测试价值有限。
不只是开发者工具:Firecrawl 评测里很少提到的无代码替代方案
我看过的每一篇 Firecrawl 评测,几乎都只拿它和其他开发者工具对比——Crawl4AI、Scrapy、Playwright、Apify。这个对比方式对开发者来说没问题,但在搜索网页抓取解决方案的人里,有很大一部分其实不是开发者:销售团队要建潜客名单、电商运营要监控竞品价格、营销人员要收集内容数据、房产经纪要追踪房源。
这部分需求,值得单独拿出来说。
Firecrawl 替代方案对比表
| 工具 | 最适合谁 | 需要写代码吗? | 适合 LLM 的输出 | 起步价格 |
|---|---|---|---|---|
| Firecrawl | 构建 AI 应用的开发者 | 是(API) | ✅ Markdown/JSON | $19/月 |
| Crawl4AI | 想要免费 / 开源方案的开发者 | 是(Python) | ✅ Markdown | 免费 |
| Apify | 需要规模化和市场生态的开发者 | 是(SDK) | ⚠️ 需配置 | $39/月 |
| Thunderbit | 业务用户(无代码) | 否(Chrome 扩展) | ✅ 结构化数据 | 有免费套餐 |
| ScrapingBee | 需要代理能力的开发者 | 是(API) | ❌ 原始 HTML | $49/月 |
| Bright Data | 企业级数据团队 | 是(API/SDK) | ⚠️ 需配置 | $500+/月 |
为什么 Thunderbit 更适合非技术团队
我在 Thunderbit 团队工作,所以我会保持透明。Thunderbit 应该出现在这个对比里,因为它解决的是另一类问题、面向的是另一类人,而且完全不需要写代码。
Thunderbit 的工作流只有两步:打开 ,点击“AI Suggest Fields”,然后点击“Scrape”。AI 会读取页面、自动建议合适的字段,并把结构化数据提取成表格。不需要 API key,不需要选择器,不需要编码。你可以免费导出到 Excel、Google Sheets、Airtable 或 Notion。
对业务用户来说,Thunderbit 的几个关键优势是:
- 子页面增强——点进详情页后,自动抓取更多字段
- AI 能适应页面布局变化——网站改版后通常不用维护
- 内置数据标注和翻译——适合多语言数据集
- 热门网站的即用模板——例如 Amazon、Zillow、LinkedIn 等
如果你是开发者、想找一个 API 替代方案,Thunderbit 也提供 ,定价比 Firecrawl 那套双重积分/token 机制更简单。它不会取代 Firecrawl 在 LLM 流水线开发中的位置。但对于销售、电商、营销和运营团队来说,如果你要的是结构化数据而不是自己写代码,Thunderbit 会更快,也更省钱。
自建还是购买:Firecrawl 什么时候值得,什么时候不值?
“我本来想自己写个网页爬虫……可能比 Firecrawl 简单点,至少更便宜。”很多用户都会这么想。与其靠感觉判断,不如直接给你一个结构化决策框架。
决策框架表
| 因素 | 自建方案(Scrapy/Playwright) | 购买 Firecrawl Cloud | 使用 Thunderbit(无代码) |
|---|---|---|---|
| 配置时间 | 10–40+ 小时 | 约 30 分钟 | 约 5 分钟 |
| 持续维护 | 高(选择器容易失效) | 几乎没有(托管) | 零维护(AI 自适应) |
| 反爬处理 | 手动(代理、请求头、重试) | 内置(部分有效——对高防护网站较弱) | 内置(浏览器 + 云端模式) |
| 1K 页/月成本 | $50–150(服务器 + 代理) | $19–$108(取决于功能) | $0–$15 |
| 50K 页/月成本 | $500–$1,500(基础设施) | $399–$1,138 | $39–$249 |
| 适合 LLM 的输出 | 需要自定义代码 | 内置(markdown/JSON) | 结构化表格(可导出) |
| 最适合 | 完全控制、冷门网站、DevOps 团队 | AI/LLM 开发者、RAG 流水线 | 销售、电商、营销、运营 |
对大多数组织来说,自建方案在三年内通常会比直接用 API 贵 。真正会出现“自建更便宜”的交叉点,大概是在每月 1,000 万页以上——这个规模,其实很少有团队能做到。
说实话:哪条路更适合你?
Firecrawl 值得付费的情况:
- 你的团队本来就用 Python/JS 编码,并且需要给 LLM/RAG 流水线输出干净的 markdown
- 你的目标网站大多没有强反爬,或者只有轻度防护
- 你想要托管基础设施,但不想自己扛 DevOps 负担
- 月访问量大概在 5 万页以内
Firecrawl 不值得付费的情况:
- 你是业务用户,没有开发团队,但要做数据提取 → Thunderbit 更简单、更快
- 你的目标网站防护很强(Amazon、LinkedIn、Cloudflare 重度防护站)→ 用 Bright Data 或 Zyte
- 你需要规模化下可预测的账单 → 积分倍率会让成本很难预估
- 你想自托管并保留全部功能 → Agent、Browser Sandbox、Fire-engine 都只在云端
只有在以下情况,自建才真的合理:
- 你们有专门的 DevOps 能力
- 你们规模特别大(每月 1,000 万页以上)
- 你需要对冷门或奇怪的网站做完全控制
- 你能接受持续维护选择器
Firecrawl 评测:并排对比表
下面把所有信息放在一起看:
| 工具 | 类型 | 最适合 | 需要写代码 | 反爬处理 | 适合 LLM 的输出 | 支持自托管 | 起步价格 |
|---|---|---|---|---|---|---|---|
| Firecrawl | API | AI/LLM 开发者 | 是 | 对高防护站点较弱 | ✅ Markdown/JSON | ✅(有限) | $19/月 |
| Crawl4AI | Python 库 | 开源优先开发者 | 是 | 无(需自己实现) | ✅ Markdown | ✅ | 免费 |
| Apify | 云平台 | 规模化 + 市场生态 | 是 | 中等 | ⚠️ 需配置 | ✅ | $39/月 |
| Thunderbit | Chrome 扩展 + API | 业务用户、无代码 | 否 | 内置 | ✅ 结构化数据 | ❌ | 有免费套餐 |
| ScrapingBee | API | 以代理为核心的开发者 | 是 | 强 | ❌ 原始 HTML | ❌ | $49/月 |
| Bright Data | API + 代理网络 | 企业数据团队 | 是 | 最强(约 99.9%) | ⚠️ 需配置 | ❌ | $500+/月 |
最终结论:Firecrawl 值不值得?
Firecrawl 是个很扎实的工具,但它适合的使用场景很明确:面向正在做 LLM 应用、RAG 流水线或 AI Agent 的开发团队,需要在中等规模下拿到干净网页数据,而且习惯 API 工作流。它的 markdown 输出质量确实是一线水平,框架集成(LangChain、LlamaIndex、CrewAI)也很成熟。如果你的团队本来就用 Python 或 JavaScript,而且目标网站没有太强的反爬,Firecrawl 确实能帮你省下不少工程时间。
但它的问题也是真问题。双重定价体系(积分 + 独立的 Extract 订阅)会带来意料之外的账单。对受保护网站只有 ,说明你不能指望它稳定抓 Amazon、LinkedIn 或 Cloudflare 防护很强的站点。自托管版本缺少的功能太多,没法当成真正免费的替代方案。而如果你是非技术用户——比如销售、电商或营销岗位的人——Firecrawl 根本不是为你设计的。
你可以先试试 Firecrawl 免费的 500 credits,看看输出质量是否适合你的流程。但在付费之前,最好先用上面的计算方式把真实月成本算清楚。如果你只是想从网站拿到结构化数据,而且不想写代码,那就先从 开始——你会在几分钟内开始提取数据,而不是几个小时。你现在就可以试试 ,或者去看看 是否更适合你的团队规模。想看视频演示的话,可以去 看一步一步的教程。
常见问题
Firecrawl 抓一页要多少钱?
基础 Scrape 或 Crawl 每页消耗 1 个 credit。JSON 提取会额外增加 4 个 credits/页(总计 5 个)。Enhanced Mode 还会再加 4 个(总计最高 9 个)。Search 每 10 个结果消耗 2 个 credits,而 Agent 模式每次查询可能消耗 100–1,500+ 个 credits。除此之外,Extract 功能还需要单独的 token 订阅,起价 $89/月。要看更贴近实际的估算,可以参考上面的成本计算表。
Firecrawl 可以免费自托管吗?
可以,开源核心(AGPL-3.0)可以免费自托管。但你会失去 Agent 模式、浏览器沙盒、反爬/代理轮换(Fire-engine 是闭源的)、批处理和管理面板。提取功能还需要你自己提供 LLM keys,并自行维护 Docker、PostgreSQL 和 Redis。自托管适合做基础的 crawl-to-markdown 流水线,但到了生产规模,它不能替代云端产品。
Firecrawl 适合抓 Amazon、LinkedIn 或其他高防护网站吗?
显示,Firecrawl 在高强度反爬网站上的成功率只有 33.69%,在 10 家测试供应商中垫底。它在未受保护的页面上表现不错(博客、文档站、SaaS 网站——成功率 85–98%),但对大型电商或社交平台并不可靠。面对这些目标,建议考虑 Bright Data 或 Zyte 这类专门的反爬服务,或者直接用 Thunderbit 这类会在后台自动处理反爬的无代码工具。
对非技术用户来说,Firecrawl 最好的替代方案是什么?
是最好的无代码替代方案。它是一个 Chrome 扩展,你只需要点击“AI Suggest Fields”,再点“Scrape”——不需要 API 调用、不需要编码、不需要选择器。数据可以免费导出到 Excel、Google Sheets、Airtable 或 Notion。它就是为销售、电商、营销和运营团队设计的,适合那些需要结构化网页数据但没有开发者支持的人。
Firecrawl 有免费试用吗?
Firecrawl 会提供 ,不需要信用卡。这个额度足够你在少量页面上测试基础的 scrape/crawl 功能,但不足以用于生产环境——尤其是在启用提取功能时(每页会消耗 5 个 credits)。免费套餐的 credits 不会每月刷新。
了解更多