如何在抓取时绕过 Cloudflare（2026 年仍然有效的方法）

上周，我花了 40 分钟调试一个本来完全正常的 Python 脚本。它在三个测试网站上都跑得很好，直到我发现第四个网站背后挂着 Cloudflare。爬虫一直卡在“正在检查您的浏览器…”页面，最后只拿回一堆 challenge 的 HTML。是不是很熟悉？

如果你也撞上过这堵墙，你并不孤单。如今，网络上有在使用 Cloudflare，约占互联网全部网站的。这让 Cloudflare 成为几乎所有网页数据采集场景里最常见的拦路虎——无论你是做线索开发、价格监控、房产研究，还是竞品分析。

问题在于，大多数指南只是把各种绕过方法平铺直叙地列出来，却不告诉你“在你的场景下，应该先试哪一种”。这篇文章采用了不同的思路：按优先级排序的决策树、诚实的可靠性预估，以及很多文章完全忽略的无代码方案。

难度： 初级到中级（取决于你使用的方法）
所需时间： 无代码路径约 10–30 分钟；代码方案视情况而定
你需要准备： Chrome 浏览器（无代码路径必备），可选 Python 3.9+（代码方案），以及目标 URL

什么是 Cloudflare 防护（为什么它会拦住你的爬虫）？

Cloudflare 本质上是一个反向代理，位于访问者和网站源服务器之间。每个请求都会先经过 Cloudflare 的边缘节点，再由它决定是正常放行、发起验证，还是直接拦截。关键要明白的是：Cloudflare 并不一定要“知道”你的爬虫是恶意的，它只需要判断你的请求足够自动化或可疑就行。

Cloudflare 的采用的是分层识别机制——不是一道锁，而是一整套安全检查。它会综合判断 IP 信誉、HTTP 请求头、TLS 指纹、JavaScript 执行能力、浏览器指纹，以及行为模式。当你的 Python requests 库向受 Cloudflare 保护的页面发送 GET 请求时，它会在多个层面同时失分：TLS 握手不对、不会执行 JavaScript、没有 cookies、也没有浏览器指纹。所以，过去那种简单伪造请求头的做法早就不管用了。

你最常遇到的症状包括：403 Forbidden、503 且显示“Checking your browser…”、1020 Access Denied、无限循环验证、永远过不去的 Turnstile 组件，以及你本来期待 JSON 结果却拿到的 HTML 验证页。

被动检测：Cloudflare 在页面加载前就会检查什么

在你真正看到页面之前，Cloudflare 的被动检测层就已经给你的请求打分了：

IP 信誉： 数据中心 IP、云主机网段、以及已知代理出口都容易被标记。住宅 IP 和移动网络 IP 。2026 年的社区反馈普遍显示：本地住宅网络浏览通常能过，但 Docker 或 VPS 环境经常被拦。
HTTP 请求头分析： Cloudflare 会比对你的 User-Agent、Accept-Language、请求头顺序和 HTTP 版本。比如你声称自己是 Chrome 136，但 TLS 握手暴露出明显的“Python”特征，这就很容易穿帮。
TLS 指纹（JA3/JA4）： 在 TLS 握手过程中，客户端会暴露支持的加密套件、扩展和协议偏好等模式。会把这些压缩成一个标识。真实的 Chrome 和 Python requests 脚本留下的“形状”差异非常大。
HTTP/2 指纹： 浏览器和 HTTP 库在 HTTP/2 的 SETTINGS 帧、伪首部顺序、优先级行为等方面都有区别。Cloudflare 的不只看单次请求身份，还会追踪一段时间内的请求模式。
AI Labyrinth： 这是 Cloudflare 较新的陷阱。它不会直接封死可疑爬虫，而是，这些页面看起来很像真的，但实际上只是在消耗爬虫资源。你的爬虫甚至未必意识到自己已经中招。

主动检测：在浏览器里运行的挑战

如果被动检查还不能下结论，Cloudflare 就会升级到主动挑战：

JavaScript 挑战： 经典的“Checking your browser…”中间页。Cloudflare 的会运行不可见脚本来识别自动化请求。
Turnstile： Cloudflare 对 CAPTCHA 的替代方案。包括 Managed、Non-Interactive 和 Invisible。它会分析鼠标移动、浏览器环境、TLS 指纹等信息，而且不一定会显示明显的题目。
Canvas 和 WebGL 指纹： 这些检查会识别无头浏览器与真实浏览器在渲染上的差异。
行为信号： 请求间隔、滚动模式、点击顺序。一个 3 秒内抓完 50 个页面、完全没有鼠标动作的爬虫，看起来根本不像人。

实际结论是：如果 Cloudflare 已经升级到主动挑战，像 requests、httpx，甚至 curl_cffi 这类纯 HTTP 客户端都过不去。你需要的是能运行真实浏览器环境的方案。

Cloudflare 防护等级：为什么同一段脚本在一个网站能跑，在另一个网站却失效

这恰恰是很多绕过指南漏掉的核心。Cloudflare 的防护并不是统一的。一个使用 Cloudflare 免费版、Security Level 设为 Medium 的网站，和一个启用了 Bot Management 与 Turnstile 的 Enterprise 站点，难度完全不是一个量级。同一段脚本能轻松穿过前者，却会在后者面前撞墙。

Cloudflare 等级	常见防护	绕过难度	通常有效的方法
免费版（低安全级别）	Bot Fight Mode、基础 WAF 规则、IP 信誉检测	⭐ 低	识别内部 API、带正确请求头的 `curl_cffi`、真实浏览器会话
Pro 版（中等）	Super Bot Fight Mode、Managed Challenge、JavaScript 检测	⭐⭐ 中等	真实浏览器会话、隐身浏览器自动化、住宅代理
Business	更强的 WAF、Bot Analytics、对关键路径使用更严格的挑战	⭐⭐⭐ 中高	基于浏览器会话的数据提取、会话持久化、住宅/移动代理、付费抓取 API
Enterprise / Bot Management	Bot 分数、JA3/JA4 字段、按端点规则、Turnstile、AI Labyrinth	⭐⭐⭐⭐ 高	内部 API（如果可访问）、真实用户会话工具、企业级抓取 API

显示：Free 为 $0，Pro 为每月 $20，Business 为每月 $200，Enterprise 则按定制报价。是免费版里的简单开关；为 Pro/Business 增加了更多控制；Enterprise 的 Bot Management 则加入了更细粒度的 bot 分数和按端点规则。

如何粗略判断你面对的是哪个等级： 如果你看到的是带 Cloudflare 品牌的 403 拦截页，而且没有 challenge 脚本，通常意味着 WAF 或指纹识别直接拒绝了你。若页面里出现 cf-turnstile div，或者加载了 challenges.cloudflare.com/turnstile/v0/api.js，说明是 Turnstile。若出现“Checking your browser”中间页，则是 Managed Challenge。首页能打开，但某些具体路径失败，通常说明是该路径上单独配置了 WAF 或 Bot Management 规则。

在选择方法之前，先确认防护等级。这样能省下几个小时的排错时间。

绕过 Cloudflare 的“先试这个”决策树

不要盲目乱试，按照优先级来。先从最简单、最稳定的方法开始，只有必要时才往下升级：

步骤	优先尝试	原因	失败后下一步
1	查找内部/未公开 API	直接绕开 Cloudflare；最快、最稳	第 2 步
2	使用内置浏览器渲染的无代码工具（例如 Thunderbit）	无需配置，自动处理 JS 挑战	第 3 步
3	TLS 指纹模拟（`curl_cffi`）	快、轻量、不需要浏览器	第 4 步
4	隐身浏览器自动化（SeleniumBase UC / Puppeteer stealth）	能处理 JS 挑战和指纹识别	第 5 步
5	FlareSolverr + Docker	开源、适合服务器环境	第 6 步
6	付费抓取 API（ScrapingBee、ZenRows、Scrapfly 等）	直接把对抗成本外包出去	—

ig_032f01f85482924d016a195f104f4c819687991b1a00dd05b0_compressed.webp

逻辑很简单：先用免费、低投入的方法，再考虑代码量大或付费的方案。你可以直接跳到最符合你情况的那一步。

一份声称，curl_cffi 在测试的 20 个域名中通过了 16 个（80%），FlareSolverr 的覆盖率大约在 55–70%，而付费代理聚合服务的平均成功率接近 97%——但同一线程也提醒，这些数字会随着 Cloudflare 更新而波动。请把所有成功率都当作参考趋势，而不是绝对保证。

第 1 步：绕开正面冲突——先找 Cloudflare 背后的内部 API

我看到过四个不同的论坛帖子都推荐：与其硬碰 Cloudflare，不如先找网站内部 API。说实话，这也是最聪明的第一步。如果网站有内部 API，那你就等于完全绕过了 Cloudflare——不需要花招、不需要伪造指纹、更不需要隐身插件。

可以按这个系统流程来找：

打开 Chrome DevTools → 进入 Network 面板 → 按 XHR/Fetch 过滤。
和页面交互：搜索、筛选、翻页、滚动。观察 Network 面板里是否出现 JSON 响应。
检查请求 URL 和请求头。 很多时候，API 端点的防护比前端页面更弱，甚至没有 Cloudflare 保护。
右键请求 → Copy → Copy as cURL。 把它贴到终端或 Postman 里测试。
把请求复现到 Python（使用 requests 或 curl_cffi），并保持相同的请求头、cookies 和查询参数。

如果 API 返回的是结构化 JSON，你甚至可能根本不需要传统爬虫。就描述了类似场景：一位用户即使使用 curl_cffi 仍被 Cloudflare 拦住，最后真正可行的办法是直接拦截 API 响应。

实用技巧： 当 cURL 复制版本能跑通后，可以开始删掉不必要的请求头。像 sec-ch-ua、cookies、CSRF token 和 referer 这类字段可能必须保留，但浏览器缓存控制头通常不需要。若从浏览器 cURL 迁移到代码，记得让 TLS 指纹与 User-Agent 保持一致。

局限： 不是每个网站都有可访问的 API。有些 API 需要登录、CSRF token、签名参数，或者依赖会话 cookie。不过一旦能用，这就是接近 99% 成功率、几乎零维护的方法。

第 2 步：无代码路径——用浏览器扩展绕过 Cloudflare（Thunderbit）

很多同类指南默认读者会写 Python 或 JavaScript。但这个关键词同样会吸引销售团队去建线索名单、电商运营去监控竞品价格、房地产分析师去提取房源数据。这些人并不想搭 Docker 容器。

像这样的 Chrome 扩展天然就能处理很多 Cloudflare 检测，因为它是在你的真实浏览器会话里运行的。它继承的是 Chrome 真实的 TLS 指纹、你的 cookies、登录状态和行为信号——这些正是 Cloudflare 最信任的东西。不需要隐身插件、不需要 xvfb-run、也不用敲命令行。

操作步骤

从 Chrome 网上应用店安装。
在 Chrome 中打开受 Cloudflare 保护的页面。如果 Cloudflare 要求验证，就像正常用户一样完成它——点 Turnstile 复选框，等“Checking your browser”页面消失即可。你是在真实浏览器里操作的真实用户，Cloudflare 会放行。
在 Thunderbit 侧边栏点击 “AI Suggest Fields”。AI 会扫描页面并建议字段列，比如“产品名称”“价格”“评分”，或者其他你需要的内容。
检查系统建议的字段。删掉不需要的，或者用自然语言描述你想要什么来添加自定义字段。
点击 “Scrape”。Thunderbit 会提取当前可见页面的数据。
导出到 Google Sheets、Excel、Airtable、Notion、CSV 或 JSON。

对于分页网站，Thunderbit 同时支持点击分页和无限滚动。对于详情页场景（比如你手上有一批产品链接，想提取每个单独页面的规格信息），可以使用 ——Thunderbit 会逐个访问详情页并补全你的表格。

按我的经验，针对一个常见的 50–100 行数据集，从安装到导出表格大约只要 5–10 分钟。

浏览器抓取什么时候最合适，什么时候不合适

我也想坦诚说说它的限制。浏览器抓取受限于你的会话速度，最适合中等规模任务——几百页到几千页。如果你需要按计划抓取上百万页面，那还是应该考虑代码方案或 API 方案。

Thunderbit 的 Cloud Scraping 选项可以提速，对公开可访问的网站一次最多抓取 50 个页面。对于开发者工作流或更大规模任务，Thunderbit 的可处理 JavaScript 渲染、反爬防护和代理轮换，并支持每次批量处理最多。

但如果你是业务用户，只是抓线索、价格数据或房源信息，而且规模在合理范围内？这通常就是你唯一需要的方法。无需代码、无需代理、无需维护。

第 3 步：使用 `curl_cffi` 进行 TLS 指纹伪装（轻量级代码方案）

如果你会写 Python，而且无代码方案不适合你的工作流，那么是最轻量的代码选择。它是基于 libcurl 的 Python 封装，可以伪装真实浏览器的 TLS 指纹。和 requests 或 httpx 不同，它发出的 TLS 握手更像来自 Chrome 或 Safari。

截至 2026 年，包括 chrome136、safari184 以及许多历史版本配置。这个库在，说明它仍在持续维护。

适用场景： 使用免费版或 Pro 级别 Cloudflare 防护、主要依赖被动指纹识别的网站——没有主动 JavaScript challenge，也没有 Turnstile。

基础示例：

1from curl_cffi import requests
2url = "https://example.com/products"
3resp = requests.get(
4    url,
5    impersonate="chrome136",
6    headers={
7        "accept": "text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8",
8        "accept-language": "en-US,en;q=0.9",
9    },
10    timeout=30,
11)
12print(resp.status_code)
13print(resp.text[:500])

一个常见坑： User-Agent 要和你模拟的目标保持一致。如果你在伪装 Chrome 136，就不要发 Chrome 120 的 User-Agent。这个不一致本身就是信号。

局限： curl_cffi 不执行 JavaScript。如果网站返回的是“Checking your browser”挑战页或 Turnstile 组件，这种方法就会失败。对于需要浏览器挑战后生成 cookie 会话状态的网站，它也不适用。你可以把它理解成一个快速、便宜、只适合被动防护的首选尝试。

同类替代方案： tls-client 和 curl-impersonate 也提供类似的 TLS 指纹模拟能力。

第 4 步：隐身浏览器自动化（Puppeteer Stealth 和 SeleniumBase UC）

当网站需要 JavaScript 执行、主动挑战或 Turnstile 时，TLS 伪装就不够用了。这时你需要完整浏览器。主要有两种方案：

SeleniumBase UC Mode（Python）：可以让自动化看起来更像真人，从而绕开反爬服务。文档里还包含了处理 Cloudflare Turnstile 的示例。
Puppeteer + puppeteer-extra-plugin-stealth（Node.js）：虽然仍然很常用，但在。社区反馈提到，CDP（Chrome DevTools Protocol）检测标记和浏览器配置不一致都会导致失败。

这两种工具都会启动真实的 Chromium 浏览器，但会修补可被识别的自动化信号：navigator.webdriver、WebGL 元数据、插件列表等等。

真正重要的配置建议：

使用有界面模式（不要用 headless）。SeleniumBase 文档提醒，UC Mode 在 headless 模式下更容易被检测到。在 Linux 服务器上可用虚拟显示器。
随机化视口大小和 User-Agent，但要保证它们彼此一致，也和代理地理位置匹配。
在动作之间加入真实延迟。 页面之间只隔 200ms，看起来就是机器人。
在通过初始挑战后保留 cookies 和浏览器配置文件。 不要每次请求都重新解一次挑战。
配合住宅代理使用，IP 信誉会更好。

这种方案的风险在于维护成本。浏览器自动化栈会在 Chrome 更新、Cloudflare 增加新信号、隐身插件更新滞后，或者目标站点加上按路径的 Turnstile 时不断失效。发现，很多隐身浏览器组合会因为“拼凑式指纹”而在指纹测试中失败——比如时区、语言、代理地理位置彼此不一致。

这个方法很强，但运维成本也高。你要预留持续修复的时间。

代理轮换：为什么 IP 和指纹同样重要

即使浏览器隐身做得很好，如果你从同一个 IP 发太多请求，还是会触发限流。Cloudflare 对住宅和移动 IP 的信任，远高于数据中心 IP。

住宅代理： 2026 年入门量级大约是。更受信任，但也更贵。
数据中心代理： 更便宜，但在。
轮换策略： 按会话轮换，不要按请求轮换。按请求换 IP 会破坏会话 cookie 和 cf_clearance。同一个会话里要保持 IP、cookies 和指纹一致。

并不存在什么“最小代理池规模”的魔法数字。低频线索抓取可能只需要少量稳定的住宅会话；高频价格监控则可能需要数百个出口再加重试逻辑。

第 5 步：FlareSolverr——开源的 Cloudflare 绕过服务器

是一个开源代理服务器，它在 Docker 容器里使用带 undetected-chromedriver 的 Chromium 来解决 Cloudflare 挑战，并返回可复用的 cookies/headers。它在，说明项目仍在活跃维护。

适用场景： 服务器端抓取流水线，需要一个持续运行的挑战解决服务——比如每天夜里跑一次的自动任务，需要新的 cf_clearance cookies。

工作方式： 你的爬虫把 URL 发给 FlareSolverr 的 API。FlareSolverr 在浏览器里打开页面，尝试解决挑战，并返回 HTML 和 cookies。之后你就可以在常规 HTTP 客户端里复用这些 cookies，继续发起后续请求。

搭建概览： 使用 Docker Compose 启动容器，然后向本地 API 端点发送 POST 请求。。

需要提前说明的限制：

不能稳定处理交互式 Turnstile 挑战或 Enterprise Bot Management。
和显示它的表现并不稳定：挑战识别漏判、Turnstile 超时、页面崩溃等问题都存在。
需要 Docker 基础设施和持续维护。
资源消耗较大——每次解决挑战都会启动一个浏览器上下文。

估计可靠性：在中等防护目标上约 60–80%；Enterprise 防护更低，简单挑战页则更高。如果 FlareSolverr 仍然不行，就该考虑付费 API 了。

第 6 步：由付费抓取 API 帮你处理 Cloudflare

有时候，账算下来就是这么简单：维护自己的隐身基础设施，人工成本比订阅费高得多。付费抓取 API 会把整场对抗外包给专门提供商——你只要发一个 URL，剩下的指纹识别、代理、挑战解决和重试都由它们处理。

比较时可以看这些维度：

服务商	Cloudflare 支持	JS 渲染	住宅代理	结构化输出	计费方式
ScrapingBee	支持	支持	支持	仅 HTML	按请求积分
ZenRows	支持（宣称成功率 >99%）	支持	支持（高级套餐）	HTML，部分解析	按 CPM，带倍率
Scrapfly	支持（列出 CF、Akamai、DataDome）	支持	支持	HTML，部分解析	按积分计费
Browserless	支持	支持（无头 Chrome）	支持（内置）	HTML、截图	按单元计费
Thunderbit API	支持	支持	支持	通过 AI schema 输出结构化 JSON/CSV	免费额度 + 付费套餐

什么时候值得用： 高并发抓取、需要企业级稳定性，或者你的团队不想维护抓取基础设施。价格大致在每月 $30–$500+，小到中等规模的使用会落在这个区间；企业级用量则更高。

Thunderbit API 值得单独提一下，因为它输出的是结构化数据，而不仅仅是原始 HTML。它的每次可批量处理最多 50 个 URL，并根据 AI 驱动的 schema 返回 JSON/CSV——如果你想直接拿到可分析的数据，而不是自己再去解析 HTML，这会特别有用。

诚实的可靠性榜单：到底什么能用，什么会坏

我在 2025–2026 年持续跟踪社区反馈、GitHub issue 和厂商宣称。下面是一个比较坦诚的对照表。这些都是方向性估计，不是实验室基准：

方法	估计成功率	维护成本	容易失效的情况	成本区间
内部 API（如果存在）	~90–99%	低	API 改版、增加认证、令牌变成签名形式	免费
浏览器扩展（Thunderbit）	~85–95%（真实会话）	低（AI 会适应布局变化）	站点要求特殊认证流程、按动作触发的 Turnstile 很激进	有免费额度
`curl_cffi` / TLS 伪装	~70–85%	中（需要更新指纹）	Cloudflare 调整 JA3 检测、需要主动 JS 挑战	免费
Puppeteer + stealth 插件	~70–90%	高（插件更新常常滞后）	CDP 检测、新指纹信号、headless 检测	免费 + 代理成本
FlareSolverr	~60–80%	高（Docker、依赖漂移）	Enterprise 级防护、Turnstile 交互	免费 + 基础设施成本
付费抓取 API	~85–95%	低（由服务商维护）	服务商未及时更新；预算超支	约 $30–500+/月

最重要的不是“成功率”这一列，而是“容易失效的情况”。每种方法都有自己的失败模式。最好的策略是：为你的目标选择成本最低、最可能成功的方法，并准备一个备用方案。

没有永久解决方案。Cloudflare 会持续更新，这场攻防战是真实存在的。

如何尽量不被 Cloudflare 盯上（无论你用哪种方法）

不管你选哪种方法，下面这些习惯都能让你更久地避开 Cloudflare 的注意：

尊重速率限制。 请求之间加入真实延迟——模拟用户浏览时，建议至少 2–5 秒。用机器速度猛砸网站，最快就会被封。
保持指纹一致。 User-Agent、TLS 指纹、浏览器版本、时区、语言环境和 IP 地理位置都应该讲同一个故事。比如从德国 IP 发出 Chrome 136 的 User-Agent，却配着 en-US locale 和 Python TLS 握手，这就前后矛盾了。
在通过挑战后复用 cookies 和会话。 不要每次请求都重新解题。
不要在会话中途切换 IP。 Cloudflare 会追踪会话连续性。
在使用场景和预算允许时，优先用住宅或移动 IP。
监控软封禁迹象： 你本来应该得到 JSON，却拿到 challenge HTML；表格为空；跳转到登录页；或者页面看起来像的诱饵页面。
避开流量高峰时段。 站点运营方可能会在高峰期收紧 WAF 规则。
建立备用路径： 先 API，再浏览器会话，最后才是付费服务商。

对 Thunderbit 用户来说，AI 能自动适应页面布局变化，所以你花在维护 CSS 选择器上的时间更少，真正用数据做事的时间更多。

关于法律与伦理的简要提醒

这不是本文重点，但太重要了，不能略过。

抓取公开可访问数据在某些情境下有 ——hiQ v. LinkedIn 的 CFAA 逻辑在最高法院发回重审后仍然成立，不过双方在 2022 年达成和解，整体情况仍然比较复杂。更近一些，2025 年，同年后期。

在欧盟，只要涉及个人数据，GDPR 就适用；而还对设定了具体义务。

一些实用的原则：

永远先查看网站的服务条款。
Cloudflare 防护本身就是一个信号，说明站点所有者希望控制自动化访问——请尊重这个意图。
没有合法依据时，避免收集个人数据。
对商业或大规模流程，优先考虑官方 API、授权数据，或在可行时获取书面许可。
如果拿不准，针对你的具体使用场景和司法辖区咨询法律顾问。

Thunderbit 的设计初衷是用于合规的商业场景——比如线索开发、价格监控、市场研究——数据来源是公开可访问的信息。

总结：先试什么，下一步试什么

这篇文章里最大的时间节省点，不是某个工具，也不是某段代码，而是在你开始之前先判断防护等级。光这一点，就能避免你花几个小时去调一个本来就不可能成功的方法。

从这里开始：

先检查有没有内部 API（免费、快速，而且经常被忽略）。
如果你是不写代码的业务用户，试试 ——你的真实浏览器会话，是对抗 Cloudflare 最强的资产。
如果你是开发者，而且目标只用了被动指纹识别，先试 curl_cffi。
只有在简单方案都失败时，再升级到隐身浏览器、FlareSolverr 或付费 API。

没有任何一种方法是永久有效的。把适合你规模的工具和备用方案组合起来，你就能少很多盯着 403 页面发呆的时间。

如果你想深入了解，我们在 Thunderbit 博客里还写过、和。如果你想看扩展的实际操作，也可以去看操作演示视频。

试用 Thunderbit AI 网页爬虫

如何在抓取时绕过 Cloudflare（2026 年仍然有效的方法）

什么是 Cloudflare 防护（为什么它会拦住你的爬虫）？

被动检测：Cloudflare 在页面加载前就会检查什么

主动检测：在浏览器里运行的挑战

Cloudflare 防护等级：为什么同一段脚本在一个网站能跑，在另一个网站却失效

绕过 Cloudflare 的“先试这个”决策树

第 1 步：绕开正面冲突——先找 Cloudflare 背后的内部 API

第 2 步：无代码路径——用浏览器扩展绕过 Cloudflare（Thunderbit）

操作步骤

浏览器抓取什么时候最合适，什么时候不合适

第 3 步：使用 `curl_cffi` 进行 TLS 指纹伪装（轻量级代码方案）

第 4 步：隐身浏览器自动化（Puppeteer Stealth 和 SeleniumBase UC）

代理轮换：为什么 IP 和指纹同样重要

第 5 步：FlareSolverr——开源的 Cloudflare 绕过服务器

第 6 步：由付费抓取 API 帮你处理 Cloudflare

诚实的可靠性榜单：到底什么能用，什么会坏

如何尽量不被 Cloudflare 盯上（无论你用哪种方法）

关于法律与伦理的简要提醒

总结：先试什么，下一步试什么

常见问题

1. 能完全绕过 Cloudflare 防护吗？

2. 抓取时绕过 Cloudflare 合法吗？

3. 不写代码，绕过 Cloudflare 最简单的方法是什么？

4. 为什么我的爬虫在一些 Cloudflare 网站能用，在另一些却不行？

5. Cloudflare 绕过方法多久会失效一次？

如何在抓取时绕过 Cloudflare（2026 年仍然有效的方法）

需要定制网页数据？

试试 Thunderbit