几个月前,我们的一位用户抛出一个问题,差点让我咖啡喝到一半停住:“如果我抓取酷澎公开的商品价格,会不会最后站上韩国法庭?” 老实说,我当时并没有一个足够笃定的一句话答案——我在网上找到的大多数法律指南也是这样。
这个问题一直让我记在心里,因为每周都有成千上万的电商运营、销售团队和 SaaS 创始人悄悄在 Google 上搜同一个问题。全球网页抓取服务市场在 2024 年规模约达 ,而且增长很快。越来越多企业在收集网页数据,也越来越多人想知道:在韩国,法律边界到底在哪。韩国并没有全面禁止抓取。
但会有四部主要法律根据你抓取的内容、方式和目的来适用。大家最常引用的标志性案例,是韩国最高法院的 Yanolja 判决(2021Do1533,2022 年 5 月 12 日作出):该案在刑事上宣告竞争对手的抓取工具无罪,但在另一路民事程序中,又判令同一公司赔偿约 10 亿韩元。对于非律师来说,这种“刑事无罪、民事照赔”的双重结果,是理解韩国抓取法律最重要的一点,也是这篇指南的核心。不需要法学学位——你只需要一套真正能用的实操风险框架。
**难度:**入门(无需法律或技术背景)
**所需时间:**约 15 分钟阅读;可长期参考
**你需要准备:**对网页抓取基本原理有个大概了解(如果你需要快速补课,可以看看我们关于的文章)
在韩国抓取网页合法吗?简短答案
网页抓取本身在韩国并不违法。它是一种中性技术——就像浏览器或者电子表格公式。韩国法院一直关注的不是工具本身,而是围绕它的使用行为。

最好的理解方式来自 Yanolja 最高法院判决:“门开 vs 门关”原则。如果一个网站没有客观的访问限制——没有登录墙、没有验证码、没有 API 密钥要求、没有 IP 封锁——那扇门就是“开着的”,访问公开可得的数据,通常并不构成韩国《信息通信网法》(ICNA)下的刑事犯罪。法院特别查看了“防护措施、使用条款以及其他客观可见的情况”是否限制了访问,并认定 Yanolja 的 API 服务器可以通过公开应用自由访问。
但“不是刑事犯罪”并不等于“零风险”。
民事责任是完全不同的问题。你可以避免被起诉,却仍然可能面对高达 10 亿韩元的赔偿判决。Yanolja 案把这一点说明得非常清楚。
韩国与网页抓取相关的四部法律是:
- ICNA(《信息通信网法》)——“禁止擅入”规则
- 《著作权法》——数据库制作者权利
- PIPA(《个人信息保护法》)——个人数据收集规则
- UCPA(《不正当竞争防止法》)——“别搭便车”的兜底条款
下面这篇指南会把这些法律映射到真实场景里,帮助你判断自己的抓取项目到底落在哪个区间。
韩国网页抓取的绿-黄-红风险框架

我找到的每一篇韩国抓取法律文章,读起来都像是写给律师看的。如果你是电商运营经理或 SaaS 创始人,你不需要一篇 40 页的法条分析——你需要的是在启动项目之前快速判断风险的方法。把它想成交通信号灯:绿色代表可以走(但要保持常规谨慎),黄色代表减速并观察,红色代表停下并找律师。
绿区:低风险抓取场景
This paragraph contains content that cannot be parsed and has been skipped.
Yanolja 的刑事判决就是这个区域的基准。最高法院认定并未构成 ICNA 侵入,因为 API 服务器可以自由访问——普通用户无论是否注册,都能通过应用访问,而且没有额外防护措施阻挡 API 访问。
对于 用户来说,这正是最适合的场景。如果你使用云端抓取模式抓取公开的电商或房产页面——收集商品名称、价格、库存或列表元数据,同时排除个人信息字段——你通常就在绿区内。(不过,“通常”不等于“永远”,下面我会解释细节。)
黄区:中等风险抓取场景
This paragraph contains content that cannot be parsed and has been skipped.
个人信息是最常触发黄区的因素。
即使电话号码或邮箱出现在公开网页上,PIPA 仍然适用。2023 年的 PIPA 修法扩大了数据主体权利,并收紧了同意要求。到 2024 年,韩国个人信息保护委员会(PIPC)又发布了专门针对的指引,明确说明:仅仅因为信息公开可访问,并不等于可以随意采集。
数据量也很重要。Yanolja 最高法院指出,判断是否复制了数据库的“实质部分”,要同时看数量因素和质量因素。要把复制部分与整个数据库相比,还要看它是否反映了制作者的重大投入。
红区:高风险抓取场景
| 场景 | 风险等级 | 关键法律 | 原因 |
|---|---|---|---|
| 在登录墙后抓取,或绕过访问控制 | 🔴 高 | ICNA 第 48 条 | “门是关着的” = 未经授权访问;起诉风险高 |
| 绕过验证码、IP 封禁或机器人检测系统 | 🔴 高 | ICNA 第 48 条第 4 款 | 2024 年修法专门针对绕过工具/设备 |
| 复制并转售竞争对手的完整数据库 | 🔴 高 | 《著作权法》(数据库权利)、UCPA | 实质性复制 + 商业搭便车 |
| 在没有法律依据的情况下收集个人信息用于营销/外联 | 🔴 高 | PIPA | 最高可判 5 年 / 5000 万韩元罚金;行政罚款最高可达营收的 3% |
ICNA 在 2024 年新增了第 48 条第 4 款,明确禁止在没有正当理由的情况下安装、转让或分发能够绕过“正常防护或认证程序”的程序或技术设备。
另外,进一步强调:即便没有实体破坏防护措施,只要使用他人的识别信息或不当指令来规避访问限制,也可能构成未经授权的网络侵入。
适用于网页抓取的韩国四部法律
| 法律 | 保护内容 | 抓取场景中何时适用 |
|---|---|---|
| ICNA 第 48 条 | 网络稳定性、访问权限 | 绕过登录、验证码、认证、IP 封锁、API 密钥限制 |
| 《著作权法》(第 93 条) | 创作作品 + 数据库制作者权利 | 复制表达性内容、图片,或数据库全部/实质部分 |
| PIPA | 个人信息、数据主体权利 | 收集姓名、电话、邮箱、身份证号——即使来自公开页面 |
| UCPA(第 2 条第 1 款第 k、m 项) | 公平竞争、具有商业价值的数据 | 为自己的竞争业务免费搭另一平台的数据投入成果 |
ICNA 第 48 条:“禁止擅入”规则
ICNA 第 48 条第 1 款规定,任何人不得“未经正当访问权限或超出许可访问权限”侵入信息通信网络。换成抓取语境就是:如果网站存在你绕过的访问限制,那就可能违法;如果没有限制——公开页面、无需登录——通常问题不大。
违反该条的处罚,依据 ICNA 第 71 条,最高可判 。
还有一个值得注意的细节:韩国最高法院一直把服务条款限制与访问限制区分开来。Yanolja 应用的条款限制商业再利用,并禁止给服务器造成负担的自动程序,但法院认定这些条款并没有在客观上限制对 API 服务器本身的访问。
《著作权法》:数据库制作者权利
韩国《著作权法》会单独保护数据库制作者,而不仅仅是单个内容的著作权。根据,复制数据库的“全部或实质部分”是违法的——即便单个数据点只是公开事实。
判断标准既有数量因素(你复制了整体中的多少),也有质量因素(复制的部分是否反映了制作者在构建、核实或维护数据库上的重大投入)。如果你反复或系统性地复制较小部分,但实际效果等同于复制实质部分,也可能被认定违法。
侵犯数据库制作者权利的处罚:依据第 136 条第 2 款第 3 项,最高可判 3 年或 3000 万韩元罚金。第 125-2 条的法定赔偿规定允许每个作品最高 1000 万韩元;若属于故意营利侵权,每个作品最高可达 5000 万韩元。
PIPA:《个人信息保护法》
PIPA 管理个人数据的收集——姓名、联系方式、身份证号——即使这些信息是公开可见的。2023 年的修法意义重大:它扩大了数据主体权利,收紧了同意要求,引入了自动化决策规则,并对特定违规行为设定了最高可达的行政罚款。
PIPC 的直接提到,在公开个人信息的场景中,数据可能通过“网页爬取和抓取”获得。该指引说明,在某些情境下,合法利益可以作为依据之一,但组织仍然需要进行利益衡量、设置防护措施、保护权利并建立治理机制。
而且趋势还在继续收紧。2026 年 3 月,,把严重且重复的数据泄露失败的最高处罚提高到营收的 10%,并将在 2026 年晚些时候生效。
UCPA:不正当竞争的“兜底条款”
UCPA 就是 Yanolja 民事案中让 GC Company“中招”的那部法律。现行法中有两项与此相关的规定:
- 第 2 条第 1 款第 (k) 项:涵盖对非秘密、以电子方式积累和管理的技术或商业数据的不正当使用
- 第 2 条第 1 款第 (m) 项:更广泛的兜底条款,针对未经许可、违背公平商业惯例,为自己的业务使用他人通过重大投入或努力取得的成果
UCPA 的这两项规定只涉及民事责任——没有刑事处罚——但你可能会面临的禁令、第 5 条的赔偿,以及第 14-2 条规定的特定故意案件三倍赔偿。Yanolja 民事案就是依据这套框架判了约 10 亿韩元。
Yanolja 案:为什么你可以刑事无罪,却仍然民事败诉
这是韩国所有企业用户都必须理解的案子。我把它作为一个完整故事来讲,因为实际就是这么发生的——而且案件的“分裂结果”正是重点。
事情经过:GC Company 抓取了 Yanolja 的旅行数据
GC Company 运营着一个竞争性的在线旅行平台。他们开发了一个自制爬虫,访问 Yanolja 的 Baro Reservation 应用 API 服务器,识别出 API URL 和请求指令后发送到服务器。这个抓取工具收集了住宿信息——合作方名称、地址、价格、可用性和图片。GC Company 把这些数据用于内部营销和竞争定位。
Yanolja 随后同时提起了刑事控告和民事诉讼。
刑事判决:全部无罪(最高法院 2021Do1533)

最高法院于 2022 年 5 月 12 日,三项罪名全部不成立:
- ICNA 第 48 条(侵入):不存在访问限制。API 服务器可通过浏览器和移动应用公开访问,没有技术封锁。服务条款限制的是使用,不是访问。
- **《著作权法》(数据库制作者权利):**被告并没有复制数据库的“全部或实质部分”。被复制的数据本身已是公开信息,而且证据不足以证明复制部分反映了 Yanolja 的重大投入。
- **《刑法》第 314 条(业务妨碍):**没有证明 Yanolja 的 API 服务器运营受到实际干扰。数据也没有被篡改。不存在构成业务妨碍的主观故意。
一句最值得引用的规则是:访问限制必须结合“防护措施、使用条款以及其他客观可见的情况”来判断。如果门是开着的,走进去就不算擅入。
民事判决:依据 UCPA 赔偿 10 亿韩元
故事转折就在这里。首尔中央地方法院,随后首尔高等法院(案号 2021Na2034740,2022 年 8 月 25 日作出)认定 GC Company 违反了 UCPA 的兜底条款。法院判赔约 10 亿韩元(约合 80 万美元),并命令停止进一步的数据复制。
法院的理由是:Yanolja 的住宿数据库具有商业价值,反映了重大投入——包括收集、核实和更新住宿数据。GC Company 免费搭了这笔投入的便车。该民事判决在首尔高院层级最终生效。
实务结论:刑事无罪不等于民事安全
这是韩国抓取法律里最反直觉的一点。刑事上合法的访问,并不会自动免除商业上不公平的使用责任。“我会不会被起诉?”和“我会不会被别人告?”是两个不同的问题,而且答案可能相反。
对于企业用户来说:即便你的抓取方式在刑事层面明显处于绿区,你对数据的使用方式——尤其是是否直接与原数据源竞争——才决定你的民事风险。
韩国 vs 美国 vs 欧盟:网页抓取法律怎么比
我没找到另一篇把这件事放进一张表的指南——考虑到有这么多企业跨境抓取,这其实挺离谱的。
| 维度 | 韩国 | 美国 | 欧盟 / 欧洲经济区 |
|---|---|---|---|
| 核心法律 | ICNA 第 48 条,《著作权法》 | CFAA(18 U.S.C. §1030)、州法 | GDPR,数据库指令(96/9/EC) |
| 标志性案例 | Yanolja 诉 GC Company(最高法院 2021Do1533,2022) | hiQ 诉 LinkedIn(第九巡回,2022),Van Buren 诉美国(2021) | Ryanair 诉 PR Aviation(欧盟法院 C-30/14,2015) |
| 抓取公开数据 | 若无客观访问障碍则合法(“门开”) | 按 hiQ 思路合法(公开数据);Van Buren 收窄了 CFAA | 取决于数据库权利、合同、著作权、GDPR、成员国法律 |
| 个人数据规则 | PIPA(2023 年修订)——同意或其他法律依据 | 分领域:CCPA(加州)、各州隐私法 | GDPR——严格同意 / 合法利益;最高罚款2000 万欧元或全球营收 4% |
| 违反 ToS 就是犯罪吗? | 不是(法院认为 ToS ≠ ICNA 违法) | 不是(Van Buren 2021:ToS ≠ CFAA) | 一般不是,但可能构成违约(Ryanair) |
| 数据库保护 | 《著作权法》数据库制作者权利 | 没有联邦层面的数据库权利 | 特殊数据库权利 |
| 最重刑责 | 最高 5 年 / 5000 万韩元(ICNA) | 最高 10 年 / 25 万美元(CFAA) | 视成员国而定 |
对你的业务真正重要的差异
- **韩国没有像欧盟 DSM 指令那样的广泛文本与数据挖掘(TDM)例外。**如果你用抓取来的韩国数据训练 AI 模型,并没有法定豁免。
- **韩国的 UCPA 兜底条款比美国的不正当竞争法更宽,也更不可预测。**Yanolja 的民事结果如果放到美国法下,很难完全复刻。
- **三地共同认可的一点是:**仅仅违反服务条款,并不构成刑事犯罪。
- 韩国的数据库保护是成文法保护(和欧盟类似),而美国没有普遍适用的联邦数据库权利。这让韩国平台方在民事层面拥有更多工具。
- **如果你跨境抓取,适用的往往是最严格的法律。**一个同时涉及韩国、美国和欧盟数据的抓取项目,必须满足三套规则。
按行业细分:你的行业在韩国抓网页合法吗?
不同产业的风险画像差异很大,而我找遍了资料,也没看到哪篇指南把韩国抓取法律映射到具体行业。所以我自己把它整理了出来。
电商:价格监控与商品数据

抓取酷澎、Gmarket 或 11Street 的公开商品价格,是最干净的绿区案例——坚持只抓事实字段(价格、库存、商品名),避开仅登录可见区域,不绕过技术封锁,并把数据仅用于内部对标。
如果你抓取商品描述(创作内容 → 著作权)、卖家联系方式(PIPA)、图片(著作权)或整个目录(数据库制作者权利 + UCPA),风险就会明显上升。
我没有找到与 Yanolja 可比的韩国电商抓取头部诉讼。更成熟的判例主要出现在旅行和招聘领域——但没有诉讼,并不代表没有风险。
Thunderbit 的和云端抓取模式就是为这种场景设计的:定期检查公开页面上的价格和库存,AI 建议字段让你选择想要的列,同时排除个人信息字段。
房地产:房源列表
房地产天然就偏向黄区。像 Zigbang 或 Naver 房地产这类平台的房源信息,往往既包含事实数据(价格、面积、地段),也包含中介姓名、办公室电话、手机号码、照片,以及平台整理过的数据库。
抓取公开房源详情的风险相对较低。但一旦收集中介联系方式列,就会立刻触发 PIPA;而抓取某个地区的全部房源,开始看起来就像是在复制一个实质性数据库。
缓解措施:排除个人字段、缩小地理范围、书面记录正当商业目的、遵守请求频率限制,并避免复制竞争性房源服务。Thunderbit 的 AI 可以只提取你需要的房产字段——价格、面积、位置——同时跳过个人联系方式数据。
招聘:职位发布
招聘行业是高风险领域,没有之一。韩国有直接先例:JobKorea 诉 Saramin。Saramin 抓取了 JobKorea 的职位发布数据库,最终被认定侵犯了数据库权利和不正当竞争。招聘数据通常同时具备平台投入(经过整理和核实的列表)、大规模数据库复制,以及个人或招聘方联系方式。
我的建议是:一般不要去抓竞争对手的招聘平台来构建或丰富自己的职位数据库。如果用例确实很窄,先在采集前做法律审查,尽量减少数据量,移除个人联系方式,不要再分发结果。
完整处罚参考:在韩国抓网页出问题,你会面临什么
| 韩国法律 | 违规类型 | 最高刑事处罚 | 最高民事/行政救济 | 2023–2026 关键变化 |
|---|---|---|---|---|
| ICNA 第 48 条 | 未经授权访问 / 干扰 | 5 年 / 5000 万韩元罚金 | 赔偿 + 禁令 | 2024:新增第 48 条第 4 款,针对绕过工具 |
| 《著作权法》(数据库权利,第 93 条) | 实质性复制数据库 | 3 年 / 3000 万韩元罚金 | 法定赔偿最高可达每部作品 5000 万韩元(故意营利) | — |
| PIPA | 非法收集个人数据 | 5 年 / 5000 万韩元罚金 | 行政罚款最高可达总销售额 3%;也可能有集体诉讼 | 2023 修法;2024 公开数据 AI 指引;2026 趋势是重复泄露最高 10% |
| UCPA 第 2 条第 1 款第 (k)/(m) 项 | 不正当的数据获取 / 使用 | 仅民事责任(兜底条款无刑责) | 赔偿 + 禁令;特定故意案件可三倍赔偿 | 2022《数据框架法》强化相关规定 |
| 《刑法》第 314 条 | 通过技术手段妨碍业务 | 5 年 / 1500 万韩元罚金 | — | Yanolja:未证明实际干扰 |
关键点在于:刑事和民事程序是独立运行的。你可能同时面临两者——而且可能一边赢、一边输。
韩国网页抓取合规的 10 点检查清单
在开始任何抓取项目之前,先过一遍下面这 10 个是/否问题。你可以打印出来、收藏起来,贴在显示器上——怎么方便怎么来。
- 目标网站是否无需登录就能访问你想要的数据? 如果需要登录、令牌或账户,风险会迅速向 ICNA 第 48 条靠近。
- 是否不存在技术访问限制? 验证码、IP 封锁、API 密钥、频率限制和机器人防护墙,都是强烈的红区信号。
- 你是否检查过网站的 robots.txt? 它本身在韩国判例中未必具有法律约束力,但能作为网站预期和你善意的证据。
- 你是否在收集任何个人数据? 如果范围里包含姓名、电话、邮箱、身份证号或个人联系方式,就需要做 PIPA 分析。
- 你是否复制了网站数据库的“实质部分”? 同时从数量和质量两个角度思考——复制了多少?复制部分是否反映了数据源的投入?
- 你是否定义了用途? 内部分析的风险通常低于再分发或构建竞争数据库。(不过 Yanolja 说明,内部的竞争性使用并不能完全挡住风险。)
- 你是否把正当商业目的写下来并留档? 文档有助于 PIPA 的合法利益衡量,也能作为善意证据。
- 你是否在存储/使用之前删除或匿名化了个人数据字段? 排除联系方式,往往能把房产、招聘和名录抓取从最危险的 PIPA 模式里拉出来。
- 你是否采用了合理的请求间隔? 避免压垮服务器——如果抓取影响了服务运行,《刑法》第 314 条和 ICNA 第 48 条第 3 款的风险都会上升。
- 对于高流量、商业化或跨境项目,你是否咨询了韩国法律顾问? 韩国法律再加上 GDPR / 美国隐私或计算机访问法律,可能都会适用。
⚠️ **免责声明:**这份清单仅用于帮助你建立认知,不构成法律意见。具体情况请务必咨询韩国当地法律顾问。
Thunderbit 如何帮助你负责任地抓取韩国网站
坦白说:我在 Thunderbit 的市场团队工作。但我真心觉得,这里产品和法律的适配度很高,不只是销售话术。
Thunderbit 正是为本文描述的绿区场景而设计的:抓取无需登录的公开数据。以下是具体功能如何对应合规框架:
- 云端抓取模式 适用于公开网站——无需登录,也不需要本地会话,始终停留在公开可访问边界内。这与 Yanolja 的“门开”原则一致。
- AI 建议字段 让你明确指定要提取哪些数据列。你只需要商品价格和库存,不要卖家电话?那就把个人字段排除掉。这是避免触发 PIPA 的最简单办法。
- 定时爬虫 适合周期性的价格、库存或列表检查,并且间隔合理——不用频繁猛打服务器。
- 免费导出数据 到 Excel、Google Sheets、Airtable 和 Notion,方便内部分析流程。
- 子页面抓取 可用于丰富公开列表数据(例如点进单个商品页获取规格),而不会进入仅登录可见或受限制区域。
- AI 布局适配——爬虫每次都会重新读取网站结构,并随着页面变化自动调整,而不是依赖脆弱的硬编码选择器。
Thunderbit 支持数十种语言,这对处理韩文网站的团队尤其重要。你可以通过免费试用。
没有任何工具能消除法律风险。但只要配置得当——公开页面、事实数据、排除个人字段、合理间隔——你就能保持在本文描述的合规框架内。
韩国网页抓取合法性的关键结论
有五点值得记住:
- 网页抓取技术本身在韩国是合法的。 最高法院在 Yanolja 判决中已经确认这一点。
- 风险取决于访问方式(门开 vs 门关)、数据类型(个人 vs 事实数据)以及用途(内部使用 vs 竞争性再分发)。
- 刑事无罪 ≠ 民事安全。 Yanolja 案证明你可以避免被起诉,却仍然面临高额赔偿。
- 如果抓取的是公开的、非个人的、事实性数据,并且用于内部目的、没有访问门槛,通常处于安全区。 但“通常”也要认真看——范围、数量和目的都很重要。
- 大型或商业项目一定要咨询韩国当地法律顾问。 这篇文章仅用于帮助你建立认知,不是法律意见。
如果你想开始负责任地抓取韩国网站, 可以让你先小规模测试流程。想进一步了解 AI 抓取在实际中的运作方式,可以看看我们关于和的指南。如果你想直接看工具演示,我们的有常见用例的操作讲解。
常见问题
1. 在韩国抓取公开可得的数据合法吗?
就刑事层面而言,一般是合法的——根据 Yanolja 最高法院判决,如果访问的网站没有客观访问限制,那么访问该数据并不违反 ICNA。不过,依据 UCPA 或《著作权法》的民事责任仍可能适用,具体要看数据量、来源的投入以及你对数据的商业使用方式。
2. 在韩国,即使抓取不构成犯罪,也可能被起诉吗?
可以。刑事和民事程序是独立的。GC Company 在所有刑事指控上都被判无罪,但仍然因为 UCPA 的兜底条款被判支付约 10 亿韩元民事赔偿。刑事无罪并不能挡住民事索赔。
3. 违反网站服务条款会让韩国的抓取行为变成非法吗?
韩国法院一直认为,仅仅违反 ToS 并不构成 ICNA 下的刑事犯罪——法院区分了限制使用(ToS)和限制访问(技术障碍)这两件事。不过,ToS 违规仍可能支持违约民事索赔,或者在不正当竞争分析中作为恶意证据。
4. 韩国的网页抓取法律和美国相比如何?
两个法域都保护公开数据抓取(韩国的 Yanolja,美国的 hiQ 诉 LinkedIn),也都认为仅违反 ToS 不构成刑事犯罪(美国的 Van Buren)。关键区别在于:韩国有更强的成文法数据库保护,以及更广泛的不正当竞争兜底条款;而美国没有一般性的联邦数据库权利。韩国平台方在民事层面拥有更多追诉工具。
5. 如果我从韩国网站抓取个人数据,会发生什么?
无论信息是否公开可见,PIPA 都适用。未经同意或其他法律依据收集姓名、电话、邮箱等个人信息,都属于违规。2023 年的 PIPA 修法强化了这些保护,而 PIPC 2024 年关于公开个人信息的指引也专门提到了网页爬取和抓取。处罚最高可达 5 年监禁、5000 万韩元罚金,以及最高相当于总销售额 3% 的行政罚款。
了解更多
