Несколько месяцев назад один из наших пользователей задал вопрос, который заставил меня замереть с чашкой кофе на полпути ко рту: «Если я соберу публичные цены на товары с Coupang, не окажусь ли я в корейском суде?» Честно говоря, у меня не было уверенного ответа — как и у большинства юридических гайдов, которые я нашел в интернете.
Этот вопрос зацепил меня, потому что его тихо гуглят каждую неделю тысячи e-commerce-операторов, sales-команд и основателей SaaS. Мировой рынок услуг web scraping достиг примерно и быстро растет. Больше компаний, чем когда-либо, собирают веб-данные — и все больше из них задаются вопросом, где именно в Корее проходит юридическая граница. В Корее веб-скрейпинг сам по себе не запрещен.
Но в зависимости от того, что вы скрейпите, как вы это делаете и зачем, могут применяться четыре крупных закона. Самое известное дело, на которое все ссылаются, — решение Верховного суда Кореи по Yanolja (2021Do1533, вынесено 12 мая 2022 года), где конкурентский инструмент для скрейпинга был оправдан по уголовным обвинениям — а затем в отдельном гражданском процессе ту же компанию обязали выплатить около 1 млрд вон ущерба. Именно этот двойственный результат — главное, что неюристу нужно понять о корейском праве в сфере скрейпинга, и на нем построено это руководство. Юридический диплом не нужен — нужен только практический риск-фреймворк, которым можно реально пользоваться.
Сложность: для начинающих (юридическая или техническая подготовка не требуется)
Время на чтение: около 15 минут; может использоваться как справочник
Что понадобится: базовое понимание того, что делает web scraping (если нужен повтор, см. нашу статью )
Законен ли web scraping в Корее? Короткий ответ
Сам по себе web scraping в Корее не является незаконным. Это нейтральная технология — как веб-браузер или формула в таблице. Корейские суды последовательно смотрят не на инструмент, а на то, как его используют.

Лучший мысленный образ дает решение Верховного суда по Yanolja: принцип «ворота подняты vs. ворота опущены». Если у сайта нет объективных ограничений доступа — ни стены логина, ни CAPTCHA, ни требования API-ключа, ни IP-блокировки — значит, «ворота опущены», и доступ к публично доступным данным, как правило, не образует уголовного преступления по Закону Кореи о сетях информации и связи (ICNA). Суд отдельно проверял, ограничивали ли доступ «защитные меры, условия использования и иные объективно проявленные обстоятельства», и установил, что API-сервер Yanolja был свободно доступен через публичное приложение.
Но «не уголовно наказуемо» не означает «совсем без риска».
Гражданская ответственность — это совершенно отдельный вопрос. Можно избежать уголовного преследования и при этом получить иск на миллиард вон. Дело Yanolja показало это очень болезненно.
К web scraping в Корее могут применяться четыре закона:
- ICNA (Information and Communications Network Act) — правило «не входить без разрешения»
- Закон об авторском праве — права изготовителя базы данных
- PIPA (Personal Information Protection Act) — правила сбора персональных данных
- UCPA (Unfair Competition Prevention Act) — универсальное правило против «безбилетного проезда»
Дальше в этом гайде мы свяжем эти законы с реальными сценариями, чтобы вы могли понять, в какую зону попадает ваш проект по сбору данных.
Зеленая, желтая и красная зоны риска для web scraping в Корее

Каждая статья о праве web scraping в Корее, которую я находил, написана так, будто предназначена только для юристов. Если вы менеджер по операциям в e-commerce или основатель SaaS, вам не нужен 40-страничный разбор закона — вам нужен быстрый способ оценить риск до запуска проекта. Представьте это как светофор. Зеленый — можно ехать (с обычной осторожностью). Желтый — сбавьте скорость и посмотрите по зеркалам. Красный — стоп и звоните юристу.
Зеленая зона: низкорисковые сценарии скрейпинга
| Сценарий | Уровень риска | Ключевой закон | Почему |
|---|---|---|---|
| Сбор публичных карточек товаров (без логина, без CAPTCHA) | 🟢 Низкий | ICNA, Закон об авторском праве | Решение по Yanolja: нет ограничения доступа — нет нарушения ICNA; фактические данные (цены, наличие) не являются творческим выражением |
| Сбор публичных цен только для внутренней аналитики | 🟢 Низкий | UCPA, Закон об авторском праве | Фактические данные, ограниченный объем, нет конкурентного распространения |
| Сбор не персональных, не охраняемых авторским правом фактов с публичных страниц | 🟢 Низкий | ICNA, Закон об авторском праве | Нет обхода барьера доступа; отдельные факты не защищаются |
Именно решение Верховного суда по Yanolja определяет эту зону. Суд не усмотрел нарушения ICNA, потому что API-сервер был свободно доступен — обычные пользователи могли добраться до него через приложение и с членством, и без него, а отдельные защитные меры не блокировали доступ к API.
Для пользователей это идеальный сценарий. Если вы собираете публичные страницы e-commerce или недвижимости в cloud scraping-режиме — извлекаете названия товаров, цены, наличие или метаданные объявлений, исключая поля с персональными данными, — вы обычно работаете в зеленой зоне. (Хотя «обычно» не равно «всегда», и нюансы я объясню ниже.)
Желтая зона: сценарии скрейпинга со средним риском
| Сценарий | Уровень риска | Ключевой закон | Почему |
|---|---|---|---|
| Сбор персональных данных (имена, email, телефоны) даже с публичных страниц | 🟡 Средний | PIPA, ICNA | PIPA действует независимо от публичной видимости; поправки 2023 года ужесточили правила согласия |
| Сбор больших объемов, которые могут считаться «существенной частью» базы данных конкурента | 🟡 Средний | Закон об авторском праве, UCPA | В корейском праве применяется количественный и качественный тест |
| Игнорирование сигналов robots.txt | 🟡 Средний | Доказательство недобросовестности | Само по себе не преступление, но может быть использовано против вас в суде |
| Сбор публичных данных с использованием их для прямой конкуренции с источником | 🟡 Средний | UCPA | Безбилетное использование инвестиций другой платформы |
Персональные данные — главный триггер желтой зоны.
Даже если номер телефона или email виден на публичной странице, PIPA все равно применяется. Реформа PIPA 2023 года расширила права субъекта данных и ужесточила требования к согласию. А в 2024 году Комиссия по защите персональной информации Кореи (PIPC) выпустила в контексте ИИ и сбора данных — ясно указав, что одна лишь публичная доступность не означает автоматического разрешения.
Объем тоже имеет значение. Верховный суд по делу Yanolja сказал, что и количественные, и качественные факторы определяют, скопировали ли вы «существенную часть» базы данных. Сравните скопированный фрагмент со всей базой и спросите себя, отражает ли он значительные инвестиции создателя.
Красная зона: сценарии скрейпинга с высоким риском
| Сценарий | Уровень риска | Ключевой закон | Почему |
|---|---|---|---|
| Скрейпинг за стеной логина или обход средств контроля доступа | 🔴 Высокий | ICNA Art 48 | «Ворота подняты» = несанкционированный доступ; высокий риск уголовного преследования |
| Обход CAPTCHA, IP-банов или систем бот-детекта | 🔴 Высокий | ICNA Art 48(4) | Поправка 2024 года прямо нацелена на инструменты и устройства обхода |
| Копирование и перепродажа полной базы данных конкурента | 🔴 Высокий | Закон об авторском праве (права на БД), UCPA | Существенное воспроизведение + коммерческое безбилетное использование |
| Сбор персональной информации без законного основания для маркетинга или outreach | 🔴 Высокий | PIPA | До 5 лет / штраф до 50 млн вон; административные санкции до 3% от выручки |
Дополнение 2024 года к ICNA — статья 48(4) — теперь прямо запрещает устанавливать, передавать или распространять программы либо технические устройства, которые обходят «обычные процедуры защиты или аутентификации» без законной причины.
Отдельно решение Верховного суда подтвердило, что несанкционированное вторжение в сеть возможно даже без физического повреждения защитных мер. Использование чужих идентификаторов или неправильных команд для обхода ограничений доступа — уже достаточно.
Четыре корейских закона, которые применяются к web scraping
| Закон | Что он защищает | Когда он начинает применяться к скрейперам |
|---|---|---|
| ICNA Article 48 | Стабильность сети, право доступа | Обход логина, CAPTCHA, аутентификации, IP-блокировок, ограничений API-ключей |
| Закон об авторском праве (ст. 93) | Творческие произведения + права изготовителя базы данных | Копирование выразительного контента, изображений или всей/существенной части базы данных |
| PIPA | Персональные данные, права субъекта данных | Сбор имен, телефонов, email, ID — даже с публичных страниц |
| UCPA (ст. 2(1)(k) и (m)) | Честная конкуренция, коммерчески ценные данные | Использование инвестиций другой платформы в данные для своего конкурирующего бизнеса |
ICNA Article 48: правило «не входить без разрешения»
ICNA Article 48(1) говорит, что никто не должен вторгаться в информационно-коммуникационную сеть «без законного права доступа или за пределами разрешенного права доступа». В терминах скрейпинга это значит: если на сайте есть ограничения доступа, которые вы обходите, вы нарушаете закон. Если ограничений нет — публичная страница, без логина — скорее всего, все в порядке.
Наказание за нарушение по статье 71 ICNA — до .
Есть один важный нюанс: Верховный суд Кореи последовательно считает, что ограничения в Terms of Service отличаются от ограничений доступа. Условия приложения Yanolja ограничивали коммерческое повторное использование и запрещали автоматические программы, перегружавшие сервер, но суд решил, что эти положения не ограничивали объективно доступ к самому API-серверу.
Закон об авторском праве: права изготовителя базы данных
Корейский закон об авторском праве отдельно защищает изготовителей баз данных помимо авторских прав на отдельный контент. По воспроизведение «всей или существенной части» базы данных незаконно — даже если отдельные элементы данных являются публичными фактами.
Тест здесь и количественный (сколько вы скопировали относительно целого?), и качественный (отражает ли скопированный фрагмент существенные инвестиции создателя в построение, проверку или поддержку базы?). Повторное или систематическое копирование небольших частей тоже может считаться нарушением, если по сути дает тот же результат, что и копирование существенной части.
Наказание за нарушение прав изготовителя базы данных: до 3 лет или штраф до 30 млн вон по статье 136(2)(3). Законные убытки по статье 125-2 позволяют взыскать до 10 млн вон за одно произведение или до 50 млн вон за одно произведение при умышленном коммерческом нарушении.
PIPA: Закон о защите персональной информации
PIPA регулирует сбор персональных данных — имен, контактной информации, ID — даже если они публично видны. Реформа 2023 года была значимой: она расширила права субъекта данных, ужесточила требования к согласию, ввела правила об автоматизированном принятии решений и установила административные штрафы до за определенные нарушения.
прямо упоминает данные, полученные через «web crawling and scraping», в контексте общедоступной персональной информации. Руководство поясняет, что законный интерес может служить основанием в некоторых случаях, но организациям нужны баланс интересов, меры защиты, охрана прав и система управления.
И тенденция становится жестче. В марте 2026 года , которая повышает максимальные штрафы за серьезные повторные утечки данных до 10% от выручки, начиная с конца 2026 года.
UCPA: универсальное правило против недобросовестной конкуренции
UCPA — это закон, по которому в гражданском деле Yanolja была наказана GC Company. В действующей редакции есть два важных положения:
- Статья 2(1)(k): охватывает недобросовестное использование электронно накопленных и управляемых технических или бизнес-данных, которые не являются секретными
- Статья 2(1)(m): более широкая catch-all норма против использования чужих результатов, достигнутых благодаря существенным инвестициям или усилиям, в своем бизнесе без разрешения, вопреки честной коммерческой практике
Эти положения UCPA применяются только в гражданском порядке — уголовного наказания нет — но могут привести к судебным запретам по , взысканию убытков по статье 5 и даже к тройному возмещению в отдельных умышленных случаях по статье 14-2. В гражданском деле Yanolja по этой модели было взыскано около 1 млрд вон.
Дело Yanolja: почему можно выиграть по уголовному делу, но проиграть по гражданскому
Это дело должен понять каждый бизнес-пользователь в Корее. Я расскажу его как одну историю, потому что именно так все и происходило — и потому что разделенный результат здесь и есть главное.
Что произошло: GC Company собрала данные о поездках Yanolja
GC Company управляла конкурирующей онлайн-платформой для путешествий. Они создали собственный crawler, который обращался к API-серверу приложения Yanolja Baro Reservation, определял URL API и команды запросов и отправлял их серверу. Скрейпер собирал данные о размещении — названия партнеров, адреса, цены, наличие и изображения. GC Company использовала эти данные внутри компании для маркетинга и конкурентного позиционирования.
Yanolja подала и уголовную жалобу, и гражданский иск.
Уголовный вердикт: оправдание по всем пунктам (Верховный суд 2021Do1533)

12 мая 2022 года Верховный суд , по всем трем обвинениям:
- ICNA Article 48 (вторжение): ограничений доступа не было. API-сервер был публично доступен через браузер и мобильное приложение. Технической блокировки не существовало. Положения ToS ограничивали использование, а не доступ.
- Закон об авторском праве (права изготовителя базы данных): подсудимые не воспроизвели «всю или существенную часть» базы данных. Скопированные данные уже были публично известны, а доказательств того, что скопированный фрагмент отражал существенные инвестиции Yanolja, не хватило.
- Статья 314 Уголовного кодекса (воспрепятствование бизнесу): фактического нарушения работы API-сервера Yanolja доказано не было. Изменения данных не было. Не было и mens rea для воспрепятствования бизнесу.
Формулируемое правило: ограничения доступа оцениваются через «защитные меры, условия использования и иные объективно проявленные обстоятельства». Если ворота опущены, проход через них — не вторжение.
Гражданский вердикт: 1 млрд вон ущерба по UCPA
А вот здесь история меняется. Центральный районный суд Сеула — а затем и Высокий суд Сеула (дело 2021Na2034740, решение от 25 августа 2022 года) — признали, что GC Company нарушила универсальную норму UCPA. Суд присудил примерно 1 млрд вон (~800 тыс. долларов США) компенсационного ущерба и запретил дальнейшее копирование данных.
Мотивировка была такой: база данных о размещении Yanolja имела коммерческую ценность и отражала существенные инвестиции — в сбор, проверку и обновление данных о жилье. GC Company воспользовалась этими инвестициями бесплатно. Гражданское решение было окончательно подтверждено на уровне Высокого суда Сеула.
Практический вывод: уголовное оправдание не означает гражданскую безопасность
Это самый неожиданный урок из корейского права о скрейпинге. Уголовно законный доступ не освобождал от ответственности за коммерчески недобросовестное использование. Вопросы «Могут ли меня преследовать?» и «Могут ли на меня подать в суд?» — разные, и ответы на них могут быть противоположными.
Для бизнеса: даже если ваш способ скрейпинга явно относится к зеленой зоне в уголовном смысле, именно использование данных — особенно если вы напрямую конкурируете с источником — определяет гражданский риск.
Корея vs США vs ЕС: как сравниваются законы о web scraping
Я не нашел другого гайда, который бы свел это в одну таблицу, что удивительно, если учесть, сколько компаний собирает данные сразу в нескольких юрисдикциях.
| Параметр | Южная Корея | США | ЕС / ЕЭЗ |
|---|---|---|---|
| Базовый закон | ICNA Art 48, Закон об авторском праве | CFAA (18 U.S.C. §1030), законы штатов | GDPR, Директива о базах данных (96/9/EC) |
| Ключевое дело | Yanolja v GC Company (Верховный суд 2021Do1533, 2022) | hiQ v LinkedIn (9th Cir. 2022), Van Buren v. US (2021) | Ryanair v PR Aviation (СЕС C-30/14, 2015) |
| Сбор публичных данных | Законно при отсутствии объективных барьеров доступа («ворота опущены») | Законно по логике hiQ (публичные данные); Van Buren сузило CFAA | Зависит от прав на БД, договора, авторского права, GDPR и закона государства-члена |
| Правила для персональных данных | PIPA (с поправками 2023) — согласие или законное основание | Секторально: CCPA (Калифорния), законы штатов о конфиденциальности | GDPR — строгое согласие / законный интерес; максимальный штраф €20 млн или 4% глобальной выручки |
| Нарушение ToS = преступление? | Нет (суды считают ToS не равным нарушению ICNA) | Нет (Van Buren 2021: ToS ≠ CFAA) | Обычно нет, но возможно нарушение договора (Ryanair) |
| Защита баз данных | Права изготовителя БД по Закону об авторском праве | Нет общего федерального права на БД | Особое право sui generis на базу данных |
| Макс. уголовное наказание | До 5 лет / 50 млн вон (ICNA) | До 10 лет / $250K (CFAA) | Зависит от государства-члена |
Ключевые различия, важные для вашего бизнеса
- В Корее нет широкого исключения для text-and-data-mining (TDM), как в Директиве ЕС DSM. Если вы обучаете ИИ-модели на собранных корейских данных, у вас нет статутного carve-out.
- Универсальная норма UCPA в Корее шире и менее предсказуемая, чем американское право о недобросовестной конкуренции. Гражданский результат по делу Yanolja было бы гораздо сложнее воспроизвести в США.
- Все три юрисдикции согласны: само по себе нарушение Terms of Service не является уголовным преступлением.
- Защита баз данных в Корее закреплена законом (как и в ЕС), тогда как в США нет общего федерального права на базы данных. Это дает корейским платформам больше гражданско-правовых инструментов.
- Если вы скрейпите данные через границы, применяется самый строгий закон из тех, что могут затронуть проект. Проект, работающий с корейскими, американскими и европейскими данными, должен соответствовать всем трем режимам.
Сценарии по отраслям: законен ли web scraping в Корее для вашей сферы?
Профиль риска сильно зависит от отрасли, и ни один найденный мной гайд не сопоставлял корейское право о скрейпинге с конкретными вертикалями. Поэтому я собрал это сам.
E-commerce: мониторинг цен и товарные данные

Сбор публичных цен на товары с Coupang, Gmarket или 11Street — самый чистый пример зеленой зоны: держитесь фактических полей (цена, наличие, название товара), не заходите в разделы только для логина, не обходите технические блокировки и используйте данные внутри компании для бенчмаркинга.
Риск растет, если вы собираете описания товаров (творческий контент → авторское право), контактные данные продавцов (PIPA), изображения (авторское право) или весь каталог целиком (права изготовителя БД + UCPA).
Я не нашел крупного корейского дела по e-commerce-скрейпингу, сопоставимого с Yanolja. Более развитый прецедент есть в travel и recruitment — но отсутствие исков не означает отсутствия риска.
и cloud scraping-режим как раз созданы для такого сценария: регулярных проверок цен и наличия на публичных страницах, а AI Suggest Fields позволяет выбрать нужные столбцы и исключить поля с персональными данными.
Недвижимость: объявления объектов
Недвижимость по своей природе находится в желтой зоне. Объявления на платформах вроде Zigbang или Naver Real Estate смешивают фактические данные (цена, площадь, район) с именами агентов, офисными телефонами, мобильными номерами, фотографиями и тщательно собранными платформенными базами.
Сбор публичных данных по объектам может быть относительно низкорисковым. Но извлечение контактных столбцов агентов сразу запускает PIPA — а скрейпинг всех объявлений в регионе уже начинает выглядеть как существенное копирование базы данных.
Снижение риска: исключайте персональные столбцы, уменьшайте географический охват, документируйте законную бизнес-цель, соблюдайте rate limits и не воспроизводите конкурирующий сервис объявлений. ИИ Thunderbit можно настроить так, чтобы он извлекал только нужные поля объекта — цену, квадратные метры, местоположение — и пропускал персональные контактные данные.
Подбор персонала: вакансии
Recruitment — это сектор с высоким риском, без вариантов. В Корее есть прямой прецедент: JobKorea v. Saramin. Saramin собирала базу вакансий JobKorea и была признана ответственной за нарушение прав на базу данных и недобросовестную конкуренцию. Данные о вакансиях обычно сочетают инвестиции платформы (курируемые, проверенные объявления), массовое копирование БД и персональные данные или контактные данные рекрутеров.
Моя рекомендация: в целом избегайте скрейпинга конкурирующей job-платформы для создания или обогащения собственной базы вакансий. Если кейс узкий, проведите юридическую проверку до сбора, минимизируйте объем, удалите персональные контакты и не распространяйте результаты дальше.
Полная таблица санкций: чем вы рискуете, если web scraping в Корее пойдет не так
| Корейский закон | Тип нарушения | Макс. уголовное наказание | Макс. гражданское/админ. взыскание | Ключевое изменение 2023–2026 |
|---|---|---|---|---|
| ICNA Art 48 | Несанкционированный доступ / вмешательство | 5 лет / штраф 50 млн вон | Ущерб + судебный запрет | 2024: добавлена ст. 48(4), нацеленная на инструменты обхода |
| Закон об авторском праве (права на БД, ст. 93) | Существенное воспроизведение БД | 3 года / штраф 30 млн вон | Законные убытки до 50 млн вон/произведение (умышленное коммерческое нарушение) | — |
| PIPA | Незаконный сбор персональных данных | 5 лет / штраф 50 млн вон | Админштраф до 3% от общей выручки; возможен коллективный иск | Реформа 2023; руководство PIPC 2024 по публичным данным и ИИ; тренд 2026 на 10% за повторные утечки |
| UCPA Art 2(1)(k)/(m) | Недобросовестное получение / использование данных | Только гражданская ответственность (для catch-all уголовного наказания нет) | Ущерб + судебный запрет; тройное возмещение в отдельных умышленных случаях | Поправки 2022 года усилили положения Data Framework Act |
| Уголовный кодекс Art 314 | Воспрепятствование бизнесу техническими средствами | 5 лет / штраф 15 млн вон | — | Yanolja: фактическое нарушение работы не доказано |
Критический момент: уголовный и гражданский треки идут независимо. Вы можете столкнуться с обоими одновременно — и выиграть один, но проиграть другой.
Ваш 10-пунктовый чек-лист соответствия для web scraping в Корее
Ниже — десять вопросов «да/нет», которые стоит пройти перед запуском любого проекта по сбору данных. Распечатайте, добавьте в закладки, приклейте к монитору — как вам удобно.
- Требуется ли на целевом сайте логин, чтобы получить доступ к нужным данным? Если нужен логин, токен или аккаунт, риск резко смещается в сторону ICNA Article 48.
- Есть ли технические ограничения доступа? CAPTCHA, IP-блокировки, API-ключи, rate limits и bot walls — сильные сигналы красной зоны.
- Проверяли ли вы robots.txt сайта? Сам по себе он не имеет обязательной силы в корейской судебной практике, но это полезное доказательство ожиданий сайта и вашей добросовестности.
- Собираете ли вы какие-либо персональные данные? Если в скоуп входят имена, телефоны, email, ID или индивидуальные контактные данные, нужен анализ по PIPA.
- Копируете ли вы «существенную часть» базы данных сайта? Смотрите и на количество, и на качество — сколько именно и отражает ли скопированный фрагмент инвестиции источника?
- Определили ли вы цель использования? Внутренняя аналитика менее рискованна, чем распространение или построение конкурирующей базы данных. (Но дело Yanolja показывает, что внутреннее конкурентное использование не является полной защитой.)
- Описали ли вы законную деловую цель письменно? Документация помогает в балансировке законного интереса по PIPA и служит доказательством добросовестности.
- Удалили ли вы или анонимизировали персональные поля перед хранением/использованием? Исключение контактных данных часто выводит скрейпинг недвижимости, рекрутинга и справочников из самой опасной схемы PIPA.
- Используете ли вы разумные интервалы запросов? Избегайте перегрузки сервера — риск по Уголовному кодексу Art 314 и ICNA Article 48(3) растет, если скрейпинг нарушает работу сервиса.
- Консультировались ли вы с корейским юристом по крупным, коммерческим или трансграничным проектам? На проект могут одновременно распространяться корейское право, GDPR и американские законы о конфиденциальности или доступе к компьютерам.
⚠️ Отказ от ответственности: этот чек-лист предназначен для ориентации, а не как юридическая консультация. Для конкретных ситуаций всегда консультируйтесь с местным корейским юристом.
Как Thunderbit помогает ответственно собирать данные с корейских сайтов
Полное раскрытие: я работаю в маркетинговой команде Thunderbit. Но я искренне считаю, что здесь продукт и право действительно хорошо совпадают, и это не просто продажа.
Thunderbit создан для тех сценариев из зеленой зоны, о которых идет речь в статье: сбор общедоступных данных без логина. Вот как конкретные функции соотносятся с рамкой соответствия:
- Cloud scraping mode для публичных сайтов — не нужно входить в систему, не нужна локальная сессия, работа остается в пределах общедоступного доступа. Это соответствует принципу Yanolja «ворота опущены».
- AI Suggest Fields позволяет точно определить, какие столбцы данных извлекать. Нужны цены и наличие, но не телефоны продавцов? Просто исключите персональные столбцы. Это самый простой способ избежать триггеров PIPA.
- Планировщик (scheduled scraper) для регулярных проверок цен, наличия или объявлений с разумными интервалами — не нужно непрерывно долбить сервер запросами.
- Бесплатный экспорт данных в Excel, Google Sheets, Airtable и Notion для внутренних аналитических процессов.
- Сбор подстраниц для обогащения данных публичных объявлений (например, переход в отдельные страницы товаров за спецификациями) без доступа к зонам только для логина или ограниченным разделам.
- Адаптация макета с помощью ИИ — скрейпер заново считывает структуру сайта каждый раз и подстраивается под изменения верстки без хрупких жестко прописанных селекторов.
Thunderbit поддерживает многокязычную работу на десятках языков, что важно для команд, работающих с корейскоязычными сайтами. Попробовать можно бесплатно через .
Ни один инструмент не устраняет юридический риск. Но ответственная настройка — публичные страницы, фактические данные, исключенные персональные поля, разумные интервалы — помогает оставаться в рамках соответствия, описанных в этой статье.
Главные выводы о законности web scraping в Корее
Пять вещей, которые стоит запомнить:
- Технология web scraping сама по себе в Корее законна. Верховный суд подтвердил это в решении по делу Yanolja.
- Риск зависит от способа доступа (ворота подняты vs. опущены), типа данных (персональные vs. фактические) и использования (внутреннее vs. конкурентное распространение).
- Уголовное оправдание ≠ гражданская безопасность. Дело Yanolja показывает, что можно избежать уголовного преследования, но все равно получить ущерб на миллиард вон.
- Если вы собираете публичные, неперсональные, фактические данные для внутреннего использования и без барьеров доступа, вы обычно в безопасной зоне. Но слово «обычно» здесь важно — имеют значение объем, масштаб и цель.
- Для крупных или коммерческих проектов всегда консультируйтесь с местным корейским юристом. Эта статья — для ориентации, а не юридический совет.
Если вы хотите начать ответственно собирать данные с корейских сайтов, позволит протестировать рабочий процесс в небольшом масштабе. Подробнее о том, как ИИ-скрейпинг работает на практике, читайте в наших гайдах по и . А если хотите увидеть инструмент в действии, на нашем есть пошаговые разборы типовых сценариев.
FAQ
1. Законен ли сбор публично доступных данных в Корее?
В целом да — для уголовного права. По решению Верховного суда по делу Yanolja доступ к данным с сайта без объективных ограничений доступа не нарушает ICNA. Однако гражданская ответственность по UCPA или Закону об авторском праве все равно может наступить — в зависимости от объема, инвестиций источника и того, как вы используете данные.
2. Могут ли на меня подать в суд за web scraping в Корее, даже если это не преступление?
Да. Уголовный и гражданский треки независимы. GC Company была оправдана по всем уголовным обвинениям, но по универсальной норме UCPA была обязана выплатить около 1 млрд вон гражданского ущерба. Уголовное оправдание не защищает от гражданского иска.
3. Делает ли нарушение Terms of Service сайта web scraping незаконным в Корее?
Корейские суды последовательно считают, что одно лишь нарушение ToS не образует уголовного преступления по ICNA — суд различает ограничение использования (ToS) и ограничение доступа (технические барьеры). При этом нарушение ToS все еще может поддерживать гражданский иск о нарушении договора или использоваться как доказательство недобросовестности в анализе недобросовестной конкуренции.
4. Чем корейское право о web scraping отличается от американского?
В обеих юрисдикциях защищается сбор публичных данных (Yanolja в Корее, hiQ v LinkedIn в США), и в обеих считается, что нарушение ToS само по себе не является уголовным преступлением (Van Buren в США). Главное отличие: в Корее сильнее статутная защита баз данных и шире универсальная норма против недобросовестной конкуренции, тогда как в США нет общего федерального права на базы данных. У корейских платформ больше гражданско-правовых инструментов против скрейперов.
5. Что будет, если я соберу персональные данные с корейских сайтов?
PIPA применяется независимо от того, видна ли информация публично. Сбор персональных данных — имен, телефонов, email — без согласия или другого законного основания является нарушением. Поправка к PIPA 2023 года усилила защиту, а руководство PIPC 2024 года по общедоступной персональной информации прямо касается web crawling и scraping. Наказание может достигать 5 лет лишения свободы, штрафа 50 млн вон и административных санкций до 3% от общей выручки.
Узнать больше
