Законно ли веб-скрейпинг в Корее? Что нужно знать неюристам

Последнее обновление: April 30, 2026

Несколько месяцев назад один из наших пользователей задал вопрос, который заставил меня замереть с чашкой кофе на полпути ко рту: «Если я соберу публичные цены на товары с Coupang, не окажусь ли я в корейском суде?» Честно говоря, у меня не было уверенного ответа — как и у большинства юридических гайдов, которые я нашел в интернете.

Этот вопрос зацепил меня, потому что его тихо гуглят каждую неделю тысячи e-commerce-операторов, sales-команд и основателей SaaS. Мировой рынок услуг web scraping достиг примерно и быстро растет. Больше компаний, чем когда-либо, собирают веб-данные — и все больше из них задаются вопросом, где именно в Корее проходит юридическая граница. В Корее веб-скрейпинг сам по себе не запрещен.

Но в зависимости от того, что вы скрейпите, как вы это делаете и зачем, могут применяться четыре крупных закона. Самое известное дело, на которое все ссылаются, — решение Верховного суда Кореи по Yanolja (2021Do1533, вынесено 12 мая 2022 года), где конкурентский инструмент для скрейпинга был оправдан по уголовным обвинениям — а затем в отдельном гражданском процессе ту же компанию обязали выплатить около 1 млрд вон ущерба. Именно этот двойственный результат — главное, что неюристу нужно понять о корейском праве в сфере скрейпинга, и на нем построено это руководство. Юридический диплом не нужен — нужен только практический риск-фреймворк, которым можно реально пользоваться.

Сложность: для начинающих (юридическая или техническая подготовка не требуется)
Время на чтение: около 15 минут; может использоваться как справочник
Что понадобится: базовое понимание того, что делает web scraping (если нужен повтор, см. нашу статью )

Законен ли web scraping в Корее? Короткий ответ

Сам по себе web scraping в Корее не является незаконным. Это нейтральная технология — как веб-браузер или формула в таблице. Корейские суды последовательно смотрят не на инструмент, а на то, как его используют.

ig_0cdf68974ff22a4a0169f1aba6b77c8191a0d3fa1e58ce2c97_compressed.webp

Лучший мысленный образ дает решение Верховного суда по Yanolja: принцип «ворота подняты vs. ворота опущены». Если у сайта нет объективных ограничений доступа — ни стены логина, ни CAPTCHA, ни требования API-ключа, ни IP-блокировки — значит, «ворота опущены», и доступ к публично доступным данным, как правило, не образует уголовного преступления по Закону Кореи о сетях информации и связи (ICNA). Суд отдельно проверял, ограничивали ли доступ «защитные меры, условия использования и иные объективно проявленные обстоятельства», и установил, что API-сервер Yanolja был свободно доступен через публичное приложение.

Но «не уголовно наказуемо» не означает «совсем без риска».

Гражданская ответственность — это совершенно отдельный вопрос. Можно избежать уголовного преследования и при этом получить иск на миллиард вон. Дело Yanolja показало это очень болезненно.

К web scraping в Корее могут применяться четыре закона:

  1. ICNA (Information and Communications Network Act) — правило «не входить без разрешения»
  2. Закон об авторском праве — права изготовителя базы данных
  3. PIPA (Personal Information Protection Act) — правила сбора персональных данных
  4. UCPA (Unfair Competition Prevention Act) — универсальное правило против «безбилетного проезда»

Дальше в этом гайде мы свяжем эти законы с реальными сценариями, чтобы вы могли понять, в какую зону попадает ваш проект по сбору данных.

Зеленая, желтая и красная зоны риска для web scraping в Корее

ig_0cdf68974ff22a4a0169f1abfb386c8191baf73515035c6cdc_compressed.webp

Каждая статья о праве web scraping в Корее, которую я находил, написана так, будто предназначена только для юристов. Если вы менеджер по операциям в e-commerce или основатель SaaS, вам не нужен 40-страничный разбор закона — вам нужен быстрый способ оценить риск до запуска проекта. Представьте это как светофор. Зеленый — можно ехать (с обычной осторожностью). Желтый — сбавьте скорость и посмотрите по зеркалам. Красный — стоп и звоните юристу.

Зеленая зона: низкорисковые сценарии скрейпинга

СценарийУровень рискаКлючевой законПочему
Сбор публичных карточек товаров (без логина, без CAPTCHA)🟢 НизкийICNA, Закон об авторском правеРешение по Yanolja: нет ограничения доступа — нет нарушения ICNA; фактические данные (цены, наличие) не являются творческим выражением
Сбор публичных цен только для внутренней аналитики🟢 НизкийUCPA, Закон об авторском правеФактические данные, ограниченный объем, нет конкурентного распространения
Сбор не персональных, не охраняемых авторским правом фактов с публичных страниц🟢 НизкийICNA, Закон об авторском правеНет обхода барьера доступа; отдельные факты не защищаются

Именно решение Верховного суда по Yanolja определяет эту зону. Суд не усмотрел нарушения ICNA, потому что API-сервер был свободно доступен — обычные пользователи могли добраться до него через приложение и с членством, и без него, а отдельные защитные меры не блокировали доступ к API.

Для пользователей это идеальный сценарий. Если вы собираете публичные страницы e-commerce или недвижимости в cloud scraping-режиме — извлекаете названия товаров, цены, наличие или метаданные объявлений, исключая поля с персональными данными, — вы обычно работаете в зеленой зоне. (Хотя «обычно» не равно «всегда», и нюансы я объясню ниже.)

Желтая зона: сценарии скрейпинга со средним риском

СценарийУровень рискаКлючевой законПочему
Сбор персональных данных (имена, email, телефоны) даже с публичных страниц🟡 СреднийPIPA, ICNAPIPA действует независимо от публичной видимости; поправки 2023 года ужесточили правила согласия
Сбор больших объемов, которые могут считаться «существенной частью» базы данных конкурента🟡 СреднийЗакон об авторском праве, UCPAВ корейском праве применяется количественный и качественный тест
Игнорирование сигналов robots.txt🟡 СреднийДоказательство недобросовестностиСамо по себе не преступление, но может быть использовано против вас в суде
Сбор публичных данных с использованием их для прямой конкуренции с источником🟡 СреднийUCPAБезбилетное использование инвестиций другой платформы

Персональные данные — главный триггер желтой зоны.

Даже если номер телефона или email виден на публичной странице, PIPA все равно применяется. Реформа PIPA 2023 года расширила права субъекта данных и ужесточила требования к согласию. А в 2024 году Комиссия по защите персональной информации Кореи (PIPC) выпустила в контексте ИИ и сбора данных — ясно указав, что одна лишь публичная доступность не означает автоматического разрешения.

Объем тоже имеет значение. Верховный суд по делу Yanolja сказал, что и количественные, и качественные факторы определяют, скопировали ли вы «существенную часть» базы данных. Сравните скопированный фрагмент со всей базой и спросите себя, отражает ли он значительные инвестиции создателя.

Красная зона: сценарии скрейпинга с высоким риском

СценарийУровень рискаКлючевой законПочему
Скрейпинг за стеной логина или обход средств контроля доступа🔴 ВысокийICNA Art 48«Ворота подняты» = несанкционированный доступ; высокий риск уголовного преследования
Обход CAPTCHA, IP-банов или систем бот-детекта🔴 ВысокийICNA Art 48(4)Поправка 2024 года прямо нацелена на инструменты и устройства обхода
Копирование и перепродажа полной базы данных конкурента🔴 ВысокийЗакон об авторском праве (права на БД), UCPAСущественное воспроизведение + коммерческое безбилетное использование
Сбор персональной информации без законного основания для маркетинга или outreach🔴 ВысокийPIPAДо 5 лет / штраф до 50 млн вон; административные санкции до 3% от выручки

Дополнение 2024 года к ICNA — статья 48(4) — теперь прямо запрещает устанавливать, передавать или распространять программы либо технические устройства, которые обходят «обычные процедуры защиты или аутентификации» без законной причины.

Отдельно решение Верховного суда подтвердило, что несанкционированное вторжение в сеть возможно даже без физического повреждения защитных мер. Использование чужих идентификаторов или неправильных команд для обхода ограничений доступа — уже достаточно.

Четыре корейских закона, которые применяются к web scraping

ЗаконЧто он защищаетКогда он начинает применяться к скрейперам
ICNA Article 48Стабильность сети, право доступаОбход логина, CAPTCHA, аутентификации, IP-блокировок, ограничений API-ключей
Закон об авторском праве (ст. 93)Творческие произведения + права изготовителя базы данныхКопирование выразительного контента, изображений или всей/существенной части базы данных
PIPAПерсональные данные, права субъекта данныхСбор имен, телефонов, email, ID — даже с публичных страниц
UCPA (ст. 2(1)(k) и (m))Честная конкуренция, коммерчески ценные данныеИспользование инвестиций другой платформы в данные для своего конкурирующего бизнеса

ICNA Article 48: правило «не входить без разрешения»

ICNA Article 48(1) говорит, что никто не должен вторгаться в информационно-коммуникационную сеть «без законного права доступа или за пределами разрешенного права доступа». В терминах скрейпинга это значит: если на сайте есть ограничения доступа, которые вы обходите, вы нарушаете закон. Если ограничений нет — публичная страница, без логина — скорее всего, все в порядке.

Наказание за нарушение по статье 71 ICNA — до .

Есть один важный нюанс: Верховный суд Кореи последовательно считает, что ограничения в Terms of Service отличаются от ограничений доступа. Условия приложения Yanolja ограничивали коммерческое повторное использование и запрещали автоматические программы, перегружавшие сервер, но суд решил, что эти положения не ограничивали объективно доступ к самому API-серверу.

Закон об авторском праве: права изготовителя базы данных

Корейский закон об авторском праве отдельно защищает изготовителей баз данных помимо авторских прав на отдельный контент. По воспроизведение «всей или существенной части» базы данных незаконно — даже если отдельные элементы данных являются публичными фактами.

Тест здесь и количественный (сколько вы скопировали относительно целого?), и качественный (отражает ли скопированный фрагмент существенные инвестиции создателя в построение, проверку или поддержку базы?). Повторное или систематическое копирование небольших частей тоже может считаться нарушением, если по сути дает тот же результат, что и копирование существенной части.

Наказание за нарушение прав изготовителя базы данных: до 3 лет или штраф до 30 млн вон по статье 136(2)(3). Законные убытки по статье 125-2 позволяют взыскать до 10 млн вон за одно произведение или до 50 млн вон за одно произведение при умышленном коммерческом нарушении.

PIPA: Закон о защите персональной информации

PIPA регулирует сбор персональных данных — имен, контактной информации, ID — даже если они публично видны. Реформа 2023 года была значимой: она расширила права субъекта данных, ужесточила требования к согласию, ввела правила об автоматизированном принятии решений и установила административные штрафы до за определенные нарушения.

прямо упоминает данные, полученные через «web crawling and scraping», в контексте общедоступной персональной информации. Руководство поясняет, что законный интерес может служить основанием в некоторых случаях, но организациям нужны баланс интересов, меры защиты, охрана прав и система управления.

И тенденция становится жестче. В марте 2026 года , которая повышает максимальные штрафы за серьезные повторные утечки данных до 10% от выручки, начиная с конца 2026 года.

UCPA: универсальное правило против недобросовестной конкуренции

UCPA — это закон, по которому в гражданском деле Yanolja была наказана GC Company. В действующей редакции есть два важных положения:

  • Статья 2(1)(k): охватывает недобросовестное использование электронно накопленных и управляемых технических или бизнес-данных, которые не являются секретными
  • Статья 2(1)(m): более широкая catch-all норма против использования чужих результатов, достигнутых благодаря существенным инвестициям или усилиям, в своем бизнесе без разрешения, вопреки честной коммерческой практике

Эти положения UCPA применяются только в гражданском порядке — уголовного наказания нет — но могут привести к судебным запретам по , взысканию убытков по статье 5 и даже к тройному возмещению в отдельных умышленных случаях по статье 14-2. В гражданском деле Yanolja по этой модели было взыскано около 1 млрд вон.

Дело Yanolja: почему можно выиграть по уголовному делу, но проиграть по гражданскому

Это дело должен понять каждый бизнес-пользователь в Корее. Я расскажу его как одну историю, потому что именно так все и происходило — и потому что разделенный результат здесь и есть главное.

Что произошло: GC Company собрала данные о поездках Yanolja

GC Company управляла конкурирующей онлайн-платформой для путешествий. Они создали собственный crawler, который обращался к API-серверу приложения Yanolja Baro Reservation, определял URL API и команды запросов и отправлял их серверу. Скрейпер собирал данные о размещении — названия партнеров, адреса, цены, наличие и изображения. GC Company использовала эти данные внутри компании для маркетинга и конкурентного позиционирования.

Yanolja подала и уголовную жалобу, и гражданский иск.

Уголовный вердикт: оправдание по всем пунктам (Верховный суд 2021Do1533)

ig_0cdf68974ff22a4a0169f1ac46e080819188cd13d53eebebdf_compressed.webp

12 мая 2022 года Верховный суд , по всем трем обвинениям:

  • ICNA Article 48 (вторжение): ограничений доступа не было. API-сервер был публично доступен через браузер и мобильное приложение. Технической блокировки не существовало. Положения ToS ограничивали использование, а не доступ.
  • Закон об авторском праве (права изготовителя базы данных): подсудимые не воспроизвели «всю или существенную часть» базы данных. Скопированные данные уже были публично известны, а доказательств того, что скопированный фрагмент отражал существенные инвестиции Yanolja, не хватило.
  • Статья 314 Уголовного кодекса (воспрепятствование бизнесу): фактического нарушения работы API-сервера Yanolja доказано не было. Изменения данных не было. Не было и mens rea для воспрепятствования бизнесу.

Формулируемое правило: ограничения доступа оцениваются через «защитные меры, условия использования и иные объективно проявленные обстоятельства». Если ворота опущены, проход через них — не вторжение.

Гражданский вердикт: 1 млрд вон ущерба по UCPA

А вот здесь история меняется. Центральный районный суд Сеула — а затем и Высокий суд Сеула (дело 2021Na2034740, решение от 25 августа 2022 года) — признали, что GC Company нарушила универсальную норму UCPA. Суд присудил примерно 1 млрд вон (~800 тыс. долларов США) компенсационного ущерба и запретил дальнейшее копирование данных.

Мотивировка была такой: база данных о размещении Yanolja имела коммерческую ценность и отражала существенные инвестиции — в сбор, проверку и обновление данных о жилье. GC Company воспользовалась этими инвестициями бесплатно. Гражданское решение было окончательно подтверждено на уровне Высокого суда Сеула.

Практический вывод: уголовное оправдание не означает гражданскую безопасность

Это самый неожиданный урок из корейского права о скрейпинге. Уголовно законный доступ не освобождал от ответственности за коммерчески недобросовестное использование. Вопросы «Могут ли меня преследовать?» и «Могут ли на меня подать в суд?» — разные, и ответы на них могут быть противоположными.

Для бизнеса: даже если ваш способ скрейпинга явно относится к зеленой зоне в уголовном смысле, именно использование данных — особенно если вы напрямую конкурируете с источником — определяет гражданский риск.

Корея vs США vs ЕС: как сравниваются законы о web scraping

Я не нашел другого гайда, который бы свел это в одну таблицу, что удивительно, если учесть, сколько компаний собирает данные сразу в нескольких юрисдикциях.

ПараметрЮжная КореяСШАЕС / ЕЭЗ
Базовый законICNA Art 48, Закон об авторском правеCFAA (18 U.S.C. §1030), законы штатовGDPR, Директива о базах данных (96/9/EC)
Ключевое делоYanolja v GC Company (Верховный суд 2021Do1533, 2022)hiQ v LinkedIn (9th Cir. 2022), Van Buren v. US (2021)Ryanair v PR Aviation (СЕС C-30/14, 2015)
Сбор публичных данныхЗаконно при отсутствии объективных барьеров доступа («ворота опущены»)Законно по логике hiQ (публичные данные); Van Buren сузило CFAAЗависит от прав на БД, договора, авторского права, GDPR и закона государства-члена
Правила для персональных данныхPIPA (с поправками 2023) — согласие или законное основаниеСекторально: CCPA (Калифорния), законы штатов о конфиденциальностиGDPR — строгое согласие / законный интерес; максимальный штраф €20 млн или 4% глобальной выручки
Нарушение ToS = преступление?Нет (суды считают ToS не равным нарушению ICNA)Нет (Van Buren 2021: ToS ≠ CFAA)Обычно нет, но возможно нарушение договора (Ryanair)
Защита баз данныхПрава изготовителя БД по Закону об авторском правеНет общего федерального права на БДОсобое право sui generis на базу данных
Макс. уголовное наказаниеДо 5 лет / 50 млн вон (ICNA)До 10 лет / $250K (CFAA)Зависит от государства-члена

Ключевые различия, важные для вашего бизнеса

  • В Корее нет широкого исключения для text-and-data-mining (TDM), как в Директиве ЕС DSM. Если вы обучаете ИИ-модели на собранных корейских данных, у вас нет статутного carve-out.
  • Универсальная норма UCPA в Корее шире и менее предсказуемая, чем американское право о недобросовестной конкуренции. Гражданский результат по делу Yanolja было бы гораздо сложнее воспроизвести в США.
  • Все три юрисдикции согласны: само по себе нарушение Terms of Service не является уголовным преступлением.
  • Защита баз данных в Корее закреплена законом (как и в ЕС), тогда как в США нет общего федерального права на базы данных. Это дает корейским платформам больше гражданско-правовых инструментов.
  • Если вы скрейпите данные через границы, применяется самый строгий закон из тех, что могут затронуть проект. Проект, работающий с корейскими, американскими и европейскими данными, должен соответствовать всем трем режимам.

Сценарии по отраслям: законен ли web scraping в Корее для вашей сферы?

Профиль риска сильно зависит от отрасли, и ни один найденный мной гайд не сопоставлял корейское право о скрейпинге с конкретными вертикалями. Поэтому я собрал это сам.

E-commerce: мониторинг цен и товарные данные

ig_0cdf68974ff22a4a0169f1ac9435c88191a26d0fb5beb6f17d_compressed.webp

Сбор публичных цен на товары с Coupang, Gmarket или 11Street — самый чистый пример зеленой зоны: держитесь фактических полей (цена, наличие, название товара), не заходите в разделы только для логина, не обходите технические блокировки и используйте данные внутри компании для бенчмаркинга.

Риск растет, если вы собираете описания товаров (творческий контент → авторское право), контактные данные продавцов (PIPA), изображения (авторское право) или весь каталог целиком (права изготовителя БД + UCPA).

Я не нашел крупного корейского дела по e-commerce-скрейпингу, сопоставимого с Yanolja. Более развитый прецедент есть в travel и recruitment — но отсутствие исков не означает отсутствия риска.

и cloud scraping-режим как раз созданы для такого сценария: регулярных проверок цен и наличия на публичных страницах, а AI Suggest Fields позволяет выбрать нужные столбцы и исключить поля с персональными данными.

Недвижимость: объявления объектов

Недвижимость по своей природе находится в желтой зоне. Объявления на платформах вроде Zigbang или Naver Real Estate смешивают фактические данные (цена, площадь, район) с именами агентов, офисными телефонами, мобильными номерами, фотографиями и тщательно собранными платформенными базами.

Сбор публичных данных по объектам может быть относительно низкорисковым. Но извлечение контактных столбцов агентов сразу запускает PIPA — а скрейпинг всех объявлений в регионе уже начинает выглядеть как существенное копирование базы данных.

Снижение риска: исключайте персональные столбцы, уменьшайте географический охват, документируйте законную бизнес-цель, соблюдайте rate limits и не воспроизводите конкурирующий сервис объявлений. ИИ Thunderbit можно настроить так, чтобы он извлекал только нужные поля объекта — цену, квадратные метры, местоположение — и пропускал персональные контактные данные.

Подбор персонала: вакансии

Recruitment — это сектор с высоким риском, без вариантов. В Корее есть прямой прецедент: JobKorea v. Saramin. Saramin собирала базу вакансий JobKorea и была признана ответственной за нарушение прав на базу данных и недобросовестную конкуренцию. Данные о вакансиях обычно сочетают инвестиции платформы (курируемые, проверенные объявления), массовое копирование БД и персональные данные или контактные данные рекрутеров.

Моя рекомендация: в целом избегайте скрейпинга конкурирующей job-платформы для создания или обогащения собственной базы вакансий. Если кейс узкий, проведите юридическую проверку до сбора, минимизируйте объем, удалите персональные контакты и не распространяйте результаты дальше.

Полная таблица санкций: чем вы рискуете, если web scraping в Корее пойдет не так

Корейский законТип нарушенияМакс. уголовное наказаниеМакс. гражданское/админ. взысканиеКлючевое изменение 2023–2026
ICNA Art 48Несанкционированный доступ / вмешательство5 лет / штраф 50 млн вонУщерб + судебный запрет2024: добавлена ст. 48(4), нацеленная на инструменты обхода
Закон об авторском праве (права на БД, ст. 93)Существенное воспроизведение БД3 года / штраф 30 млн вонЗаконные убытки до 50 млн вон/произведение (умышленное коммерческое нарушение)
PIPAНезаконный сбор персональных данных5 лет / штраф 50 млн вонАдминштраф до 3% от общей выручки; возможен коллективный искРеформа 2023; руководство PIPC 2024 по публичным данным и ИИ; тренд 2026 на 10% за повторные утечки
UCPA Art 2(1)(k)/(m)Недобросовестное получение / использование данныхТолько гражданская ответственность (для catch-all уголовного наказания нет)Ущерб + судебный запрет; тройное возмещение в отдельных умышленных случаяхПоправки 2022 года усилили положения Data Framework Act
Уголовный кодекс Art 314Воспрепятствование бизнесу техническими средствами5 лет / штраф 15 млн вонYanolja: фактическое нарушение работы не доказано

Критический момент: уголовный и гражданский треки идут независимо. Вы можете столкнуться с обоими одновременно — и выиграть один, но проиграть другой.

Ваш 10-пунктовый чек-лист соответствия для web scraping в Корее

Ниже — десять вопросов «да/нет», которые стоит пройти перед запуском любого проекта по сбору данных. Распечатайте, добавьте в закладки, приклейте к монитору — как вам удобно.

  1. Требуется ли на целевом сайте логин, чтобы получить доступ к нужным данным? Если нужен логин, токен или аккаунт, риск резко смещается в сторону ICNA Article 48.
  2. Есть ли технические ограничения доступа? CAPTCHA, IP-блокировки, API-ключи, rate limits и bot walls — сильные сигналы красной зоны.
  3. Проверяли ли вы robots.txt сайта? Сам по себе он не имеет обязательной силы в корейской судебной практике, но это полезное доказательство ожиданий сайта и вашей добросовестности.
  4. Собираете ли вы какие-либо персональные данные? Если в скоуп входят имена, телефоны, email, ID или индивидуальные контактные данные, нужен анализ по PIPA.
  5. Копируете ли вы «существенную часть» базы данных сайта? Смотрите и на количество, и на качество — сколько именно и отражает ли скопированный фрагмент инвестиции источника?
  6. Определили ли вы цель использования? Внутренняя аналитика менее рискованна, чем распространение или построение конкурирующей базы данных. (Но дело Yanolja показывает, что внутреннее конкурентное использование не является полной защитой.)
  7. Описали ли вы законную деловую цель письменно? Документация помогает в балансировке законного интереса по PIPA и служит доказательством добросовестности.
  8. Удалили ли вы или анонимизировали персональные поля перед хранением/использованием? Исключение контактных данных часто выводит скрейпинг недвижимости, рекрутинга и справочников из самой опасной схемы PIPA.
  9. Используете ли вы разумные интервалы запросов? Избегайте перегрузки сервера — риск по Уголовному кодексу Art 314 и ICNA Article 48(3) растет, если скрейпинг нарушает работу сервиса.
  10. Консультировались ли вы с корейским юристом по крупным, коммерческим или трансграничным проектам? На проект могут одновременно распространяться корейское право, GDPR и американские законы о конфиденциальности или доступе к компьютерам.

⚠️ Отказ от ответственности: этот чек-лист предназначен для ориентации, а не как юридическая консультация. Для конкретных ситуаций всегда консультируйтесь с местным корейским юристом.

Как Thunderbit помогает ответственно собирать данные с корейских сайтов

Полное раскрытие: я работаю в маркетинговой команде Thunderbit. Но я искренне считаю, что здесь продукт и право действительно хорошо совпадают, и это не просто продажа.

Thunderbit создан для тех сценариев из зеленой зоны, о которых идет речь в статье: сбор общедоступных данных без логина. Вот как конкретные функции соотносятся с рамкой соответствия:

  • Cloud scraping mode для публичных сайтов — не нужно входить в систему, не нужна локальная сессия, работа остается в пределах общедоступного доступа. Это соответствует принципу Yanolja «ворота опущены».
  • AI Suggest Fields позволяет точно определить, какие столбцы данных извлекать. Нужны цены и наличие, но не телефоны продавцов? Просто исключите персональные столбцы. Это самый простой способ избежать триггеров PIPA.
  • Планировщик (scheduled scraper) для регулярных проверок цен, наличия или объявлений с разумными интервалами — не нужно непрерывно долбить сервер запросами.
  • Бесплатный экспорт данных в Excel, Google Sheets, Airtable и Notion для внутренних аналитических процессов.
  • Сбор подстраниц для обогащения данных публичных объявлений (например, переход в отдельные страницы товаров за спецификациями) без доступа к зонам только для логина или ограниченным разделам.
  • Адаптация макета с помощью ИИ — скрейпер заново считывает структуру сайта каждый раз и подстраивается под изменения верстки без хрупких жестко прописанных селекторов.

Thunderbit поддерживает многокязычную работу на десятках языков, что важно для команд, работающих с корейскоязычными сайтами. Попробовать можно бесплатно через .

Ни один инструмент не устраняет юридический риск. Но ответственная настройка — публичные страницы, фактические данные, исключенные персональные поля, разумные интервалы — помогает оставаться в рамках соответствия, описанных в этой статье.

Главные выводы о законности web scraping в Корее

Пять вещей, которые стоит запомнить:

  1. Технология web scraping сама по себе в Корее законна. Верховный суд подтвердил это в решении по делу Yanolja.
  2. Риск зависит от способа доступа (ворота подняты vs. опущены), типа данных (персональные vs. фактические) и использования (внутреннее vs. конкурентное распространение).
  3. Уголовное оправдание ≠ гражданская безопасность. Дело Yanolja показывает, что можно избежать уголовного преследования, но все равно получить ущерб на миллиард вон.
  4. Если вы собираете публичные, неперсональные, фактические данные для внутреннего использования и без барьеров доступа, вы обычно в безопасной зоне. Но слово «обычно» здесь важно — имеют значение объем, масштаб и цель.
  5. Для крупных или коммерческих проектов всегда консультируйтесь с местным корейским юристом. Эта статья — для ориентации, а не юридический совет.

Если вы хотите начать ответственно собирать данные с корейских сайтов, позволит протестировать рабочий процесс в небольшом масштабе. Подробнее о том, как ИИ-скрейпинг работает на практике, читайте в наших гайдах по и . А если хотите увидеть инструмент в действии, на нашем есть пошаговые разборы типовых сценариев.

FAQ

1. Законен ли сбор публично доступных данных в Корее?

В целом да — для уголовного права. По решению Верховного суда по делу Yanolja доступ к данным с сайта без объективных ограничений доступа не нарушает ICNA. Однако гражданская ответственность по UCPA или Закону об авторском праве все равно может наступить — в зависимости от объема, инвестиций источника и того, как вы используете данные.

2. Могут ли на меня подать в суд за web scraping в Корее, даже если это не преступление?

Да. Уголовный и гражданский треки независимы. GC Company была оправдана по всем уголовным обвинениям, но по универсальной норме UCPA была обязана выплатить около 1 млрд вон гражданского ущерба. Уголовное оправдание не защищает от гражданского иска.

3. Делает ли нарушение Terms of Service сайта web scraping незаконным в Корее?

Корейские суды последовательно считают, что одно лишь нарушение ToS не образует уголовного преступления по ICNA — суд различает ограничение использования (ToS) и ограничение доступа (технические барьеры). При этом нарушение ToS все еще может поддерживать гражданский иск о нарушении договора или использоваться как доказательство недобросовестности в анализе недобросовестной конкуренции.

4. Чем корейское право о web scraping отличается от американского?

В обеих юрисдикциях защищается сбор публичных данных (Yanolja в Корее, hiQ v LinkedIn в США), и в обеих считается, что нарушение ToS само по себе не является уголовным преступлением (Van Buren в США). Главное отличие: в Корее сильнее статутная защита баз данных и шире универсальная норма против недобросовестной конкуренции, тогда как в США нет общего федерального права на базы данных. У корейских платформ больше гражданско-правовых инструментов против скрейперов.

5. Что будет, если я соберу персональные данные с корейских сайтов?

PIPA применяется независимо от того, видна ли информация публично. Сбор персональных данных — имен, телефонов, email — без согласия или другого законного основания является нарушением. Поправка к PIPA 2023 года усилила защиту, а руководство PIPC 2024 года по общедоступной персональной информации прямо касается web crawling и scraping. Наказание может достигать 5 лет лишения свободы, штрафа 50 млн вон и административных санкций до 3% от общей выручки.

Попробуйте Thunderbit для ответственного web scraping

Узнать больше

Fawad Khan
Fawad Khan
Фавад зарабатывает на жизнь писательством — и, честно говоря, ему это даже нравится. Он годами разбирался, что делает текст цепляющим, а что заставляет читателя пролистнуть дальше. Спросите его о маркетинге — и он будет говорить часами. Спросите о карбонаре — и он будет говорить еще дольше.
Содержание

Попробуй Thunderbit

Собирай лиды и другие данные всего в 2 клика. На базе AI.

Получить Thunderbit Это бесплатно
Извлекай данные с помощью AI
Легко передавай данные в Google Sheets, Airtable или Notion
Chrome Store Rating
PRODUCT HUNT#1 Product of the Week