Je web scraping v Koreji legální? Co by měli vědět neprávníci

Naposledy aktualizováno April 30, 2026

Před několika měsíci se nás jeden uživatel zeptal na otázku, která mě zastavila uprostřed doušku kávy: „Když budu stahovat veřejné ceny produktů z Coupangu, skončím u korejského soudu?“ Upřímně, neměl jsem po ruce jistou jednovětou odpověď — a stejně na tom byla i většina právních průvodců, které jsem našel online.

Ta otázka mi zůstala v hlavě, protože ji si tiše googlí každý týden tisíce provozovatelů e-shopů, obchodních týmů i zakladatelů SaaS firem. Globální trh služeb web scrapingu dosáhl v roce 2024 zhruba a rychle roste. Více firem než kdy dřív sbírá webová data — a čím dál víc z nich přemýšlí, kde přesně v Koreji leží právní hranice. Korea scraping přímo nezakazuje.

Ale podle toho, co scrapujete, jak to scrapujete a proč, mohou se uplatnit čtyři hlavní zákony. Nejznámější případ, na který všichni odkazují, je rozhodnutí korejského Nejvyššího soudu ve věci Yanolja (2021Do1533, rozhodnuto 12. května 2022), který v trestní rovině zprostil viny nástroj konkurenta pro scraping — a pak v samostatném civilním řízení uložil stejné společnosti škodu ve výši zhruba 1 miliardy KRW. Právě tenhle dvojí výsledek je to nejdůležitější, co by měl laik o korejském právu týkajícím se scrapingu vědět, a je páteří tohoto průvodce. Právnický titul nepotřebujete — stačí praktický rámec rizik, který můžete opravdu použít.

Obtížnost: Začátečník (není třeba právní ani technické znalosti)
Čas potřebný: přibližně 15 minut čtení; průběžná reference
Co budete potřebovat: Základní představu o tom, co web scraping dělá (pokud si to chcete osvěžit, podívejte se na náš článek )

Je web scraping v Koreji legální? Stručná odpověď

Samotný web scraping v Koreji nelegální není. Je to neutrální technologie — podobně jako webový prohlížeč nebo vzorec v tabulce. Korejské soudy se dlouhodobě nezaměřují na nástroj, ale na chování spojené s jeho používáním.

ig_0cdf68974ff22a4a0169f1aba6b77c8191a0d3fa1e58ce2c97_compressed.webp

Nejlepší mentální model nabízí rozhodnutí Nejvyššího soudu ve věci Yanolja: princip „brána nahoře vs. brána dole“. Pokud web nemá žádná objektivní omezení přístupu — žádnou přihlašovací bránu, CAPTCHA, požadavek na API klíč ani blokování IP adres — je brána „dole“ a přístup k veřejně dostupným datům obvykle nepředstavuje trestný čin podle korejského zákona o informačních a komunikačních sítích (ICNA). Soud se konkrétně zabýval tím, zda přístup omezovaly „ochranné prostředky, podmínky použití a další objektivně zjevné okolnosti“, a dospěl k závěru, že server API Yanolja byl volně dostupný přes veřejnou aplikaci.

Ale „není to trestné“ neznamená „je to bez rizika“.

Civilní odpovědnost je úplně jiná otázka. Trestnímu stíhání se můžete vyhnout a přesto čelit náhradě škody ve výši jedné miliardy wonů. Případ Yanolja to ukázal bolestivě jasně.

Na web scraping se mohou vztahovat čtyři korejské zákony:

  1. ICNA (Information and Communications Network Act) — pravidlo „zákaz vniknutí“
  2. Autorský zákon — práva výrobce databáze
  3. PIPA (Personal Information Protection Act) — pravidla pro sběr osobních údajů
  4. UCPA (Unfair Competition Prevention Act) — zastřešující pravidlo „neparazitovat“

Zbytek tohoto průvodce mapuje tyto zákony na reálné situace, abyste zjistili, kam váš scraping projekt skutečně spadá.

Zeleno-žluto-červený rámec rizik pro web scraping v Koreji

ig_0cdf68974ff22a4a0169f1abfb386c8191baf73515035c6cdc_compressed.webp

Každý právní článek, který jsem ke korejskému scrapingu našel, působí, jako by byl napsaný pro advokáty. Pokud jste manažer e-shopu nebo zakladatel SaaS firmy, nepotřebujete čtyřicetistránkovou právní analýzu — potřebujete rychlý způsob, jak odhadnout riziko, než projekt spustíte. Představte si to jako semafor. Zelená znamená jít dál (s běžnou opatrností). Žlutá znamená zpomalit a zkontrolovat zpětná zrcátka. Červená znamená zastavit a zavolat právníkovi.

Zelená zóna: Scénáře scrapingu s nízkým rizikem

ScénářÚroveň rizikaKlíčový zákonProč
Scraping veřejných produktových nabídek (bez přihlášení, bez CAPTCHA)🟢 NízkéICNA, autorský zákonRozhodnutí Yanolja: žádné omezení přístupu = žádné porušení ICNA; faktická data (ceny, dostupnost) nejsou tvůrčí projev
Scraping veřejných cen pouze pro interní analytiku🟢 NízkéUCPA, autorský zákonFaktická data, omezený rozsah, žádná konkurenční redistribuce
Sběr nefyzických, nechráněných faktů z veřejných stránek🟢 NízkéICNA, autorský zákonNebylo obejito žádné omezení přístupu; jednotlivá fakta nejsou chráněna

Tuto zónu ukotvuje trestní rozhodnutí ve věci Yanolja. Nejvyšší soud neshledal zásah do ICNA, protože server API byl volně dosažitelný — běžní uživatelé k němu mohli přistupovat přes aplikaci s členstvím i bez něj a žádná samostatná technická ochrana přístupu k API neexistovala.

Pro uživatele je to ideální scénář. Pokud scrapujete veřejné e-commerce nebo realitní weby v cloudovém režimu — sbíráte názvy produktů, ceny, dostupnost nebo metadata nabídek a zároveň vynecháváte osobní údaje — obvykle se pohybujete v zelené zóně. (To ale neznamená „vždy“, a nuance vysvětlím níže.)

Žlutá zóna: Scénáře scrapingu se středním rizikem

ScénářÚroveň rizikaKlíčový zákonProč
Scraping osobních údajů (jména, e-maily, telefonní čísla) i z veřejných stránek🟡 StředníPIPA, ICNAPIPA platí bez ohledu na veřejnou viditelnost; novela z roku 2023 zpřísnila pravidla pro souhlas
Scraping velkých objemů, které mohou tvořit „podstatnou část“ databáze konkurenta🟡 StředníAutorský zákon, UCPAKvantitativní i kvalitativní test podle korejského práva
Ignorování signálů robots.txt🟡 StředníDůkaz zlé vírySice nejde samo o sobě o trestný čin, ale u soudu to může hrát proti vám
Scraping veřejných dat a jejich přímé využití ke konkurenci zdroji🟡 StředníUCPAParazitování na investicích jiné platformy

Osobní údaje jsou největším spouštěčem žluté zóny.

I když je telefonní číslo nebo e-mail viditelný na veřejné webové stránce, PIPA se stejně uplatní. Reforma PIPA z roku 2023 rozšířila práva subjektů údajů a zpřísnila požadavky na souhlas. A v roce 2024 vydala korejská Komise pro ochranu osobních údajů (PIPC) v kontextu AI a sběru dat — a jasně uvedla, že samotná veřejná dostupnost není obecné povolení.

Na objemu také záleží. Nejvyšší soud ve věci Yanolja uvedl, že o tom, zda jste zkopírovali „podstatnou část“ databáze, rozhodují kvantitativní i kvalitativní faktory. Porovnejte zkopírovanou část s celou databází a zeptejte se, zda odráží podstatnou investici výrobce.

Červená zóna: Scénáře scrapingu s vysokým rizikem

ScénářÚroveň rizikaKlíčový zákonProč
Scraping za přihlašovací bránou nebo obcházení přístupových kontrol🔴 VysokéICNA čl. 48„Brána nahoře“ = neoprávněný přístup; vysoké riziko stíhání
Obcházení CAPTCHA, IP blokací nebo systémů detekce botů🔴 VysokéICNA čl. 48(4)Novela z roku 2024 výslovně cílí na nástroje a zařízení k obejití ochrany
Kopírování a další prodej celé databáze konkurenta🔴 VysokéAutorský zákon (práva k databázi), UCPAPodstatné rozmnožení + komerční parazitování
Sběr osobních údajů bez právního základu pro marketing nebo oslovení🔴 VysokéPIPAAž 5 let / pokuta 50 mil. KRW; správní sankce až 3 % obratu

Nově přidané ustanovení v ICNA z roku 2024 — článek 48(4) — nyní výslovně zakazuje instalaci, přenos nebo distribuci programů či technických zařízení, která bez legitimního důvodu obcházejí „běžné ochranné nebo ověřovací postupy“.

Samostatně pak rozhodnutí Nejvyššího soudu z listopadu 2024 (2021Do5555) závěr, že neoprávněný zásah do sítě může existovat i bez fyzického poškození ochranných prvků. Stačí použít cizí identifikátory nebo nesprávné příkazy, aby se obešly limity přístupu.

Čtyři korejské zákony, které se na web scraping vztahují

ZákonCo chráníKdy se u scraperů uplatní
ICNA článek 48Stabilitu sítě, oprávnění k přístupuObcházení loginu, CAPTCHA, ověření, IP blokací, limitů API klíče
Autorský zákon (čl. 93)Tvůrčí díla + práva výrobce databázeKopírování expresivního obsahu, obrázků nebo celé/podstatné části databáze
PIPAOsobní údaje, práva subjektů údajůSběr jmen, telefonních čísel, e-mailů, ID — i z veřejných stránek
UCPA (čl. 2(1)(k) a (m))Férová soutěž, komerčně cenná dataParazitování na datové investici jiné platformy pro vlastní konkurenční byznys

ICNA článek 48: Pravidlo „zákaz vniknutí“

ICNA článek 48(1) říká, že nikdo nesmí vstoupit do informační a komunikační sítě „bez legitimního oprávnění k přístupu nebo nad rámec povoleného oprávnění k přístupu“. Ve světě scrapingu to znamená: pokud má web přístupová omezení, která obcházíte, porušujete zákon. Pokud žádná omezení nejsou — veřejná stránka, bez přihlášení — jste pravděpodobně v pořádku.

Trest za porušení může podle ICNA článku 71 činit až .

Jeden důležitý detail: korejský Nejvyšší soud dlouhodobě odlišuje omezení v podmínkách používání od omezení přístupu. Podmínky aplikace Yanolja omezovaly komerční opětovné využití a zakazovaly automatizované programy, které zatěžovaly server, ale soud dospěl k závěru, že tyto klauzule objektivně neomezovaly přístup k samotnému serveru API.

Autorský zákon: Práva výrobce databáze

Korejský autorský zákon chrání výrobce databází odděleně od autorských práv k jednotlivému obsahu. Podle je rozmnožování „všech nebo podstatné části“ databáze nezákonné — i když jednotlivé datové body jsou veřejná fakta.

Test je kvantitativní (kolik jste zkopírovali vzhledem k celku?) i kvalitativní (odráží zkopírovaná část podstatnou investici výrobce do budování, ověřování nebo údržby databáze?). Opakované nebo systematické kopírování menších částí se také může počítat, pokud v praxi dosáhne stejného výsledku jako kopírování podstatné části.

Trest za porušení práv výrobce databáze: až tři roky nebo 30 milionů KRW podle článku 136(2)(3). Zákonné náhrady škody podle článku 125-2 umožňují až 10 milionů KRW za dílo, nebo 50 milionů KRW za dílo při úmyslném porušení za účelem zisku.

PIPA: Zákon o ochraně osobních údajů

PIPA upravuje sběr osobních údajů — jmen, kontaktů, identifikátorů — i tehdy, jsou-li veřejně viditelné. Reforma z roku 2023 byla významná: rozšířila práva subjektů údajů, zpřísnila požadavky na souhlas, zavedla pravidla pro automatizované rozhodování a stanovila správní sankce až za vybraná porušení.

výslovně zmiňuje data získaná prostřednictvím „web crawlingu a scrapingu“ v kontextu veřejně dostupných osobních údajů. Pokyny objasňují, že v některých situacích může být právním základem oprávněný zájem, ale organizace musí provést vyvážení zájmů, zavést ochranná opatření, chránit práva subjektů údajů a mít odpovídající governance.

A trend je přísnější. V březnu 2026 , která zvyšuje maximální sankce za závažná opakovaná pochybení při úniku dat až na 10 % obratu, s účinností později v roce 2026.

UCPA: Zastřešující pravidlo proti nekalé soutěži

UCPA je zákon, který v civilní části případu Yanolja dopadl na společnost GC Company. Současný zákon obsahuje dvě relevantní ustanovení:

  • Čl. 2(1)(k): pokrývá nekalé užití elektronicky shromážděných a spravovaných technických nebo obchodních dat, která nejsou tajná
  • Čl. 2(1)(m): širší zastřešující ustanovení pro využití výsledků práce jiné osoby dosažených podstatnou investicí nebo úsilím, pro vlastní podnikání bez svolení a v rozporu s férovými obchodními praktikami

UCPA je u těchto ustanovení pouze civilní — bez trestních sankcí — ale může vést k zákazu činnosti podle , náhradě škody podle článku 5 a dokonce k trojnásobné náhradě škody v určených úmyslných případech podle článku 14-2. Civilní část případu Yanolja podle tohoto rámce přiznala zhruba 1 miliardu KRW.

Případ Yanolja: Proč můžete v trestní rovině vyhrát, ale v civilní prohrát

To je ten případ, kterému musí rozumět každý byznysový uživatel v Koreji. Řeknu ho jako jeden příběh, protože přesně tak se odehrál — a protože ten rozdělený výsledek je na tom to podstatné.

Co se stalo: GC Company scrapovala cestovní data Yanolja

GC Company provozovala konkurenční online cestovní platformu. Vyvinula vlastní crawler, který přistupoval k serveru API aplikace Baro Reservation od Yanolja, zjistil adresy API a příkazy požadavků a posílal je na server. Scraper sbíral informace o ubytování — názvy partnerů, adresy, ceny, dostupnost a obrázky. GC Company tato data používala interně pro marketing a konkurenční pozicování.

Yanolja podala trestní oznámení i civilní žalobu.

Trestní verdikt: Nevinný ve všech bodech (Nejvyšší soud 2021Do1533)

ig_0cdf68974ff22a4a0169f1ac46e080819188cd13d53eebebdf_compressed.webp

Nejvyšší soud ve všech třech bodech:

  • ICNA čl. 48 (vniknutí): Neexistovala žádná omezení přístupu. Server API byl veřejně dostupný přes prohlížeč i mobilní aplikaci. Nebylo použito žádné technické blokování. Podmínky používání omezovaly užití, ne přístup.
  • Autorský zákon (práva výrobce databáze): Obžalovaní nereprodukovali „vše nebo podstatnou část“ databáze. Zkopírovaná data byla už veřejně známá a důkazy neprokázaly, že kopírovaná část odrážela podstatnou investici Yanolja.
  • Trestní zákon čl. 314 (narušení podnikání): Nebylo prokázáno skutečné narušení provozu serveru API Yanolja. Nedošlo ke změně dat. Nebyl prokázán úmysl pro narušení podnikání.

Citovatelná zásada zní: omezení přístupu musí být posuzována podle „ochranných opatření, podmínek použití a dalších objektivně zjevných okolností“. Když je brána dole, projít jí není vniknutí.

Civilní verdikt: Náhrada škody 1 miliarda KRW podle UCPA

A tady se příběh láme. Ústřední okresní soud v Soulu — a poté i Soulský vrchní soud (spis 2021Na2034740, rozhodnuto 25. srpna 2022) — dospěly k závěru, že GC Company porušila zastřešující ustanovení UCPA. Soud přiznal přibližně 1 miliardu KRW (asi 800 tisíc USD) jako náhradu škody a nařídil ukončení dalšího kopírování dat.

Odůvodnění: databáze ubytování Yanolja měla komerční hodnotu a odrážela podstatnou investici — sběr, ověřování a aktualizaci údajů o ubytování. GC Company na této investici parazitovala. Civilní rozsudek byl na úrovni Soulského vrchního soudu pravomocně potvrzen.

Praktický závěr: Zproštění viny v trestním řízení neznamená civilní bezpečí

Tohle je nejvíc proti intuici působící lekce z korejského práva o scrapingu. Trestně legální přístup nechrání před civilně nekalým využitím. „Mohou mě stíhat?“ a „Můžou mě žalovat?“ jsou dvě různé otázky s potenciálně opačnými odpověďmi.

Pro byznys uživatele: i když je vaše metoda scrapingu z trestního hlediska jasně v zelené zóně, vaše využití dat — zejména pokud přímo konkuruje zdroji — určuje civilní riziko.

Korea vs. USA vs. EU: Jak se pravidla pro web scraping srovnávají

Nenašel jsem jiného průvodce, který by to shrnul do jedné tabulky — což je zvláštní, když uvážíte, kolik firem scrapuje napříč hranicemi.

OblastJižní KoreaSpojené státyEU / EHP
Hlavní zákonICNA čl. 48, autorský zákonCFAA (18 U.S.C. §1030), státní zákonyGDPR, směrnice o databázích (96/9/ES)
Přelomový případYanolja v. GC Company (Nejvyšší soud 2021Do1533, 2022)hiQ v. LinkedIn (9. okruh, 2022), Van Buren v. US (2021)Ryanair v. PR Aviation (SDEU C-30/14, 2015)
Scraping veřejných datLegální, pokud neexistují objektivní překážky přístupu („brána dole“)Legální podle logiky hiQ (veřejná data); Van Buren zúžil CFAAZáleží na právech k databázi, smlouvě, autorském právu, GDPR a právu členského státu
Pravidla pro osobní údajePIPA (po novele 2023) — souhlas nebo právní základSektorové: CCPA (Kalifornie), státní zákony o ochraně soukromíGDPR — přísný souhlas / oprávněný zájem; max. pokuta 20 mil. € nebo 4 % globálního obratu
Porušení ToS = trestný čin?Ne (soudy drží ToS ≠ porušení ICNA)Ne (Van Buren 2021: ToS ≠ CFAA)Obvykle ne, ale může jít o porušení smlouvy (Ryanair)
Ochrana databázíPráva výrobce databáze podle autorského zákonaŽádné federální právo k databáziSui generis právo k databázi
Maximální trestní sankceAž 5 let / 50 mil. KRW (ICNA)Až 10 let / 250 tis. USD (CFAA)Liší se podle členského státu

Hlavní rozdíly, které jsou pro váš byznys důležité

  • Korea nemá obecnou výjimku pro text and data mining (TDM) jako směrnice EU DSM. Pokud trénujete AI modely na scrapovaných korejských datech, nemáte zákonnou výjimku.
  • Zastřešující ustanovení UCPA v Koreji je širší a méně předvídatelné než americké právo nekalé soutěže. Civilní výsledek ve věci Yanolja by bylo mnohem těžší zopakovat podle amerického práva.
  • Všechny tři jurisdikce se shodují: samotné porušení podmínek používání není trestným činem.
  • Korejská ochrana databází je zákonná (podobně jako v EU), zatímco USA nemají obecné federální právo k databázi. To dává korejským platformám více civilních nástrojů.
  • Když scrapujete napříč hranicemi, platí nejpřísnější relevantní zákon. Projekt zasahující korejská, americká i evropská data musí splnit všechny tři režimy.

Scénáře podle odvětví: Je web scraping v Koreji legální pro váš obor?

Rizikový profil se podle odvětví dramaticky liší a žádný průvodce, který jsem našel, nemapoval korejské právo pro scraping na konkrétní segmenty. Proto jsem si to musel poskládat sám.

E-commerce: Sledování cen a produktová data

ig_0cdf68974ff22a4a0169f1aba6b77c8191a0d3fa1e58ce2c97_compressed.webp

Scraping veřejných cen produktů z Coupangu, Gmarketu nebo 11Street je nejčistší příklad v zelené zóně — držte se faktických polí (cena, dostupnost, název produktu), vyhýbejte se částem dostupným jen po přihlášení, neobcházejte technické blokace a používejte data interně pro benchmarking.

Riziko roste, když scrapujete produktové popisy (tvůrčí obsah → autorské právo), kontaktní údaje prodejců (PIPA), obrázky (autorské právo) nebo celý katalog (práva výrobce databáze + UCPA).

Nenalezl jsem žádný zásadní korejský spor o scraping v e-commerce, který by se dal srovnat s Yanolja. Vyspělejší precedens je v cestovním ruchu a náboru — ale absence sporů neznamená absenci rizika.

Thunderbit a cloudový režim scrapingu jsou přesně pro tenhle scénář: pravidelné kontroly cen a zásob na veřejných stránkách, přičemž funkce AI Suggest Fields vám umožní vybrat požadované sloupce a vyloučit osobní údaje.

Reality: Nabídky nemovitostí

Reality jsou přirozeně v žluté zóně. Nabídky na platformách jako Zigbang nebo Naver Real Estate kombinují faktická data (cena, plocha, čtvrť) s jmény makléřů, telefonními čísly kanceláří, mobilními čísly, fotografiemi a kurátorovanými databázemi platformy.

Scraping veřejných údajů o nemovitostech může být méně rizikový. Ale sběr kontaktních sloupců makléřů okamžitě spouští PIPA — a scraping všech nabídek v regionu už začíná vypadat jako podstatné kopírování databáze.

Jak riziko zmírnit: vynechte osobní sloupce, omezte geografický rozsah, zdokumentujte legitimní obchodní účel, respektujte limity požadavků a nereplikujte konkurenční službu s nabídkami. AI v Thunderbit můžete nastavit tak, aby extrahovala jen potřebná pole o nemovitosti — cena, metry čtvereční, lokalita — a přeskočila osobní kontaktní údaje.

Nábor: Pracovní nabídky

Nábor je bez debat vysoce rizikový sektor. Korea má přímý precedent: JobKorea v. Saramin. Saramin scrapoval databázi pracovních nabídek JobKorea a byl shledán odpovědným za porušení práv k databázi i nekalou soutěž. Data o pracovních pozicích obvykle kombinují investice platformy (kurátorované, ověřené nabídky), masové kopírování databáze a osobní nebo kontaktní údaje náborářů.

Moje doporučení: obecně se vyhněte scrapování konkurenční pracovní platformy za účelem vytvoření nebo obohacení rivalní databáze pracovních nabídek. Pokud je use case úzký, dejte si právní kontrolu před sběrem, minimalizujte objem, odstraňte osobní kontakty a výsledky dál neredistribuujte.

Kompletní přehled sankcí: Co vám v Koreji hrozí, když se scraping zvrtne

Korejský zákonTyp porušeníMax. trestní sankceMax. civilní/správní nápravaKlíčová změna 2023–2026
ICNA čl. 48Neoprávněný přístup / zásah5 let / pokuta 50 mil. KRWNáhrada škody + soudní zákaz2024: přidán čl. 48(4), cílí na nástroje k obcházení ochrany
Autorský zákon (práva k databázi, čl. 93)Podstatné rozmnožení databáze3 roky / pokuta 30 mil. KRWZákonné náhrady až 50 mil. KRW / dílo (úmysl za účelem zisku)
PIPANezákonný sběr osobních údajů5 let / pokuta 50 mil. KRWSprávní sankce až 3 % celkových tržeb; možná hromadná žalobaReforma 2023; 2024 pokyny k AI pro veřejná data; trend 2026 směrem k 10 % u opakovaných úniků
UCPA čl. 2(1)(k)/(m)Nekalé získání / užití datJen civilní (u zastřešujícího pravidla bez trestu)Náhrada škody + soudní zákaz; trojnásobná náhrada pro určené úmyslné případy2022: Data Framework Act posílil ustanovení
Trestní zákon čl. 314Narušení podnikání technickými prostředky5 let / pokuta 15 mil. KRWYanolja: nebylo prokázáno skutečné narušení

Klíčový bod: trestní a civilní řízení běží nezávisle. Můžete čelit oběma současně — a v jednom vyhrát, zatímco v druhém prohrát.

Váš 10bodový compliance checklist pro web scraping v Koreji

Tady je deset otázek ano/ne, které si projděte, než začnete jakýkoli scraping projekt. Vytiskněte si to, uložte do záložek, přilepte na monitor — cokoli funguje.

  1. Požaduje cílový web pro přístup k požadovaným datům přihlášení? Pokud je potřeba login, token nebo účet, riziko prudce míří k ICNA čl. 48.
  2. Nejsou zde žádná technická omezení přístupu? CAPTCHA, IP blokace, API klíče, limity požadavků a bot bariéry jsou silné signály červené zóny.
  3. Zkontrolovali jste robots.txt webu? Sám o sobě není v korejské judikatuře právně závazný, ale je to užitečný důkaz očekávání provozovatele webu a vaší dobré víry.
  4. Sbíráte nějaké osobní údaje? Pokud jsou ve hře jména, telefonní čísla, e-maily, ID nebo individuální kontaktní údaje, je nutná analýza PIPA.
  5. Kopírujete „podstatnou část“ databáze webu? Zvažte kvantitativní i kvalitativní otázku — kolik toho je a odráží zkopírovaná část investici zdroje?
  6. Definovali jste si účel? Interní analytika je méně riziková než redistribuce nebo budování konkurenční databáze. (Yanolja ale ukazuje, že interní konkurenční využití není úplný štít.)
  7. Zdokumentovali jste si legitimní obchodní účel písemně? Dokumentace pomáhá u vyvažování oprávněného zájmu podle PIPA a jako důkaz dobré víry.
  8. Odstranili jste nebo anonymizovali osobní údaje před uložením či použitím? Vyloučení kontaktních údajů často posouvá scraping realit, náboru a adresářů z nejnebezpečnějšího vzorce PIPA.
  9. Používáte rozumné intervaly požadavků? Vyhněte se přetížení serveru — riziko podle Trestního zákona čl. 314 a ICNA čl. 48(3) roste, když scraping narušuje provoz služby.
  10. Konzultovali jste korejského právníka pro projekty s vysokým objemem, komerční nebo přeshraniční? Mohou se současně uplatnit korejské zákony i GDPR / americké zákony na ochranu soukromí nebo přístupu k počítačovým systémům.

⚠️ Upozornění: Tento checklist slouží jen pro orientaci, ne jako právní rada. Pro konkrétní situace se vždy obraťte na místního korejského právníka.

Jak Thunderbit pomáhá scrapovat korejské weby zodpovědně

Plná transparentnost: pracuji v marketingovém týmu Thunderbit. Ale opravdu si myslím, že spojení produktu a práva je tady smysluplné — není to jen prodejní řeč.

Thunderbit je navržen pro scénáře ze zelené zóny, které tenhle článek popisuje: scraping veřejně dostupných dat bez nutnosti přihlášení. Takhle konkrétní funkce zapadají do rámce souladu:

  • Cloudový režim scrapingu pro veřejné weby — není nutné se přihlašovat, není potřeba lokální relace a zůstáváte v hranicích veřejně dostupných dat. To odpovídá principu Yanolja „brána dole“.
  • AI Suggest Fields vám umožní přesně určit, které datové sloupce chcete extrahovat. Potřebujete ceny a dostupnost produktů, ale ne telefonní čísla prodejců? Jednoduše osobní sloupce vynechte. To je nejjednodušší způsob, jak se vyhnout spouštěčům PIPA.
  • Scheduled Scraper pro opakované kontroly cen, zásob nebo nabídek v rozumných intervalech — není nutné na server neustále posílat požadavky.
  • Bezplatný export dat do Excelu, Google Sheets, Airtable a Notion pro interní analytické workflow.
  • Subpage scraping pro obohacení veřejných dat z nabídek (např. kliknutí do jednotlivých produktových stránek pro specifikace) bez přístupu do částí chráněných přihlášením nebo omezením.
  • AI adaptace rozvržení — scraper pokaždé znovu načte strukturu webu a přizpůsobí se změnám rozložení bez křehkých napevno zadaných selektorů.

Thunderbit podporuje vícejazyčné použití v desítkách jazyků, což je důležité pro týmy pracující s korejsky psanými weby. Můžete si ho zdarma vyzkoušet přes .

Žádný nástroj neeliminuje právní riziko. Ale zodpovědná konfigurace — veřejné stránky, faktická data, vyloučená osobní pole, rozumné intervaly — vás udrží v rámci souladu, který tenhle článek popisuje.

Hlavní poznatky o legálnosti web scrapingu v Koreji

Pět věcí, které stojí za zapamatování:

  1. Technologie web scrapingu sama o sobě je v Koreji legální. Nejvyšší soud to potvrdil v rozhodnutí Yanolja.
  2. Riziko závisí na způsobu přístupu (brána nahoře vs. brána dole), typu dat (osobní vs. faktická) a využití (interní vs. konkurenční redistribuce).
  3. Zproštění v trestním řízení ≠ civilní bezpečí. Případ Yanolja ukazuje, že se můžete vyhnout stíhání, a přesto čelit škodě v řádu miliard wonů.
  4. Pokud scrapujete veřejná, neosobní, faktická data pro interní použití bez přístupových bariér, obvykle jste v bezpečné zóně. Ale „obvykle“ má váhu — záleží na rozsahu, objemu i účelu.
  5. U rozsáhlých nebo komerčních projektů se vždy poraďte s místním korejským právníkem. Tento článek slouží pro orientaci, ne jako právní rada.

Pokud chcete začít scrapeovat korejské weby zodpovědně, vám umožní otestovat workflow v malém měřítku. Více o tom, jak AI scraping funguje v praxi, najdete v našich průvodcích a . A pokud chcete vidět nástroj v akci, náš má návody pro běžné use-cases.

Často kladené otázky

1. Je scraping veřejně dostupných dat v Koreji legální?

Obecně ano pro trestní účely — podle rozhodnutí Nejvyššího soudu ve věci Yanolja nepředstavuje přístup k datům z webu bez objektivních omezení přístupu porušení ICNA. Civilní odpovědnost podle UCPA nebo autorského zákona ale stále může vzniknout, a to podle objemu, investice zdroje a vašeho komerčního využití dat.

2. Můžu být v Koreji žalován za web scraping, i když není trestný?

Ano. Trestní a civilní řízení jsou nezávislá. GC Company byla zproštěna všech trestních obvinění, ale musela podle zastřešujícího ustanovení UCPA zaplatit přibližně 1 miliardu KRW jako civilní škodu. Zproštění viny vás před civilním nárokem nechrání.

3. Dělá porušení podmínek webu scraping v Koreji nelegálním?

Korejské soudy dlouhodobě zastávají názor, že samotné porušení podmínek používání nepředstavuje podle ICNA trestný čin — soud odlišuje omezení užití (ToS) od omezení přístupu (technické bariéry). To ale neznamená, že porušení ToS nemůže podpořit civilní nárok z porušení smlouvy nebo sloužit jako důkaz zlé víry v analýze nekalé soutěže.

4. Jak si korejské právo o web scrapingu stojí ve srovnání s USA?

Obě jurisdikce chrání scraping veřejných dat (Yanolja v Koreji, hiQ v. LinkedIn v USA) a obě uznávají, že samotné porušení ToS není trestným činem (Van Buren v USA). Hlavní rozdíl: Korea má silnější zákonnou ochranu databází a širší zastřešující pravidlo proti nekalé soutěži než USA, které nemají obecné federální právo k databázi. Korejští provozovatelé platforem mají více civilních nástrojů proti scraperům.

5. Co se stane, když z korejských webů scrapuji osobní údaje?

PIPA se uplatní bez ohledu na to, zda jsou informace veřejně viditelné. Sběr osobních údajů — jména, telefonní čísla, e-maily — bez souhlasu nebo jiného právního základu je porušením. Novela PIPA z roku 2023 tuto ochranu posílila a pokyny PIPC z roku 2024 k veřejně dostupným osobním údajům výslovně řeší web crawling a scraping. Sankce mohou dosáhnout až 5 let odnětí svobody, pokuty 50 milionů KRW a správních sankcí do výše 3 % celkových tržeb.

Vyzkoušejte Thunderbit pro zodpovědný web scraping

Zjistěte více

Fawad Khan
Fawad Khan
Fawad se psaním živí a upřímně ho to docela baví. Roky zjišťoval, co dělá text zapamatovatelným — a co čtenáře přiměje scrollovat dál. Zeptejte se ho na marketing a bude o něm mluvit celé hodiny. Zeptejte se ho na carbonaru a bude mluvit ještě déle.
Obsah

Vyzkoušej Thunderbit

Sbírej leady i další data jen na 2 kliknutí. Poháněno AI.

Získat Thunderbit Je to zdarma
Extrahuj data pomocí AI
Snadno přenes data do Google Sheets, Airtable nebo Notion
Chrome Store Rating
PRODUCT HUNT#1 Product of the Week