Onko web scraping laillista Koreassa? Mitä ei-juristien tarvitsee tietää

Viimeksi päivitetty April 30, 2026

Muutama kuukausi sitten yksi käyttäjistämme esitti kysymyksen, joka pysäytti minut puolivälissä kahvikulauksen: "Jos kaavin julkisia tuotteen hintoja Coupangista, joudunko korealaiseen oikeussaliin?" Rehellisesti sanottuna minulla ei ollut valmiina varmaa yhden lauseen vastausta — eikä ollut useimmilla verkosta löytämilläni oikeusoppaillekaan.

Jäin miettimään tuota kysymystä, koska samaa pohtivat hiljaisesti joka viikko tuhannet verkkokaupan tekijät, myyntitiimit ja SaaS-perustajat. Maailman web scraping -palvelumarkkina oli vuonna 2024 noin , ja kasvaa nopeasti. Yhä useampi yritys kerää verkosta dataa — ja yhä useampi miettii, missä kulkevat lailliset rajat Koreassa. Korea ei kiellä scrapingia kokonaan.

Mutta neljä keskeistä lakia voi tulla sovellettaviksi sen mukaan, mitä kaadat, miten kaadat ja miksi. Kaikki viittaavat samaan merkittävään oikeustapaukseen: Korean korkeimman oikeuden Yanolja-ratkaisuun (2021Do1533, annettu 12.5.2022), jossa kilpailijan scraping-työkalu vapautettiin rikossyytteistä — mutta erillisessä siviiliprosessissa sama yhtiö määrättiin maksamaan noin 1 miljardin KRW:n vahingonkorvaukset. Juuri tuo kaksoisratkaisu on yksittäinen tärkein asia, joka ei-juristin pitää ymmärtää Korean scraping-laista, ja tämän oppaan selkäranka. Lakidiplomia ei tarvita — vain käytännöllinen riskikehys, jota voit oikeasti käyttää.

Vaikeustaso: Aloittelija (ei juridista tai teknistä taustaa tarvita)
Aika: noin 15 minuuttia lukemiseen; jatkossa vertailukohtana
Tarvitset: Perusymmärryksen siitä, mitä web scraping tekee (jos kaipaat kertausta, katso juttumme aiheesta )

Onko web scraping laillista Koreassa? Lyhyt vastaus

Web scraping itsessään ei ole Koreassa laitonta. Se on neutraali teknologia — vähän kuin selain tai taulukkolaskennan kaava. Korean tuomioistuimet ovat johdonmukaisesti keskittyneet eivät itse työkaluun vaan sen käyttöön liittyvään toimintaan.

ig_0cdf68974ff22a4a0169f1aba6b77c8191a0d3fa1e58ce2c97_compressed.webp

Paras ajattelumalli tulee Yanolja-korkeimman oikeuden päätöksestä: "portti ylhäällä vs. portti alhaalla" -periaate. Jos sivustolla ei ole objektiivisia pääsyrajoituksia — ei kirjautumismuuria, ei CAPTCHAa, ei API-avaimen vaatimusta, ei IP-estettä — portti on "alhaalla", ja julkisesti saatavilla olevaan dataan pääsy ei yleensä ole Korean Information and Communications Network Actin (ICNA) mukaan rikos. Tuomioistuin tarkasteli nimenomaan, rajoittivatko "suojatoimet, käyttöehdot ja muut objektiivisesti havaittavat olosuhteet" pääsyä, ja totesi, että Yanoljan API-palvelin oli vapaasti tavoitettavissa julkisen sovelluksen kautta.

Mutta "ei rikosta" ei tarkoita "ei riskiä".

Siviilioikeudellinen vastuu on täysin erillinen kysymys. Voit välttää syytteen ja silti joutua miljardiluokan korvausvastuuseen. Yanolja-tapaus osoitti tämän kivuliaan selvästi.

Web scrapingiin voi soveltua neljä Korean lakia:

  1. ICNA (Information and Communications Network Act) — "ei tunkeutumista" -sääntö
  2. Copyright Act — tietokantojen tekijänoikeudet
  3. PIPA (Personal Information Protection Act) — henkilötietojen keruuta koskevat säännöt
  4. UCPA (Unfair Competition Prevention Act) — "älä vapaamatkusta" -yleissääntö

Tämän oppaan loppuosa yhdistää nämä lait todellisiin tilanteisiin, jotta voit arvioida, mihin oma scraping-projektisi oikeasti sijoittuu.

Vihreä-keltainen-punainen riskikehys web scrapingille Koreassa

ig_0cdf68974ff22a4a0169f1abfb386c8191baf73515035c6cdc_compressed.webp

Jokainen löytämäni Korean scraping-lakia käsittelevä oikeudellinen artikkeli kuulostaa siltä kuin se olisi kirjoitettu asianajajille. Jos olet verkkokaupan operatiivinen johtaja tai SaaS-perustaja, et tarvitse 40-sivuista lainopillista analyysiä — tarvitset nopean tavan arvioida riskiä ennen projektin aloittamista. Ajattele tätä liikennevalona. Vihreä tarkoittaa, että voit mennä eteenpäin tavanomaisella varovaisuudella. Keltainen tarkoittaa hidastamista ja sivupeilien tarkistamista. Punainen tarkoittaa pysähtymistä ja juristin soittamista.

Vihreä vyöhyke: matalan riskin scraping-tilanteet

TilanneRiskitasoKeskeinen laki / laitMiksi
Julkisten tuotelistojen kaavinta (ei kirjautumista, ei CAPTCHAa)🟢 MatalaICNA, Copyright ActYanolja-ratkaisu: ei pääsyrajoitusta = ei ICNA-rikkomusta; tosiasiadata (hinnat, saatavuus) ei ole luovaa ilmaisua
Julkisten hintojen kaavinta vain sisäistä analytiikkaa varten🟢 MatalaUCPA, Copyright ActTosiasiadataa, rajattu käyttö, ei kilpailullista jälleenjakoa
Ei-henkilökohtaisten, tekijänoikeuksilla suojaamattomien faktojen keruu julkisilta sivuilta🟢 MatalaICNA, Copyright ActPääsyesteitä ei kierretä; yksittäiset faktat eivät ole suojattuja

Yanoljan rikosoikeudellinen ratkaisu on tämän vyöhykkeen ankkuri. Korkein oikeus ei katsonut ICNA-loukkausta tapahtuneen, koska API-palvelin oli vapaasti tavoitettavissa — tavalliset käyttäjät pääsivät siihen sovelluksen kautta jäsenyyden kanssa tai ilman, eikä API-pääsyä estänyt mikään erillinen suojatoimi.

-käyttäjille tämä on ihanteellinen käyttötapa. Jos kaavit julkisia verkkokauppa- tai kiinteistösivuja pilvitilassa — keräät tuotemäärityksiä, hintoja, saatavuutta tai listausmetatietoja mutta jätät henkilötietokentät pois — toimit yleensä vihreällä alueella. ("Yleensä" ei kuitenkaan ole sama asia kuin "aina", ja selitän vivahteet alempana.)

Keltainen vyöhyke: keskitason riskin scraping-tilanteet

TilanneRiskitasoKeskeinen laki / laitMiksi
Henkilötietojen kaapinta (nimet, sähköpostit, puhelinnumerot) myös julkisilta sivuilta🟡 KeskitasoPIPA, ICNAPIPA soveltuu julkisesta näkyvyydestä riippumatta; vuoden 2023 muutokset tiukensivat suostumussääntöjä
Suuret massat, jotka voivat muodostaa kilpailijan tietokannasta "olennaisen osan"🟡 KeskitasoCopyright Act, UCPAMäärällinen + laadullinen testi Korean oikeudessa
robots.txt-signaalien sivuuttaminen🟡 KeskitasoHuonon tahdon näyttöEi itsessään rikos, mutta sitä voidaan käyttää sinua vastaan oikeudessa
Julkisen datan kaapinta ja sen käyttäminen suoraan lähteen kanssa kilpailemiseen🟡 KeskitasoUCPAToisen alustan investoinneilla vapaamatkustaminen

Henkilötiedot ovat ylivoimaisesti suurin keltaisen vyöhykkeen laukaiseva tekijä.

Vaikka puhelinnumero tai sähköposti näkyisi julkisella verkkosivulla, PIPA soveltuu silti. Vuoden 2023 PIPA-uudistus laajensi rekisteröidyn oikeuksia ja tiukensi suostumusvaatimuksia. Ja vuonna 2024 Korean Personal Information Protection Commission (PIPC) julkaisi tekoälyn ja tiedonkeruun yhteydessä — ja teki selväksi, että pelkkä julkinen saatavuus ei ole yleislupa.

Myös määrä on tärkeä. Yanolja-korkein oikeus totesi, että sekä määrälliset että laadulliset tekijät ratkaisevat, onko kopioitu tietokannasta "olennaista osaa". Vertaa kopioitua osuutta koko tietokantaan ja kysy, heijastaako se tuottajan merkittävää investointia.

Punainen vyöhyke: korkean riskin scraping-tilanteet

TilanneRiskitasoKeskeinen laki / laitMiksi
Kaapinta kirjautumismuurin takaa tai pääsynhallinnan kiertäminen🔴 KorkeaICNA Art. 48"Portti ylhäällä" = luvaton pääsy; korkea syytteen riski
CAPTCHA-, IP-banni- tai bottitunnistusjärjestelmien kiertäminen🔴 KorkeaICNA Art. 48(4)Vuoden 2024 muutos kohdistuu nimenomaisesti kiertotyökaluihin/laitteisiin
Kilpailijan koko tietokannan kopiointi ja jälleenmyynti🔴 KorkeaCopyright Act (DB rights), UCPAOlennaisen osan jäljentäminen + kaupallinen vapaamatkustus
Henkilötietojen kerääminen ilman laillista perustetta markkinointiin/ulospäin suuntautuvaan kontaktointiin🔴 KorkeaPIPAEnintään 5 vuotta / 50 milj. KRW sakkoa; hallinnolliset seuraamukset jopa 3 % liikevaihdosta

ICNAan lisättiin vuonna 2024 uusi 48(4) artikla, joka kieltää nimenomaan ohjelmien tai teknisten laitteiden asentamisen, siirtämisen tai jakamisen, jos niiden tarkoitus on kiertää "normaalit suojaus- tai tunnistautumismenettelyt" ilman hyväksyttävää syytä.

Erillisesti vahvisti, että luvaton verkkoon tunkeutuminen voi toteutua myös ilman suojausten fyysistä vahingoittamista. Toisen henkilön tunnistetietojen tai virheellisten komentojen käyttäminen pääsyrajoitusten kiertämiseksi riittää.

Neljä Korean lakia, jotka voivat koskea web scrapingia

LakiMitä se suojaaMilloin se aktivoituu scrapereille
ICNA Art. 48Verkon vakaus, pääsyoikeusKirjautumisen, CAPTCHA:n, tunnistautumisen, IP-estojen tai API-avaimen rajoitusten kiertäminen
Copyright Act (Art. 93)Luovat teokset + tietokantojen tekijän oikeudetIlmaisullisen sisällön, kuvien tai koko tietokannan / sen olennaisen osan kopiointi
PIPAHenkilötiedot, rekisteröidyn oikeudetNimien, puhelinnumeroiden, sähköpostien, tunnusten kerääminen — myös julkisilta sivuilta
UCPA (Art. 2(1)(k) ja (m))Reilu kilpailu, kaupallisesti arvokas dataToisen osapuolen data-investoinnilla vapaamatkustaminen oman kilpailevan liiketoiminnan tueksi

ICNA Art. 48: "ei tunkeutumista" -sääntö

ICNA:n 48(1) artikla sanoo, ettei kukaan saa tunkeutua tieto- ja viestintäverkkoon "ilman laillista pääsyoikeutta tai yli sallitun pääsyoikeuden." Scrapingin kannalta: jos sivustolla on pääsyrajoituksia, jotka kierrät, rikot lakia. Jos rajoituksia ei ole — julkinen sivu, ei kirjautumista — olet todennäköisesti turvassa.

Rikkomuksen rangaistus on ICNA:n 71 artiklan mukaan enintään .

Yksi tärkeä vivahde: Korean korkein oikeus on johdonmukaisesti käsitellyt käyttöehtorajoituksia eri asiana kuin pääsyrajoituksia. Yanoljan sovelluksen käyttöehdot rajoittivat kaupallista uudelleenkäyttöä ja kielsivät palvelinta kuormittavat automaattiohjelmat, mutta tuomioistuin katsoi, että nämä ehdot eivät objektiivisesti rajoittaneet pääsyä itse API-palvelimelle.

Korean Copyright Act suojaa tietokantojen tuottajia erillään yksittäisten sisältöjen tekijänoikeuksista. mukaan "kaiken tai olennaisen osan" tietokannasta jäljentäminen on laitonta — vaikka yksittäiset datapisteet olisivat julkisia faktoja.

Testi on sekä määrällinen (kuinka paljon kopioit suhteessa kokonaisuuteen?) että laadullinen (heijastaako kopioitu osuus tuottajan merkittävää investointia tietokannan rakentamiseen, tarkistamiseen tai ylläpitoon?). Toistuva tai systemaattinen pienempien osien kopiointi voi myös riittää, jos sillä päädytään käytännössä samaan kuin olennaisen osan kopioimisella.

Tietokannan tekijän oikeuksien loukkauksen rangaistus: enintään kolme vuotta tai 30 miljoonaa KRW Art. 136(2)(3):n mukaan. Art. 125-2:n mukaisten lakisääteisten vahingonkorvausten enimmäismäärä on 10 miljoonaa KRW teosta kohti, tai 50 miljoonaa KRW teosta kohti tahallisessa, voitontavoitteluun liittyvässä loukkauksessa.

PIPA: Personal Information Protection Act

PIPA säätelee henkilötietojen keruuta — nimiä, yhteystietoja, tunnuksia — vaikka ne olisivat julkisesti nähtävissä. Vuoden 2023 uudistus oli merkittävä: se laajensi rekisteröidyn oikeuksia, tiukensi suostumusvaatimuksia, toi automaattista päätöksentekoa koskevat säännöt ja asetti hallinnolliset seuraamukset jopa tietyissä rikkomuksissa.

PIPC:n mainitsee suoraan "web crawling and scraping" -menetelmillä saadun datan julkisesti saatavilla olevan henkilötiedon yhteydessä. Ohjeistus selventää, että oikeutettu etu voi joissain tapauksissa toimia perusteena, mutta organisaatioilta vaaditaan punnintaa, suojatoimia, oikeuksien turvaamista ja hallintaa.

Ja suunta on kiristymässä. Maaliskuussa 2026 , joka nostaa vakavien, toistuvien tietovuototapausten enimmäisseuraamuksia jopa 10 prosenttiin liikevaihdosta myöhemmin vuonna 2026.

UCPA: epäreilun kilpailun "yleissääntö"

UCPA on laki, joka osui GC Companyyn Yanoljan siviiliasiassa. Nykyisessä laissa on kaksi kannalta olennaista säännöstä:

  • Art. 2(1)(k): koskee sähköisesti kerätyn ja hallinnoidun teknisen tai liiketoimintadatan epäreilua käyttöä, jos tieto ei ole salassa pidettävää
  • Art. 2(1)(m): laajempi yleissäännös, joka koskee toisen henkilön merkittävän investoinnin tai ponnistelun tuloksilla vapaamatkustamista oman liiketoiminnan hyödyksi ilman lupaa, vastoin reiluja kaupallisia käytäntöjä

UCPA on näiden säännösten osalta vain siviilioikeudellinen — ei rikosoikeudellista rangaistusta — mutta se voi johtaa kieltotuomioon nojalla, vahingonkorvauksiin Art. 5:n mukaan ja jopa kolminkertaisiin korvauksiin tietyissä tahallisissa tapauksissa Art. 14-2:n nojalla. Yanoljan siviilijuttu johti tämän kehyksen puitteissa noin 1 miljardin KRW:n korvauksiin.

Yanolja-tapaus: miksi voit voittaa rikosasiassa mutta hävitä siviilissä

Tämä on se tapaus, joka jokaisen Korean markkinoilla toimivan yrityskäyttäjän pitää ymmärtää. Kerron sen yhtenä tarinana, koska juuri niin se käytännössä eteni — ja koska eri lopputulokset ovat koko asian ydin.

Mitä tapahtui: GC Company kaapi Yanoljan matkailudataa

GC Company pyöritti kilpailevaa online-matkailualustaa. He rakensivat itse kehitetyn crawlerin, joka haki Yanoljan Baro Reservation -sovelluksen API-palvelimelta, oppi API-osoitteet ja pyyntökäskyt ja lähetti ne palvelimelle. Kaavin keräsi majoitustietoja — kumppaneiden nimet, osoitteet, hinnat, saatavuuden ja kuvat. GC Company käytti tätä dataa sisäisesti markkinoinnissa ja kilpailuaseman rakentamisessa.

Yanolja nosti sekä rikosilmoituksen että siviilikanteen.

Rikostuomio: vapauttava tuomio kaikista syytteistä (Korkein oikeus 2021Do1533)

ig_0cdf68974ff22a4a0169f1ac46e080819188cd13d53eebebdf_compressed.webp

Korkein oikeus 12.5.2022 kaikissa kolmessa syytekohdassa:

  • ICNA Art. 48 (tunkeutuminen): Pääsyrajoituksia ei ollut. API-palvelin oli julkisesti saavutettavissa selaimella ja mobiilisovelluksella. Teknisiä estoja ei ollut. Käyttöehdot rajoittivat käyttöä, eivät pääsyä.
  • Copyright Act (tietokannan tekijän oikeudet): Vastaajat eivät jäljentäneet "koko tietokantaa tai sen olennaista osaa". Kopioitu data oli jo julkisesti tunnettu, eikä näyttö osoittanut, että kopioitu osuus olisi heijastanut Yanoljan merkittävää investointia.
  • Criminal Act Art. 314 (liiketoiminnan häirintä): Yanoljan API-palvelimen toiminnan todellista häiriintymistä ei pystytty näyttämään. Datan muokkausta ei ollut. Liiketoiminnan häirintään ei ollut tahallisuutta.

Ytimekäs sääntö: pääsyrajoituksia arvioidaan "suojatoimien, käyttöehtojen ja muiden objektiivisesti havaittavien olosuhteiden" perusteella. Jos portti on auki, sen läpi käveleminen ei ole tunkeutumista.

Siviilitomio: 1 miljardin KRW:n vahingonkorvaukset UCPA:n nojalla

Tässä kohtaa tarina kääntyy. Seoul Central District Court — ja sen jälkeen Seoul High Court (asia 2021Na2034740, ratkaistu 25.8.2022) — katsoi, että GC Company rikkoi UCPA:n yleissäännöstä. Tuomioistuin määräsi noin 1 miljardin KRW:n (~800 000 USD) korvaukset ja kielsi lisädatan kopioinnin.

Perustelu: Yanoljan majoitustietokanta oli kaupallisesti arvokas ja heijasti merkittävää investointia — majoitustietojen keruuta, tarkistusta ja päivittämistä. GC Company vapaamatkusti tämän investoinnin varassa. Siviilituomio vahvistettiin lopullisesti Seoul High Courtin tasolla.

Käytännön johtopäätös: vapauttava rikostuomio ei tarkoita siviiliturvaa

Tämä on Korean scraping-lain yksittäinen yllättävin oppi. Rikosoikeudellisesti lainmukainen pääsy ei suojannut kaupallisesti epäreilulta käytöltä. "Voiko minua syyttää rikoksesta?" ja "Voidaanko minua haastaa oikeuteen?" ovat eri kysymyksiä, joihin voi tulla täysin eri vastaukset.

Yrityskäyttäjille: vaikka scraping-menetelmäsi olisi selvästi rikosoikeudellisesti vihreällä vyöhykkeellä, datan käyttö — etenkin jos se kilpailee suoraan lähteen kanssa — määrittää siviiliriskin.

Korea vs. Yhdysvallat vs. EU: miten web scraping -lait vertautuvat

En löytänyt muuta opasta, joka kokoaisi tämän yhteen taulukkoon — mikä on aika yllättävää, kun miettii kuinka moni yritys kaapii dataa rajojen yli.

UlottuvuusEtelä-KoreaYhdysvallatEU / ETA
Keskeinen lakiICNA Art. 48, Copyright ActCFAA (18 U.S.C. §1030), osavaltiolaitGDPR, Database Directive (96/9/EC)
Merkittävä tapausYanolja v. GC Company (Korkein oikeus 2021Do1533, 2022)hiQ v LinkedIn (9th Cir. 2022), Van Buren v. US (2021)Ryanair v PR Aviation (CJEU C-30/14, 2015)
Julkisen datan kaapintaLaillista, jos objektiivisia pääsyesteitä ei ole ("gate down")Laillista hiQ-perustelun mukaan (julkinen data); Van Buren kavensi CFAA:taRiippuu tietokantaoikeuksista, sopimuksesta, tekijänoikeudesta, GDPR:stä ja jäsenvaltion laista
Henkilötietojen säännötPIPA (muutettu 2023) — suostumus tai laillinen perusteAlakohtainen: CCPA (Kalifornia), osavaltioiden tietosuojalaitGDPR — tiukka suostumus / oikeutettu etu; enimmäissakko 20 milj. € tai 4 % globaalista liikevaihdosta
Käyttöehtojen rikkomus = rikos?Ei (tuomioistuinten mukaan ToS ≠ ICNA-rikkomus)Ei (Van Buren 2021: ToS ≠ CFAA)Yleensä ei, mutta sopimusrikkomus voi olla mahdollinen (Ryanair)
TietokantasuojaCopyright Actin tietokannan tuottajan oikeudetEi liittovaltiotasoista tietokantaoikeuttaSui generis -tietokantaoikeus
Suurin rikosoikeudellinen rangaistusJopa 5 vuotta / 50 milj. KRW (ICNA)Jopa 10 vuotta / 250 000 USD (CFAA)Vaihtelee jäsenvaltion mukaan

Keskeiset erot, joilla on merkitystä liiketoiminnallesi

  • Koreassa ei ole EU:n DSM-direktiivin kaltaista laajaa tekstin ja datan louhintaa (TDM) koskevaa poikkeusta. Jos koulutat tekoälymalleja kaapatulla korealaisella datalla, et saa lakisääteistä erityispoikkeusta.
  • Korean UCPA:n yleissääntö on laajempi ja ennustamattomampi kuin Yhdysvaltain epäreilun kilpailun oikeus. Yanoljan siviililopputulosta olisi paljon vaikeampi toistaa Yhdysvaltain lain nojalla.
  • Kaikki kolme lainkäyttöaluetta ovat yhtä mieltä: pelkkä käyttöehtojen rikkominen ei ole rikos.
  • Korean tietokantasuoja on lakisääteinen (kuten EU:ssa), kun taas Yhdysvalloissa ei ole yleistä liittovaltiotasoista tietokantaoikeutta. Tämä antaa korealaisille alustojen omistajille enemmän siviilioikeudellisia keinoja.
  • Jos kaivat dataa yli rajojen, tiukin soveltuva laki määrää. Korean, Yhdysvaltain ja EU:n dataa koskevan projektin pitää täyttää kaikkien kolmen järjestelmän vaatimukset.

Toimialakohtaiset tilanteet: onko web scraping laillista Koreassa juuri sinun alallasi?

Riskiprofiili vaihtelee jyrkästi toimialoittain, eikä mikään löytämäni opas kartoittanut Korean scraping-lakia yksittäisiin vertikaaleihin. Niinpä kokosin sen itse.

Verkkokauppa: hintaseuranta ja tuotetiedot

ig_0cdf68974ff22a4a0169f1ac9435c88191a26d0fb5beb6f17d_compressed.webp

Julkisten tuotteen hintojen kaapinta Coupangista, Gmarketista tai 11Streetistä on puhtain vihreän vyöhykkeen esimerkki — pysy faktoihin perustuvissa kentissä (hinta, saatavuus, tuotenimi), vältä kirjautumisen takana olevia alueita, älä kierrä teknisiä estoja ja käytä dataa sisäiseen vertailuanalyysiin.

Riski kasvaa, jos kaavit tuotekuvauksia (luova sisältö → tekijänoikeus), myyjän yhteystietoja (PIPA), kuvia (tekijänoikeus) tai koko katalogin (tietokannan tekijän oikeudet + UCPA).

En löytänyt johtavaa korealaista verkkokaupan scraping-oikeustapausta, joka olisi vertautunut Yanoljaan. Vakiintuneempi ennakkotapaus on matkailu- ja rekrytointialoilta — mutta oikeusjuttujen puute ei tarkoita riskin puutetta.

Thunderbitin ja pilvitila on rakennettu juuri tätä varten: toistuvat hinta- ja varastotarkistukset julkisilla sivuilla, ja AI Suggest Fields -toiminto antaa sinun valita haluamasi sarakkeet ja jättää henkilötietokentät pois.

Kiinteistöt: kohdelistaukset

Kiinteistöala on luonnostaan keltaista vyöhykettä. Zigbangin tai Naver Real Estaten kaltaisilla alustoilla listaukset sekoittavat tosiasiatietoja (hinta, pinta-ala, kaupunginosa) välittäjien nimiin, toimistopuhelimiin, matkapuhelinnumeroihin, valokuviin ja kuratoituihin alustatietokantoihin.

Julkisten kohdetietojen kaapinta voi olla matalamman riskin toimintaa. Mutta välittäjien yhteystietosarakkeiden kerääminen laukaisee heti PIPAn — ja kaikkien alueen kohteiden kaapinta alkaa näyttää olennaisen tietokannan kopioimiselta.

Riskin pienentäminen: jätä henkilökohtaiset sarakkeet pois, rajaa maantieteellistä aluetta, dokumentoi laillinen liiketoimintatarkoitus, kunnioita rate limit -rajoja ja vältä kilpailevan listauspalvelun jäljentämistä. Thunderbitin tekoäly voidaan määrittää poimimaan vain tarvitsemasi kohdekentät — hinta, neliöt, sijainti — ja ohittamaan yhteystiedot.

Rekrytointi: työpaikkailmoitukset

Rekrytointi on riskialttein sektori, piste. Koreassa on suora ennakkotapaus: JobKorea v. Saramin. Saramin kaapi JobKorean työpaikkailmoitustietokantaa ja todettiin vastuulliseksi tietokantaoikeuden ja epäreilun kilpailun loukkauksesta. Rekrytointidata yhdistää usein alustan investoinnin (kuratodut, tarkistetut ilmoitukset), suuren volyymin tietokantakopioinnin sekä henkilö- tai rekrytoijayhteystiedot.

Suosittelen yleensä välttämään kilpailijan työpaikka-alustan kaapimista oman kilpailevan työpaikkatietokannan rakentamiseksi tai rikastamiseksi. Jos käyttötapaus on rajattu, hanki oikeudellinen arvio ennen keruuta, minimoi määrä, poista henkilöyhteystiedot äläkä jaa tuloksia eteenpäin.

Koko rangaistusviite: mitä riskeeraat, jos web scraping menee pieleen Koreassa

Korean lakiRikkomustyyppiSuurin rikosoikeudellinen rangaistusSuurin siviili-/hallinnollinen seuraamusKeskeinen 2023–2026 muutos
ICNA Art. 48Luvaton pääsy / häirintä5 vuotta / 50 milj. KRW sakkoVahingonkorvaukset + kielto2024: Art. 48(4) lisätty, kohdistuu kiertotyökaluihin
Copyright Act (DB rights, Art. 93)Tietokannan olennaisen osan jäljentäminen3 vuotta / 30 milj. KRW sakkoLakisääteiset vahingonkorvaukset jopa 50 milj. KRW/teos (tahallinen voitontavoittelu)
PIPALaiton henkilötietojen keruu5 vuotta / 50 milj. KRW sakkoHallinnollinen seuraamus jopa 3 % kokonaismyynnistä; ryhmäkanne mahdollinen2023-uudistus; 2024 julkisen datan AI-ohjeistus; 2026 suunta kohti 10 % toistuvissa vuodoissa
UCPA Art. 2(1)(k)/(m)Epäreilu datan hankinta / käyttöVain siviilioikeudellinen (ei rikosoikeudellista yleissäännölle)Vahingonkorvaukset + kielto; kolminkertaiset korvaukset tietyissä tahallisissa tapauksissa2022 Data Framework Act vahvisti säännöksiä
Criminal Code Art. 314Liiketoiminnan häirintä teknisin keinoin5 vuotta / 15 milj. KRW sakkoYanolja: todellista häiriötä ei näytetty toteen

Ratkaiseva pointti: rikos- ja siviiliprosessit etenevät erikseen. Voit joutua kumpaankin yhtä aikaa — ja voittaa toisen, mutta hävitä toisen.

10 kohdan vaatimustenmukaisuustarkistus web scrapingiin Koreassa

Tässä on kymmenen kyllä/ei-kysymystä, jotka kannattaa käydä läpi ennen minkään scraping-projektin aloittamista. Tulosta tämä, lisää kirjanmerkkeihin, teippaa näytön reunaan — mikä tahansa toimii.

  1. Vaatiiko kohdesivusto kirjautumista saadaksesi haluamasi datan? Jos kirjautuminen, token tai tili tarvitaan, riski siirtyy jyrkästi kohti ICNA Art. 48:aa.
  2. Eivätkö tekniset pääsyrajoitukset estä pääsyä? CAPTCHA:t, IP-estot, API-avaimet, rate limitit ja bottimuurit ovat vahvoja punaisen vyöhykkeen merkkejä.
  3. Oletko tarkistanut sivuston robots.txt-tiedoston? Se ei yksin ole Korean ennakkotapauksissa oikeudellisesti sitova, mutta se on hyödyllistä näyttöä sivuston odotuksista ja hyvästä tahdostasi.
  4. Keräätkö mitään henkilötietoja? Jos nimet, puhelinnumerot, sähköpostit, tunnukset tai yksittäiset yhteystiedot kuuluvat laajuuteen, PIPA-analyysi on tarpeen.
  5. Kopioitko sivuston tietokannasta "olennaisen osan"? Kysy sekä määrällisiä että laadullisia kysymyksiä — kuinka paljon, ja heijastaako kopioitu osuus lähteen investointia?
  6. Oletko määritellyt tarkoituksesi? Sisäinen analytiikka on pienemmän riskin toimintaa kuin jälleenjako tai kilpailevan tietokannan rakentaminen. (Mutta Yanolja osoittaa, ettei sisäinen kilpailullinen käyttö ole täydellinen kilpi.)
  7. Oletko dokumentoinut laillisen liiketoimintatarkoituksen kirjallisesti? Dokumentointi auttaa PIPA:n oikeutetun edun punninnassa ja hyväntahtoisuuden näytössä.
  8. Oletko poistanut tai anonymisoinut henkilötietokentät ennen tallentamista tai käyttöä? Yhteystietojen pois jättäminen siirtää usein kiinteistö-, rekrytointi- ja hakemistokaapinnan pois kaikkein vaarallisimmasta PIPA-mallista.
  9. Käytätkö kohtuullisia pyyntövälejä? Vältä palvelimen ylikuormitusta — Criminal Act Art. 314:n ja ICNA Art. 48(3):n riskit kasvavat, jos scraping häiritsee palvelun toimintaa.
  10. Oletko konsultoinut korealaista juristia suuren volyymin, kaupallisissa tai rajat ylittävissä projekteissa? Korean laki sekä GDPR/USA:n tietosuoja- tai tietokoneen käyttöä koskevat lait voivat kaikki tulla sovellettaviksi.

⚠️ Vastuuvapauslauseke: Tämä tarkistuslista on suuntaa-antava, ei oikeudellista neuvontaa. Kysy aina paikalliselta korealaiselta juristilta tilanteeseen sopiva neuvo.

Miten Thunderbit auttaa sinua kaapimaan korealaisia verkkosivuja vastuullisesti

Täysi läpinäkyvyys: työskentelen Thunderbitin markkinointitiimissä. Mutta aidosti uskon, että tuotteen ja lain yhteensopivuus on tässä oikeasti hyödyllinen, ei vain myyntipuhe.

Thunderbit on suunniteltu tämän artikkelin kuvaamiin vihreän vyöhykkeen käyttötapauksiin: julkisesti saatavilla olevan datan kaapintaan ilman kirjautumista. Näin tietyt ominaisuudet linkittyvät vaatimustenmukaisuuskehykseen:

  • Pilvitila julkisille sivustoille — ei kirjautumista, ei paikallista istuntoa, pysyy julkisesti saavutettavien rajojen sisällä. Tämä vastaa Yanoljan "portti alhaalla" -periaatetta.
  • AI Suggest Fields antaa sinun määrittää täsmälleen, mitkä datasarakkeet poimitaan. Tarvitsetko tuotteen hinnat ja saatavuuden mutta et myyjän puhelinnumeroita? Jätä henkilösarakkeet vain pois. Tämä on yksinkertaisin tapa välttää PIPA-laukaisut.
  • Scheduled scraper toistuviin hinta-, varasto- tai listausseurantaan kohtuullisin väliajoin — ei tarvetta pommittaa palvelinta jatkuvilla pyynnöillä.
  • Vapaa datan vienti Exceliin, Google Sheetsiin, Airtableen ja Notioniin sisäisiä analytiikkatyönkulkuja varten.
  • Alasivujen kaapinta julkisten listatietojen rikastamiseen (esim. siirtyminen yksittäisten tuotteen sivuille teknisiä tietoja varten) ilman kirjautumisen takana oleviin tai rajattuihin alueisiin pääsyä.
  • Tekoälypohjainen asettelun mukautus — kaavin lukee sivun rakenteen joka kerta uudelleen ja mukautuu asettelumuutoksiin ilman hauraita kovakoodattuja valitsimia.

Thunderbit tukee monikielistä käyttöä kymmenillä kielillä, mikä on tärkeää tiimeille, jotka työskentelevät koreankielisten sivustojen kanssa. Voit kokeilla sitä ilmaiseksi kautta.

Mikään työkalu ei poista oikeudellista riskiä. Mutta vastuullinen konfigurointi — julkiset sivut, tosiasiallinen data, henkilökenttien poissulku, kohtuulliset välit — pitää sinut tämän artikkelin kuvaamassa vaatimustenmukaisuuskehyksessä.

Keskeiset opit web scrapingin laillisuudesta Koreassa

Viisi muistamisen arvoista asiaa:

  1. Web scraping -teknologia itsessään on laillista Koreassa. Korkein oikeus vahvisti tämän Yanolja-ratkaisussa.
  2. Riski riippuu pääsytavasta (portti ylhäällä vs. alhaalla), datan tyypistä (henkilökohtainen vs. tosiasiallinen) ja käytöstä (sisäinen vs. kilpaileva jälleenjakelu).
  3. Vapauttava rikostuomio ≠ siviiliturva. Yanolja-tapaus osoittaa, että voit välttää syytteen mutta silti joutua miljardiluokan vahingonkorvauksiin.
  4. Kun kaavit julkista, ei-henkilökohtaista, tosiasiallista dataa sisäiseen käyttöön ilman pääsyesteitä, olet yleensä turvallisella alueella. Mutta "yleensä" on painava sana — laajuus, määrä ja tarkoitus kaikki merkitsevät.
  5. Kysy aina paikalliselta korealaiselta juristilta, jos projekti on laaja tai kaupallinen. Tämä artikkeli on suuntaa-antava, ei oikeudellista neuvontaa.

Jos haluat aloittaa korealaisten verkkosivujen vastuullisen kaapinnan, antaa sinun testata työnkulun pienessä mittakaavassa. Jos haluat lisää tietoa siitä, miten tekoälypohjainen scraping toimii käytännössä, katso oppaamme aiheista ja . Ja jos haluat nähdä työkalun toiminnassa, meidän on läpikäyntejä yleisimmistä käyttötapauksista.

Usein kysytyt kysymykset

1. Onko julkisesti saatavilla olevan datan kaapinta laillista Koreassa?

Yleisesti kyllä rikosoikeudellisessa mielessä — Yanolja-korkeimman oikeuden ratkaisun mukaan pääsy dataan sivustolta, jossa ei ole objektiivisia pääsyrajoituksia, ei riko ICNA:ta. Siviilioikeudellinen vastuu UCPA:n tai Copyright Actin nojalla voi silti tulla kyseeseen, riippuen määrästä, lähteen investoinnista ja datan kaupallisesta käytöstä.

2. Voidaanko minua haastaa oikeuteen web scrapingista Koreassa, vaikka se ei olisi rikos?

Kyllä. Rikosoikeudelliset ja siviilioikeudelliset prosessit ovat erillisiä. GC Company vapautettiin kaikista rikossyytteistä, mutta se määrättiin maksamaan noin 1 miljardin KRW:n siviilivahingonkorvaukset UCPA:n yleissäännön nojalla. Vapauttava rikostuomio ei suojaa siviilivaatimuksilta.

3. Tehdäänkö sivuston käyttöehtojen rikkomisesta web scrapingista laitonta Koreassa?

Korean tuomioistuimet ovat johdonmukaisesti todenneet, että pelkkä käyttöehtojen rikkominen ei muodosta rikosta ICNA:n mukaan — tuomioistuin erotti toisistaan käytön rajoittamisen (käyttöehdot) ja pääsyn rajoittamisen (tekniset esteet). Silti käyttöehtojen rikkominen voi tukea sopimusrikkomukseen perustuvaa siviilikannetta tai toimia näyttönä huonosta uskosta epäreilun kilpailun arvioinnissa.

4. Miten Korean web scraping -laki vertautuu Yhdysvaltoihin?

Molemmat oikeusjärjestelmät suojaavat julkisen datan kaapintaa (Yanolja Koreassa, hiQ v LinkedIn Yhdysvalloissa), ja molemmat katsovat, ettei pelkkä käyttöehtojen rikkominen ole rikos (Van Buren Yhdysvalloissa). Keskeinen ero: Koreassa on vahvempi lakisääteinen tietokantasuoja ja laajempi epäreilun kilpailun yleissääntö kuin Yhdysvalloissa, jossa ei ole yleistä liittovaltiotasoista tietokantaoikeutta. Korealaisilla alustojen omistajilla on enemmän siviilioikeudellisia työkaluja scrapingin haastamiseen.

5. Mitä tapahtuu, jos kaavin henkilötietoja korealaisilta verkkosivuilta?

PIPA soveltuu riippumatta siitä, ovatko tiedot julkisesti näkyvissä. Henkilötietojen — nimien, puhelinnumeroiden, sähköpostien — kerääminen ilman suostumusta tai muuta laillista perustetta on rikkomus. Vuoden 2023 PIPA-muutos vahvisti näitä suojia, ja PIPC:n vuoden 2024 ohjeistus julkisesti saatavilla olevista henkilötiedoista käsittelee nimenomaisesti web crawlingia ja scrapingia. Seuraamukset voivat olla jopa 5 vuotta vankeutta, 50 miljoonan KRW sakkoja ja hallinnollisia seuraamuksia, jotka voivat nousta 3 prosenttiin kokonaismyynnistä.

Kokeile Thunderbitiä vastuulliseen web scrapingiin

Lue lisää

Fawad Khan
Fawad Khan
Fawad kirjoittaa työkseen, ja rehellisesti sanottuna hän jopa pitää siitä. Hän on käyttänyt vuosia selvittääkseen, mikä tekee mainostekstistä vaikuttavaa — ja mikä saa lukijat selaamaan ohi. Kysy häneltä markkinoinnista, niin hän puhuu tuntikausia. Kysy häneltä carbonarasta, niin hän puhuu vielä pidempään.
Sisällysluettelo

Kokeile Thunderbitiä

Poimi liidejä ja muuta dataa vain 2 klikkauksella. AI:n voimalla.

Hanki Thunderbit Se on ilmaista
Poimi dataa AI:n avulla
Siirrä data helposti Google Sheetsiin, Airtableen tai Notioniin
Chrome Store Rating
PRODUCT HUNT#1 Product of the Week