Beberapa bulan lalu, salah satu pengguna kami mengajukan pertanyaan yang membuat saya berhenti menyesap kopi: "Kalau saya scraping harga produk publik dari Coupang, apakah saya akan berakhir di pengadilan Korea?" Jujur saja, saya tidak punya jawaban singkat yang meyakinkan — dan begitu juga sebagian besar panduan hukum yang saya temukan online.
Pertanyaan itu terus teringat karena ini juga yang diam-diam dicari ribuan operator e-commerce, tim sales, dan pendiri SaaS setiap minggu. Pasar global layanan web scraping mencapai sekitar dan tumbuh pesat. Semakin banyak bisnis mengumpulkan data web — dan semakin banyak pula yang bertanya-tanya di mana batas hukumnya di Korea. Korea tidak melarang scraping secara mutlak.
Namun, ada empat undang-undang utama yang bisa berlaku tergantung pada apa yang Anda scrape, bagaimana Anda melakukannya, dan untuk apa. Kasus penting yang paling sering dirujuk adalah putusan Mahkamah Agung Korea dalam kasus Yanolja (2021Do1533, diputus 12 Mei 2022), yang membebaskan alat scraping milik pesaing dari tuduhan pidana — lalu, dalam jalur perdata terpisah, tetap menghukum perusahaan yang sama dengan ganti rugi sekitar KRW 1 miliar. Hasil ganda ini adalah hal paling penting yang perlu dipahami non-pengacara tentang hukum scraping di Korea, dan menjadi dasar panduan ini. Tidak perlu gelar hukum — cukup kerangka risiko praktis yang benar-benar bisa Anda pakai.
Tingkat kesulitan: Pemula (tanpa latar belakang hukum atau teknis)
Waktu yang dibutuhkan: ~15 menit untuk membaca; bisa dijadikan referensi berkelanjutan
Yang perlu Anda ketahui: Pemahaman dasar tentang apa yang dilakukan web scraping (kalau perlu penyegaran, baca artikel kami tentang )
Apakah Web Scraping Legal di Korea? Jawaban Singkatnya
Web scraping itu sendiri tidak ilegal di Korea. Ini adalah teknologi netral — seperti browser web atau rumus spreadsheet. Pengadilan Korea secara konsisten tidak berfokus pada alatnya, melainkan pada perilaku di seputar penggunaannya.

Kerangka berpikir terbaik datang dari putusan Mahkamah Agung dalam kasus Yanolja: prinsip "gate up vs. gate down". Jika sebuah situs tidak punya pembatas akses yang objektif — tidak ada tembok login, tidak ada CAPTCHA, tidak ada kewajiban API key, tidak ada pemblokiran IP — maka gerbangnya dianggap "down", dan mengakses data yang tersedia untuk publik umumnya bukan tindak pidana berdasarkan Information and Communications Network Act (ICNA) Korea. Pengadilan secara khusus menilai apakah "langkah perlindungan, ketentuan penggunaan, dan keadaan lain yang secara objektif terlihat" membatasi akses, dan menemukan bahwa server API Yanolja dapat diakses bebas melalui aplikasi publik.
Namun, "bukan pidana" tidak berarti "tanpa risiko".
Tanggung jawab perdata adalah persoalan yang sepenuhnya terpisah. Anda bisa lolos dari tuntutan pidana tetapi tetap terkena ganti rugi hingga miliaran won. Kasus Yanolja membuktikan hal ini dengan sangat jelas.
Ada empat undang-undang Korea yang dapat berlaku pada web scraping:
- ICNA (Information and Communications Network Act) — aturan "dilarang masuk tanpa izin"
- Copyright Act — hak produser basis data
- PIPA (Personal Information Protection Act) — aturan pengumpulan data pribadi
- UCPA (Unfair Competition Prevention Act) — aturan umum untuk mencegah "menumpang gratis"
Sisa panduan ini memetakan undang-undang tersebut ke skenario nyata agar Anda bisa menilai di mana proyek scraping Anda sebenarnya berada.
Kerangka Risiko Hijau-Kuning-Merah untuk Web Scraping di Korea

Setiap artikel hukum yang saya temukan tentang scraping di Korea rasanya ditulis untuk para pengacara. Kalau Anda seorang manajer operasional e-commerce atau pendiri SaaS, Anda tidak butuh analisis undang-undang setebal 40 halaman — Anda butuh cara cepat untuk menilai risiko sebelum memulai proyek. Anggap saja ini seperti lampu lalu lintas. Hijau berarti jalan terus (dengan kehati-hatian normal). Kuning berarti pelankan dan cek kondisi sekitar. Merah berarti berhenti dan hubungi pengacara.
Zona Hijau: Skenario Scraping Berisiko Rendah
| Skenario | Tingkat Risiko | Undang-Undang Utama | Alasan |
|---|---|---|---|
| Scraping daftar produk publik (tanpa login, tanpa CAPTCHA) | 🟢 Rendah | ICNA, Copyright Act | Putusan Yanolja: tidak ada pembatas akses = tidak melanggar ICNA; data faktual (harga, ketersediaan) bukan ekspresi kreatif |
| Scraping harga publik hanya untuk analitik internal | 🟢 Rendah | UCPA, Copyright Act | Data faktual, cakupan terbatas, tidak ada redistribusi kompetitif |
| Mengumpulkan fakta non-pribadi dan non-hak cipta dari halaman publik | 🟢 Rendah | ICNA, Copyright Act | Tidak ada penghalang akses yang dilewati; fakta individual tidak dilindungi |
Putusan pidana Yanolja menjadi dasar zona ini. Mahkamah Agung menemukan tidak ada pelanggaran ICNA karena server API dapat diakses bebas — pengguna biasa bisa membukanya melalui aplikasi dengan atau tanpa keanggotaan, dan tidak ada langkah perlindungan terpisah yang memblokir akses API.
Bagi pengguna , ini adalah titik paling ideal. Jika Anda scraping halaman e-commerce atau properti publik dengan mode cloud scraping — mengumpulkan nama produk, harga, ketersediaan, atau metadata listing sambil mengecualikan kolom data pribadi — Anda biasanya berada di zona hijau. (Namun, "biasanya" bukan berarti "selalu," dan nuansanya akan saya jelaskan di bawah.)
Zona Kuning: Skenario Scraping Berisiko Menengah
| Skenario | Tingkat Risiko | Undang-Undang Utama | Alasan |
|---|---|---|---|
| Scraping data pribadi (nama, email, nomor telepon) bahkan dari halaman publik | 🟡 Menengah | PIPA, ICNA | PIPA berlaku terlepas dari apakah data terlihat publik; amandemen 2023 memperketat aturan persetujuan |
| Scraping volume besar yang bisa dianggap sebagai "bagian substansial" dari basis data pesaing | 🟡 Menengah | Copyright Act, UCPA | Uji kuantitatif + kualitatif dalam hukum Korea |
| Mengabaikan sinyal robots.txt | 🟡 Menengah | Bukti itikad buruk | Bukan tindak pidana secara langsung, tetapi bisa digunakan melawan Anda di pengadilan |
| Scraping data publik tetapi menggunakannya untuk langsung bersaing dengan sumbernya | 🟡 Menengah | UCPA | Menumpang pada investasi platform lain |
Data pribadi adalah pemicu zona kuning terbesar.
Bahkan jika nomor telepon atau email terlihat di halaman web publik, PIPA tetap berlaku. Reformasi PIPA 2023 memperluas hak subjek data dan memperketat persyaratan persetujuan. Dan pada 2024, Personal Information Protection Commission (PIPC) Korea mengeluarkan dalam konteks AI dan pengumpulan data — menegaskan bahwa akses publik saja bukan izin otomatis.
Volume juga penting. Mahkamah Agung dalam kasus Yanolja menyatakan bahwa baik faktor kuantitatif maupun kualitatif menentukan apakah Anda menyalin "bagian substansial" dari basis data. Bandingkan porsi yang disalin dengan keseluruhan basis data, lalu tanyakan apakah itu mencerminkan investasi substansial dari pembuatnya.
Zona Merah: Skenario Scraping Berisiko Tinggi
| Skenario | Tingkat Risiko | Undang-Undang Utama | Alasan |
|---|---|---|---|
| Scraping di balik tembok login atau melewati kontrol akses | 🔴 Tinggi | ICNA Pasal 48 | "Gate up" = akses tanpa izin; risiko penuntutan tinggi |
| Mengakali CAPTCHA, larangan IP, atau sistem deteksi bot | 🔴 Tinggi | ICNA Pasal 48(4) | Amandemen 2024 secara khusus menargetkan alat/perangkat bypass |
| Menyalin dan menjual kembali seluruh basis data pesaing | 🔴 Tinggi | Copyright Act (hak DB), UCPA | Reproduksi substansial + menumpang secara komersial |
| Mengumpulkan informasi pribadi tanpa dasar hukum untuk pemasaran/outreach | 🔴 Tinggi | PIPA | Hingga 5 tahun / denda KRW 50 juta; sanksi administratif hingga 3% dari pendapatan |
Tambahan ICNA pada 2024 — Pasal 48(4) — kini secara khusus melarang pemasangan, pemindahan, atau distribusi program atau perangkat teknis yang melewati "prosedur perlindungan atau autentikasi normal" tanpa alasan sah.
Secara terpisah, putusan menegaskan bahwa intrusi jaringan tanpa izin dapat terjadi bahkan tanpa perusakan fisik atas mekanisme perlindungan. Menggunakan identitas orang lain atau perintah yang tidak semestinya untuk menghindari batas akses sudah cukup.
Empat Undang-Undang Korea yang Berlaku untuk Web Scraping
| Undang-Undang | Apa yang Dilindungi | Kapan Berlaku untuk Scraper | |---|---|---|---| | ICNA Pasal 48 | Stabilitas jaringan, otoritas akses | Melewati login, CAPTCHA, autentikasi, blok IP, batas API key | | Copyright Act (Pasal 93) | Karya kreatif + hak produser basis data | Menyalin konten ekspresif, gambar, atau seluruh/bagian substansial basis data | | PIPA | Informasi pribadi, hak subjek data | Mengumpulkan nama, nomor telepon, email, ID — bahkan dari halaman publik | | UCPA (Pasal 2(1)(k) dan (m)) | Persaingan sehat, data bernilai komersial | Menumpang pada investasi data platform lain untuk bisnis pesaing Anda sendiri |
ICNA Pasal 48: Aturan "Dilarang Masuk Tanpa Izin"
ICNA Pasal 48(1) menyatakan bahwa siapa pun dilarang menerobos ke dalam jaringan informasi dan komunikasi "tanpa otoritas akses yang sah atau melampaui otoritas akses yang diizinkan." Dalam istilah scraping: jika situs punya pembatas akses yang Anda lewati, Anda melanggar. Jika tidak ada pembatas — halaman publik, tanpa login — Anda kemungkinan aman.
Hukuman untuk pelanggaran ini adalah hingga berdasarkan ICNA Pasal 71.
Satu nuansa penting: Mahkamah Agung Korea secara konsisten memperlakukan pembatasan dalam Terms of Service berbeda dari pembatasan akses. Ketentuan aplikasi Yanolja membatasi penggunaan komersial dan melarang program otomatis yang membebani server, tetapi Pengadilan menemukan klausul itu tidak secara objektif membatasi akses ke server API itu sendiri.
Copyright Act: Hak Produser Basis Data
Copyright Act Korea melindungi produser basis data secara terpisah dari hak cipta atas konten individual. Berdasarkan , mereproduksi "seluruh atau bagian substansial" dari basis data adalah ilegal — bahkan jika data individualnya merupakan fakta publik.
Uji yang dipakai bersifat kuantitatif (seberapa banyak yang Anda salin dibandingkan keseluruhan?) dan kualitatif (apakah bagian yang disalin mencerminkan investasi substansial produser dalam membangun, memverifikasi, atau memelihara basis data?). Penyalinan berulang atau sistematis atas bagian-bagian kecil juga bisa dihitung jika pada praktiknya menghasilkan efek yang sama seperti menyalin bagian substansial.
Hukuman untuk pelanggaran hak produser basis data: hingga tiga tahun atau KRW 30 juta berdasarkan Pasal 136(2)(3). Ganti rugi statuter menurut Pasal 125-2 memungkinkan hingga KRW 10 juta per karya, atau KRW 50 juta per karya untuk pelanggaran yang disengaja demi keuntungan.
PIPA: Personal Information Protection Act
PIPA mengatur pengumpulan data pribadi — nama, kontak, ID — bahkan jika terlihat publik. Reformasi 2023 sangat penting: reformasi ini memperluas hak subjek data, memperketat persyaratan persetujuan, memperkenalkan aturan pengambilan keputusan otomatis, dan menetapkan sanksi administratif hingga untuk pelanggaran tertentu.
Panduan secara langsung menyebut data yang diperoleh melalui "web crawling dan scraping" dalam konteks informasi pribadi yang tersedia untuk publik. Panduan ini menjelaskan bahwa kepentingan sah dapat menjadi dasar dalam beberapa konteks, tetapi organisasi tetap perlu melakukan penyeimbangan, pengamanan, perlindungan hak, dan tata kelola.
Dan arahnya makin ketat. Pada Maret 2026, yang menaikkan maksimum sanksi untuk kegagalan kebocoran data berulang yang serius hingga 10% dari pendapatan, berlaku di akhir 2026.
UCPA: Aturan Umum untuk Persaingan Tidak Sehat
UCPA adalah undang-undang yang menjerat GC Company dalam perkara perdata Yanolja. Undang-undang saat ini memiliki dua ketentuan yang relevan:
- Pasal 2(1)(k): mencakup penggunaan tidak adil atas data teknis atau bisnis yang terakumulasi dan dikelola secara elektronik dan tidak bersifat rahasia
- Pasal 2(1)(m): aturan umum yang lebih luas untuk menggunakan hasil pihak lain yang diperoleh melalui investasi atau upaya substansial, untuk bisnis sendiri tanpa izin, bertentangan dengan praktik perdagangan yang adil
UCPA untuk ketentuan ini hanya bersifat perdata — tidak ada hukuman pidana — tetapi bisa menghasilkan perintah penghentian berdasarkan , ganti rugi berdasarkan Pasal 5, dan bahkan treble damages untuk kasus sengaja tertentu berdasarkan Pasal 14-2. Perkara perdata Yanolja memutuskan ganti rugi sekitar KRW 1 miliar berdasarkan kerangka ini.
Kasus Yanolja: Mengapa Anda Bisa Menang Secara Pidana tetapi Kalah Secara Perdata
Ini adalah kasus yang harus dipahami oleh setiap pengguna bisnis di Korea. Saya akan menceritakannya sebagai satu kisah, karena memang begitulah yang terjadi — dan karena hasil yang terbelah itulah inti persoalannya.
Yang Terjadi: GC Company Scraping Data Perjalanan Yanolja
GC Company mengoperasikan platform perjalanan online pesaing. Mereka membangun crawler buatan sendiri yang mengakses server API aplikasi Baro Reservation milik Yanolja, mempelajari URL API dan perintah request lalu mengirimkannya ke server. Scraper itu mengumpulkan informasi akomodasi — nama mitra, alamat, harga, ketersediaan, dan gambar. GC Company menggunakan data ini secara internal untuk pemasaran dan posisi kompetitif.
Yanolja mengajukan laporan pidana sekaligus gugatan perdata.
Putusan Pidana: Bebas dari Semua Dakwaan (Mahkamah Agung 2021Do1533)

Mahkamah Agung pada 12 Mei 2022, untuk ketiga dakwaan:
- ICNA Pasal 48 (intrusi): Tidak ada pembatas akses. Server API dapat diakses publik melalui browser dan aplikasi seluler. Tidak ada pemblokiran teknis. Klausul ToS membatasi penggunaan, bukan akses.
- Copyright Act (hak produser basis data): Terdakwa tidak mereproduksi "seluruh atau bagian substansial" dari basis data. Data yang disalin sudah diketahui publik, dan bukti tidak menunjukkan bahwa bagian yang disalin mencerminkan investasi substansial Yanolja.
- Criminal Act Pasal 314 (gangguan bisnis): Tidak terbukti ada gangguan nyata pada operasi server API Yanolja. Tidak ada modifikasi data. Tidak ada unsur kesengajaan untuk gangguan bisnis.
Prinsip yang bisa dikutip: pembatasan akses harus dinilai melalui "langkah perlindungan, ketentuan penggunaan, dan keadaan lain yang secara objektif terlihat." Jika gerbangnya turun, berjalan melewatinya bukan trespassing.
Putusan Perdata: Ganti Rugi KRW 1 Miliar Berdasarkan UCPA
Di sinilah ceritanya berbalik. Pengadilan Distrik Pusat Seoul — dan kemudian Pengadilan Tinggi Seoul (kasus 2021Na2034740, diputus 25 Agustus 2022) — memutus bahwa GC Company melanggar ketentuan umum UCPA. Pengadilan menjatuhkan ganti rugi sekitar KRW 1 miliar (~USD 800 ribu) dan memerintahkan penghentian penyalinan data lebih lanjut.
Alasannya: basis data akomodasi Yanolja memiliki nilai komersial dan mencerminkan investasi substansial — dalam pengumpulan, verifikasi, dan pembaruan data akomodasi. GC Company menumpang pada investasi tersebut. Putusan perdata ini menjadi final di tingkat Pengadilan Tinggi Seoul.
Inti Praktis: Bebas Pidana Bukan Berarti Aman Secara Perdata
Ini adalah pelajaran paling tidak intuitif dari hukum scraping Korea. Akses yang sah secara pidana tidak membebaskan penggunaan komersial yang tidak adil. "Apakah saya bisa dipidana?" dan "Apakah saya bisa digugat?" adalah pertanyaan berbeda dengan jawaban yang bisa saja berlawanan.
Bagi pengguna bisnis: meskipun metode scraping Anda jelas berada di zona hijau untuk tujuan pidana, cara Anda menggunakan data tersebut — terutama jika bersaing langsung dengan sumbernya — yang menentukan risiko perdata Anda.
Korea vs. AS vs. UE: Perbandingan Hukum Web Scraping
Saya tidak menemukan panduan lain yang menyatukan ini dalam satu tabel — padahal bisnis yang melakukan scraping lintas negara jumlahnya banyak.
| Dimensi | Korea Selatan | Amerika Serikat | UE / EEA |
|---|---|---|---|
| Undang-undang inti | ICNA Pasal 48, Copyright Act | CFAA (18 U.S.C. §1030), hukum negara bagian | GDPR, Database Directive (96/9/EC) |
| Kasus penting | Yanolja v GC Company (Mahkamah Agung 2021Do1533, 2022) | hiQ v LinkedIn (9th Cir. 2022), Van Buren v. US (2021) | Ryanair v PR Aviation (CJEU C-30/14, 2015) |
| Scraping data publik | Legal jika tidak ada penghalang akses objektif ("gate down") | Legal menurut pertimbangan hiQ (data publik); Van Buren mempersempit CFAA | Tergantung hak DB, kontrak, hak cipta, GDPR, hukum negara anggota |
| Aturan data pribadi | PIPA (amandemen 2023) — persetujuan atau dasar hukum | Sektoral: CCPA (California), hukum privasi negara bagian | GDPR — persetujuan/legitimate interest yang ketat; denda maksimum €20 juta atau 4% pendapatan global |
| Pelanggaran ToS = kejahatan? | Tidak (pengadilan menilai ToS ≠ pelanggaran ICNA) | Tidak (Van Buren 2021: ToS ≠ CFAA) | Umumnya tidak, tetapi bisa menjadi pelanggaran kontrak (Ryanair) |
| Perlindungan basis data | Hak produser basis data dalam Copyright Act | Tidak ada hak basis data federal umum | Hak basis data sui generis |
| Hukuman pidana maksimum | Hingga 5 tahun / KRW 50 juta (ICNA) | Hingga 10 tahun / $250 ribu (CFAA) | Bervariasi حسب negara anggota |
Perbedaan Kunci yang Penting untuk Bisnis Anda
- Korea tidak memiliki pengecualian text-and-data-mining (TDM) yang luas seperti DSM Directive di UE. Jika Anda melatih model AI dengan data Korea hasil scraping, Anda tidak mendapat pengecualian statuter khusus.
- Ketentuan umum UCPA Korea lebih luas dan kurang dapat diprediksi dibanding hukum persaingan tidak sehat di AS. Hasil perdata Yanolja akan jauh lebih sulit terjadi di bawah hukum AS.
- Ketiga yurisdiksi sama-sama sepakat: pelanggaran Terms of Service saja bukan tindak pidana.
- Perlindungan basis data di Korea bersifat statuter (seperti di UE), sementara AS tidak punya hak basis data federal umum. Ini memberi pemilik platform Korea alat perdata yang lebih banyak.
- Jika Anda scraping lintas negara, hukum yang paling ketat yang berlaku harus dipenuhi. Proyek scraping yang menyentuh data Korea, AS, dan UE harus mematuhi ketiga rezim.
Skenario Berdasarkan Sektor: Apakah Web Scraping Legal di Korea untuk Industri Anda?
Profil risikonya sangat berbeda antarindustri, dan tidak ada panduan yang saya temukan yang memetakan hukum scraping Korea ke sektor tertentu. Jadi saya menyusunnya sendiri.
E-Commerce: Pemantauan Harga dan Data Produk

Scraping harga produk publik dari Coupang, Gmarket, atau 11Street adalah contoh zona hijau yang paling bersih — tetap pada field faktual (harga, ketersediaan, nama produk), hindari area yang hanya bisa diakses setelah login, jangan melewati blok teknis, dan gunakan datanya secara internal untuk benchmarking.
Risiko meningkat ketika Anda scraping deskripsi produk (konten kreatif → hak cipta), informasi kontak penjual (PIPA), gambar (hak cipta), atau seluruh katalog (hak produser basis data + UCPA).
Saya tidak menemukan gugatan scraping e-commerce terkemuka di Korea yang sebanding dengan Yanolja. Preseden yang lebih berkembang ada di bidang perjalanan dan rekrutmen — tetapi tidak adanya gugatan bukan berarti tidak ada risiko.
dan mode cloud scraping Thunderbit dibuat untuk pola seperti ini: pengecekan harga dan stok berulang di halaman publik, dengan AI Suggest Fields yang memungkinkan Anda memilih kolom yang diinginkan dan mengecualikan field data pribadi.
Properti: Listing Hunian
Properti secara alami berada di wilayah zona kuning. Listing di platform seperti Zigbang atau Naver Real Estate memadukan data faktual (harga, luas, lingkungan) dengan nama agen, nomor telepon kantor, nomor ponsel, foto, dan basis data platform yang dikurasi.
Scraping detail properti publik bisa berisiko lebih rendah. Tetapi mengumpulkan kolom kontak agen langsung memicu PIPA — dan scraping seluruh listing di suatu wilayah mulai terlihat seperti penyalinan basis data yang substansial.
Mitigasi: keluarkan kolom pribadi, perkecil cakupan geografis, dokumentasikan tujuan bisnis yang sah, patuhi rate limit, dan hindari mereplikasi layanan listing pesaing. AI Thunderbit dapat dikonfigurasi untuk mengekstrak hanya field properti yang Anda butuhkan — harga, meter persegi, lokasi — sambil melewati data kontak pribadi.
Rekrutmen: Lowongan Kerja
Rekrutmen adalah sektor berisiko tinggi, tanpa basa-basi. Korea punya preseden langsung: JobKorea v. Saramin. Saramin melakukan scraping basis data lowongan kerja JobKorea dan dinyatakan bertanggung jawab atas pelanggaran hak basis data dan persaingan tidak sehat. Data rekrutmen umumnya menggabungkan investasi platform (listing yang dikurasi dan diverifikasi), penyalinan basis data volume besar, serta informasi kontak pribadi atau perekrut.
Rekomendasi saya: secara umum hindari scraping platform pekerjaan pesaing untuk membangun atau memperkaya basis data pekerjaan saingan. Jika use case Anda sempit, minta tinjauan hukum sebelum pengumpulan, minimalkan volume, hapus kontak pribadi, dan jangan redistribusikan hasilnya.
Referensi Hukuman Lengkap: Risiko Anda Jika Web Scraping Berjalan Salah di Korea
| Undang-Undang Korea | Jenis Pelanggaran | Hukuman Pidana Maksimum | Remedi Perdata/Administratif Maksimum | Perubahan Kunci 2023–2026 |
|---|---|---|---|---|
| ICNA Pasal 48 | Akses tanpa izin / interferensi | 5 tahun / denda KRW 50 juta | Ganti rugi + injunction | 2024: Pasal 48(4) ditambahkan, menargetkan alat bypass |
| Copyright Act (hak DB, Pasal 93) | Reproduksi substansial basis data | 3 tahun / denda KRW 30 juta | Ganti rugi statuter hingga KRW 50 juta/karya (sengaja untuk keuntungan) | — |
| PIPA | Pengumpulan data pribadi yang melanggar hukum | 5 tahun / denda KRW 50 juta | Penalti administratif hingga 3% dari total penjualan; class action mungkin | Reformasi 2023; panduan AI data publik 2024; tren 2026 menuju 10% untuk kebocoran berulang |
| UCPA Pasal 2(1)(k)/(m) | Akuisisi/penggunaan data yang tidak adil | Hanya perdata (tanpa pidana untuk ketentuan umum) | Ganti rugi + injunction; treble damages untuk kasus sengaja tertentu | 2022 Data Framework Act memperkuat ketentuan |
| Criminal Code Pasal 314 | Gangguan bisnis melalui cara teknis | 5 tahun / denda KRW 15 juta | — | Yanolja: tidak terbukti ada gangguan nyata |
Poin kritis: jalur pidana dan perdata berjalan sendiri-sendiri. Anda bisa menghadapi keduanya sekaligus — dan menang di satu jalur sambil kalah di jalur lain.
Checklist Kepatuhan 10 Poin untuk Web Scraping di Korea
Berikut sepuluh pertanyaan ya/tidak yang perlu Anda lalui sebelum memulai proyek scraping apa pun. Cetak, bookmark, tempel di monitor — apa pun yang cocok.
- Apakah situs target tidak memerlukan login untuk mengakses data yang Anda inginkan? Jika perlu login, token, atau akun, risikonya melonjak ke ICNA Pasal 48.
- Apakah tidak ada pembatas akses teknis? CAPTCHA, blok IP, API key, rate limit, dan dinding bot adalah sinyal zona merah yang kuat.
- Apakah Anda sudah meninjau robots.txt situs tersebut? Tidak mengikat secara hukum dalam preseden Korea, tetapi berguna sebagai bukti ekspektasi situs dan itikad baik Anda.
- Apakah Anda mengumpulkan data pribadi? Jika nama, nomor telepon, email, ID, atau detail kontak individu termasuk dalam cakupan, analisis PIPA wajib dilakukan.
- Apakah Anda menyalin "bagian substansial" dari basis data situs? Ajukan pertanyaan kuantitatif dan kualitatif — seberapa banyak, dan apakah bagian yang disalin mencerminkan investasi sumbernya?
- Apakah Anda sudah menetapkan tujuan? Analitik internal lebih rendah risikonya dibanding redistribusi atau membangun basis data pesaing. (Tetapi Yanolja menunjukkan penggunaan internal yang kompetitif bukan perlindungan penuh.)
- Apakah tujuan bisnis yang sah sudah didokumentasikan secara tertulis? Dokumentasi membantu penyeimbangan legitimate interest pada PIPA dan menjadi bukti itikad baik.
- Apakah Anda sudah menghapus atau menganonimkan field data pribadi sebelum menyimpan/menggunakan? Mengecualikan detail kontak sering kali memindahkan scraping properti, rekrutmen, dan direktori keluar dari pola PIPA yang paling berbahaya.
- Apakah Anda menggunakan interval request yang wajar? Hindari membebani server — risiko Criminal Act Pasal 314 dan ICNA Pasal 48(3) meningkat ketika scraping mengganggu operasi layanan.
- Apakah Anda sudah berkonsultasi dengan penasihat hukum Korea untuk proyek volume besar, komersial, atau lintas negara? Hukum Korea plus GDPR/hukum privasi AS atau hukum akses komputer bisa saja semuanya berlaku.
⚠️ Penafian: Checklist ini untuk orientasi, bukan nasihat hukum. Selalu konsultasikan dengan penasihat hukum Korea setempat untuk situasi spesifik.
Bagaimana Thunderbit Membantu Anda Scraping Situs Korea Secara Bertanggung Jawab
Saya perlu jujur: saya bekerja di tim pemasaran Thunderbit. Tapi saya benar-benar percaya kecocokan produk dan hukum di sini memang berguna, bukan sekadar promosi.
Thunderbit dirancang untuk use case zona hijau yang dibahas artikel ini: scraping data yang tersedia untuk publik tanpa perlu login. Berikut cara fitur-fitur tertentu selaras dengan kerangka kepatuhan:
- Mode cloud scraping untuk situs publik — tidak perlu login, tidak perlu sesi lokal, tetap berada dalam batas yang dapat diakses publik. Ini selaras dengan prinsip Yanolja "gate down".
- AI Suggest Fields memungkinkan Anda menentukan dengan tepat kolom data mana yang akan diekstrak. Butuh harga dan ketersediaan produk tetapi bukan nomor telepon penjual? Cukup keluarkan kolom pribadi. Ini cara paling sederhana untuk menghindari pemicu PIPA.
- Scraper terjadwal untuk pengecekan harga, stok, atau listing berulang dengan interval yang wajar — tanpa perlu membombardir server dengan request terus-menerus.
- Ekspor data gratis ke Excel, Google Sheets, Airtable, dan Notion untuk alur kerja analitik internal.
- Scraping subhalaman untuk memperkaya data listing publik (misalnya membuka halaman produk individu untuk spesifikasi) tanpa mengakses area yang hanya bisa dibuka dengan login atau yang dibatasi.
- Adaptasi tata letak berbasis AI — scraper membaca ulang struktur situs setiap kali, menyesuaikan diri dengan perubahan layout tanpa selector hardcoded yang rapuh.
Thunderbit mendukung penggunaan multibahasa di puluhan bahasa, yang penting untuk tim yang bekerja dengan situs berbahasa Korea. Anda bisa mencobanya gratis melalui .
Tidak ada alat yang menghilangkan risiko hukum sepenuhnya. Namun konfigurasi yang bertanggung jawab — halaman publik, data faktual, field pribadi dikecualikan, interval wajar — menjaga Anda tetap dalam kerangka kepatuhan yang dijelaskan artikel ini.
Poin-Poin Utama tentang Legalitas Web Scraping di Korea
Lima hal yang layak diingat:
- Teknologi web scraping itu sendiri legal di Korea. Mahkamah Agung mengonfirmasi ini dalam putusan Yanolja.
- Risiko bergantung pada metode akses (gate up vs. gate down), jenis data (pribadi vs. faktual), dan penggunaan (internal vs. redistribusi kompetitif).
- Bebas pidana ≠ aman secara perdata. Kasus Yanolja membuktikan Anda bisa lolos dari penuntutan tetapi tetap menghadapi ganti rugi miliaran won.
- Jika scraping data publik, non-pribadi, dan faktual untuk penggunaan internal tanpa penghalang akses, Anda umumnya berada di zona aman. Namun kata "umumnya" tetap penting — cakupan, volume, dan tujuan semuanya berpengaruh.
- Selalu konsultasikan dengan penasihat hukum Korea setempat untuk proyek skala besar atau komersial. Artikel ini untuk orientasi, bukan nasihat hukum.
Jika Anda ingin mulai scraping situs Korea secara bertanggung jawab, memungkinkan Anda menguji alur kerja dalam skala kecil. Untuk lebih lanjut tentang cara kerja scraping berbasis AI dalam praktik, lihat panduan kami tentang dan . Dan jika Anda ingin melihat alat ini beraksi, kami punya panduan untuk use case umum.
FAQ
1. Apakah scraping data yang tersedia untuk publik legal di Korea?
Secara umum ya untuk tujuan pidana — menurut putusan Mahkamah Agung dalam kasus Yanolja, mengakses data dari situs tanpa pembatas akses objektif tidak melanggar ICNA. Namun, tanggung jawab perdata berdasarkan UCPA atau Copyright Act masih bisa berlaku, tergantung volume, investasi sumber, dan penggunaan komersial data tersebut.
2. Bisakah saya digugat karena web scraping di Korea meskipun itu bukan tindak pidana?
Ya. Jalur pidana dan perdata berjalan independen. GC Company dibebaskan dari semua dakwaan pidana tetapi diperintahkan membayar sekitar KRW 1 miliar sebagai ganti rugi perdata berdasarkan ketentuan umum UCPA. Bebas pidana tidak melindungi dari klaim perdata.
3. Apakah melanggar Terms of Service situs membuat scraping ilegal di Korea?
Pengadilan Korea secara konsisten menyatakan bahwa pelanggaran ToS saja tidak merupakan tindak pidana berdasarkan ICNA — Pengadilan membedakan antara membatasi penggunaan (ToS) dan membatasi akses (penghalang teknis). Meski begitu, pelanggaran ToS tetap bisa mendukung klaim wanprestasi perdata atau menjadi bukti itikad buruk dalam analisis persaingan tidak sehat.
4. Bagaimana hukum web scraping Korea dibandingkan dengan AS?
Kedua yurisdiksi sama-sama melindungi scraping data publik (Yanolja di Korea, hiQ v LinkedIn di AS) dan sama-sama menyatakan bahwa pelanggaran ToS saja bukan tindak pidana (Van Buren di AS). Perbedaan utamanya: Korea punya perlindungan basis data statuter yang lebih kuat dan ketentuan umum persaingan tidak sehat yang lebih luas daripada AS, yang tidak memiliki hak basis data federal umum. Pemilik platform Korea punya lebih banyak alat hukum perdata untuk menindak scraper.
5. Apa yang terjadi jika saya scraping data pribadi dari situs Korea?
PIPA berlaku terlepas dari apakah informasinya terlihat publik. Mengumpulkan informasi pribadi — nama, nomor telepon, email — tanpa persetujuan atau dasar hukum lain merupakan pelanggaran. Amandemen PIPA 2023 memperkuat perlindungan ini, dan panduan PIPC 2024 tentang informasi pribadi yang tersedia untuk publik secara khusus membahas web crawling dan scraping. Sanksinya dapat mencapai 5 tahun penjara, denda KRW 50 juta, dan penalti administratif hingga 3% dari total penjualan.
Pelajari Lebih Lanjut
