לפני כמה חודשים, אחד המשתמשים שלנו שאל שאלה שעצרה אותי באמצע לגימת קפה: "אם אני גורף מחירי מוצרים ציבוריים מ-Coupang, אני אמצא את עצמי בבית משפט קוריאני?" בכנות, לא הייתה לי תשובת מחץ בטוחה — וגם לרוב מדריכי המשפט שמצאתי ברשת לא הייתה כזו.
השאלה הזו נתקעה אצלי כי זו בדיוק אותה שאלה שאלפי מפעילי מסחר אלקטרוני, צוותי מכירות ומייסדי SaaS שואלים בשקט בגוגל בכל שבוע. שוק שירותי גריפת האתרים העולמי הגיע לכ-1.03 מיליארד דולר ב-2024 והוא צומח במהירות. יותר עסקים מאי פעם אוספים נתוני אינטרנט — ויותר מהם תוהים איפה עובר הקו החוקי בקוריאה. קוריאה לא אוסרת גריפה באופן גורף.
אבל ארבעה חוקים מרכזיים יכולים לחול, תלוי מה גורפים, איך גורפים, ו-למה. פסק הדין המרכזי שכולם מצטטים הוא פסק הדין של בית המשפט העליון של קוריאה בפרשת Yanolja (2021Do1533, שניתן ב-12 במאי 2022), שזיכה כלי גריפה של מתחרה מאישומים פליליים — ואז, במסלול אזרחי נפרד, חייב את אותה חברה בכ-1 מיליארד וון פיצויים. התוצאה הכפולה הזו היא הדבר החשוב ביותר שלא-משפטנים צריכים להבין על דיני הגריפה בקוריאה, והיא עמוד השדרה של המדריך הזה. לא צריך תואר במשפטים — רק מסגרת מעשית להערכת סיכון שאפשר באמת להשתמש בה.
רמת קושי: מתחיל/ה (אין צורך ברקע משפטי או טכני)
זמן נדרש: כ-15 דקות קריאה; משמש גם כהפניה שוטפת
מה תצטרכו: הבנה בסיסית של מה גריפת אתרים עושה (אם צריך רענון, כדאי לבדוק את הפוסט שלנו על )
האם גריפת אתרים חוקית בקוריאה? התשובה הקצרה
גריפת אתרים כשלעצמה אינה בלתי חוקית בקוריאה. זו טכנולוגיה ניטרלית — כמו דפדפן אינטרנט או נוסחת גיליון אלקטרוני. בתי המשפט בקוריאה התמקדו בעקביות לא בכלי, אלא בהתנהלות סביב השימוש בו.

המודל המנטלי הטוב ביותר מגיע מפסק הדין של בית המשפט העליון ב-Yanolja: עקרון ה־"שער פתוח מול שער סגור". אם לאתר אין מגבלות גישה אובייקטיביות — אין חומת התחברות, אין CAPTCHA, אין צורך במפתח API, ואין חסימת IP — השער "פתוח", וגישה לנתונים ציבוריים בדרך כלל אינה עבירה פלילית לפי חוק רשתות המידע והתקשורת של קוריאה (ICNA). בית המשפט בחן במיוחד אם "אמצעי הגנה, תנאי שימוש ונסיבות אובייקטיביות אחרות" הגבילו את הגישה, וקבע ששרת ה-API של Yanolja היה נגיש בחופשיות דרך האפליקציה הציבורית.
אבל "לא פלילי" לא אומר "ללא סיכון".
אחריות אזרחית היא שאלה נפרדת לחלוטין. אפשר להימנע מהעמדה לדין ועדיין להיתקל בפסק פיצויים של מיליארד וון. פרשת Yanolja הוכיחה זאת בצורה כואבת.
ארבעה חוקים קוריאניים יכולים לחול על גריפת אתרים:
- ICNA (חוק רשתות המידע והתקשורת) — כלל ה"אין כניסה ללא רשות"
- חוק זכויות היוצרים — זכויות יצרן מסד נתונים
- PIPA (חוק הגנת המידע האישי) — כללי איסוף מידע אישי
- UCPA (חוק מניעת תחרות בלתי הוגנת) — כלל ה"אל תרכבו חינם על ההשקעה של אחרים"
שאר המדריך ממפה את החוקים האלה לתרחישים מהעולם האמיתי, כדי שתוכלו להבין איפה באמת נמצא פרויקט הגריפה שלכם.
מסגרת הסיכון ירוק-צהוב-אדום לגריפת אתרים בקוריאה

כל מאמר משפטי שמצאתי על דיני גריפת אתרים בקוריאה כתוב כאילו הוא נועד לעורכי דין. אם אתם מנהלי תפעול במסחר אלקטרוני או מייסדי SaaS, אתם לא צריכים ניתוח סטטוטורי של 40 עמודים — אתם צריכים דרך מהירה להעריך סיכון לפני שמתחילים פרויקט. תחשבו על זה כמו על רמזור. ירוק אומר לנסוע (בזהירות רגילה). צהוב אומר להאט ולבדוק את המראות. אדום אומר לעצור ולהתקשר לעורך דין.
אזור ירוק: תרחישי גריפה בסיכון נמוך
| תרחיש | רמת סיכון | החוק(ים) המרכזי(ים) | למה |
|---|---|---|---|
| גריפת רשימות מוצרים ציבוריות (ללא התחברות, ללא CAPTCHA) | 🟢 נמוך | ICNA, חוק זכויות היוצרים | פסק דין Yanolja: אין הגבלת גישה = אין הפרה של ICNA; נתונים עובדתיים (מחירים, זמינות) אינם ביטוי יצירתי |
| גריפת מחירים ציבוריים רק לצורך ניתוח פנימי | 🟢 נמוך | UCPA, חוק זכויות היוצרים | נתונים עובדתיים, היקף מוגבל, ללא הפצה מחדש תחרותית |
| איסוף עובדות שאינן אישיות ואינן מוגנות בזכויות יוצרים מדפים ציבוריים | 🟢 נמוך | ICNA, חוק זכויות היוצרים | לא בוצעה עקיפת מחסום גישה; עובדות בודדות אינן מוגנות |
ההכרעה הפלילית ב-Yanolja היא העוגן של האזור הזה. בית המשפט העליון קבע שלא הייתה חדירה לפי ICNA משום ששרת ה-API היה נגיש בחופשיות — משתמשים רגילים יכלו לגשת אליו דרך האפליקציה עם או בלי חברות, ולא היו אמצעי חסימה נפרדים שחסמו את הגישה ל-API.
למשתמשי , זהו אזור המתיקות. אם אתם גורפים דפי מסחר אלקטרוני או נדל"ן ציבוריים במצב גריפה בענן — אוספים שמות מוצרים, מחירים, זמינות או מטא-נתונים של רישומים, תוך הימנעות משדות של מידע אישי — בדרך כלל אתם פועלים באזור הירוק. (עם זאת, "בדרך כלל" אינו "תמיד", ואסביר את הניואנסים בהמשך.)
אזור צהוב: תרחישי גריפה בסיכון בינוני
| תרחיש | רמת סיכון | החוק(ים) המרכזי(ים) | למה |
|---|---|---|---|
| גריפת מידע אישי (שמות, אימיילים, מספרי טלפון), גם מדפים ציבוריים | 🟡 בינוני | PIPA, ICNA | PIPA חל בלי קשר לנראות ציבורית; תיקוני 2023 החמירו את כללי ההסכמה |
| גריפת כמויות גדולות שעשויות להיחשב ל"חלק מהותי" ממסד נתונים של מתחרה | 🟡 בינוני | חוק זכויות היוצרים, UCPA | מבחן כמותי + איכותי לפי הדין הקוריאני |
| התעלמות מהאותות של robots.txt | 🟡 בינוני | ראיה לחוסר תום לב | לא עבירה פלילית כשלעצמה, אבל יכולה לשמש נגדכם בבית משפט |
| גריפת נתונים ציבוריים אך שימוש בהם כדי להתחרות ישירות במקור | 🟡 בינוני | UCPA | רכיבה חופשית על ההשקעה של פלטפורמה אחרת |
מידע אישי הוא הטריגר הגדול ביותר באזור הצהוב.
גם אם מספר טלפון או אימייל גלויים בדף אינטרנט ציבורי, PIPA עדיין חל. הרפורמה ב-PIPA ב-2023 הרחיבה את זכויות נושאי המידע והקשיחה את דרישות ההסכמה. וב-2024, ועדת הגנת המידע האישי של קוריאה (PIPC) פרסמה בהקשר של AI ואיסוף נתונים — והבהירה שנגישות ציבורית לבדה אינה אישור גורף.
גם לנפח יש משמעות. בית המשפט העליון ב-Yanolja אמר שגם גורמים כמותיים וגם איכותיים קובעים אם העתקתם "חלק מהותי" ממסד נתונים. צריך להשוות את החלק שהועתק למסד הנתונים כולו, ולשאול אם הוא משקף את ההשקעה המהותית של היצרן.
אזור אדום: תרחישי גריפה בסיכון גבוה
| תרחיש | רמת סיכון | החוק(ים) המרכזי(ים) | למה |
|---|---|---|---|
| גריפה מאחורי חומת התחברות או עקיפת בקרות גישה | 🔴 גבוה | ICNA סעיף 48 | "שער סגור" = גישה לא מורשית; סיכון גבוה להעמדה לדין |
| עקיפת CAPTCHAs, חסימות IP או מערכות זיהוי בוטים | 🔴 גבוה | ICNA סעיף 48(4) | תיקון 2024 מכוון במפורש לכלי/אמצעי עקיפה |
| העתקה ומכירה מחדש של מסד הנתונים המלא של מתחרה | 🔴 גבוה | חוק זכויות היוצרים (זכויות DB), UCPA | שכפול מהותי + רכיבה חופשית מסחרית |
| איסוף מידע אישי ללא בסיס חוקי לצורכי שיווק/פנייה | 🔴 גבוה | PIPA | עד 5 שנות מאסר / קנס של 50 מיליון וון; עיצומים מנהליים עד 3% מההכנסות |
תוספת מ-2024 ל-ICNA — סעיף 48(4) — אוסרת כעת במפורש התקנה, העברה או הפצה של תוכנות או אמצעים טכניים שעוקפים "הליכי הגנה או אימות רגילים" ללא סיבה לגיטימית.
בנפרד, פסק דין של בית המשפט העליון מנובמבר 2024 (2021Do5555) שחדירה לא מורשית לרשת יכולה להתקיים גם בלי הרס פיזי של אמצעי ההגנה. די בשימוש במזהים של אדם אחר או בפקודות לא תקינות כדי לעקוף מגבלות גישה.
ארבעת החוקים הקוריאניים שחלים על גריפת אתרים
| חוק | מה הוא מגן עליו | מתי הוא נכנס לתמונה עבור גורפים |
|---|---|---|
| ICNA סעיף 48 | יציבות הרשת, סמכות גישה | עקיפת התחברות, CAPTCHA, אימות, חסימות IP, מגבלות מפתח API |
| חוק זכויות היוצרים (סעיף 93) | יצירות מקוריות + זכויות יצרן מסד נתונים | העתקת תוכן יצירתי, תמונות, או כל/חלק מהותי ממסד נתונים |
| PIPA | מידע אישי, זכויות נושא המידע | איסוף שמות, מספרי טלפון, אימיילים, מזהים — גם מדפים ציבוריים |
| UCPA (סעיף 2(1)(k) ו-(m)) | תחרות הוגנת, נתונים בעלי ערך מסחרי | רכיבה חופשית על השקעת נתונים של פלטפורמה אחרת לטובת עסק מתחרה משלכם |
ICNA סעיף 48: כלל ה"אין כניסה ללא רשות"
ICNA סעיף 48(1) קובע שאיש לא יחדור לרשת מידע ותקשורת "ללא סמכות גישה לגיטימית או מעבר לסמכות הגישה המותרת." במונחי גריפה: אם לאתר יש מגבלות גישה ואתם עוקפים אותן, יש הפרה. אם אין מגבלות — דף ציבורי, בלי התחברות — סביר שאתם בסדר.
העונש על הפרה הוא עד לפי סעיף 71 של ICNA.
ניואנס שחשוב לציין: בית המשפט העליון של קוריאה התייחס בעקביות למגבלות בתנאי השימוש כמשהו שונה ממגבלות גישה. תנאי האפליקציה של Yanolja הגבילו שימוש מסחרי ואסרו תוכנות אוטומטיות שהעמיסו על השרת, אבל בית המשפט קבע שסעיפים אלה לא הגבילו באופן אובייקטיבי את הגישה לשרת ה-API עצמו.
חוק זכויות היוצרים: זכויות יצרן מסד נתונים
חוק זכויות היוצרים של קוריאה מגן בנפרד על יצרני מסדי נתונים, מעבר לזכויות היוצרים על תוכן בודד. לפי , שכפול של "כל או חלק מהותי" ממסד נתונים הוא בלתי חוקי — גם אם נקודות נתונים בודדות הן עובדות ציבוריות.
המבחן הוא גם כמותי (כמה העתקתם ביחס לכלל?) וגם איכותי (האם החלק שהועתק משקף את ההשקעה המהותית של היוצר בבנייה, באימות או בתחזוקה של מסד הנתונים?). העתקה חוזרת או שיטתית של חלקים קטנים יותר יכולה גם היא להיחשב אם בפועל היא משיגה את אותה תוצאה כמו העתקת חלק מהותי.
העונש על הפרת זכויות יצרן מסד נתונים: עד שלוש שנים או 30 מיליון וון לפי סעיף 136(2)(3). פיצויים סטטוטוריים לפי סעיף 125-2 מאפשרים עד 10 מיליון וון לכל יצירה, או 50 מיליון וון לכל יצירה בהפרה מכוונת למטרות רווח.
PIPA: חוק הגנת המידע האישי
PIPA מסדיר איסוף מידע אישי — שמות, פרטי קשר, מזהים — גם אם הם גלויים לציבור. הרפורמה ב-2023 הייתה משמעותית: היא הרחיבה את זכויות נושאי המידע, הקשיחה את דרישות ההסכמה, הנהיגה כללים לגבי קבלת החלטות אוטומטית, וקבעה עיצומים מנהליים של עד עבור הפרות מסוימות.
ההנחיה של PIPC ל- מזכירה במפורש נתונים שהתקבלו באמצעות "web crawling and scraping" בהקשר של מידע אישי הזמין לציבור. ההנחיה מבהירה שאינטרס לגיטימי עשוי לשמש בסיס בחלק מההקשרים, אבל ארגונים צריכים איזון, אמצעי הגנה, הגנה על זכויות וממשל תקין.
והמגמה מחמירה. במרץ 2026, שמעלה את הקנסות המרביים על כשלים חמורים וחוזרים בדליפת מידע לעד 10% מההכנסות, שייכנס לתוקף בהמשך 2026.
UCPA: ה"סעיף הכללי" של התחרות הבלתי הוגנת
UCPA הוא החוק ששם את GC Company תחת אחריות בתיק האזרחי ב-Yanolja. החוק הנוכחי כולל שני סעיפים רלוונטיים:
- סעיף 2(1)(k): עוסק בשימוש בלתי הוגן בנתונים טכניים או עסקיים שנצברו ומנוהלים אלקטרונית ואינם סודיים
- סעיף 2(1)(m): סעיף כללי רחב יותר לשימוש בתוצאות של אדם אחר שהושגו באמצעות השקעה או מאמץ משמעותיים, לטובת העסק של עצמכם וללא רשות, בניגוד לנוהגי מסחר הוגנים
ה-UCPA הוא אזרחי בלבד ביחס לסעיפים האלה — בלי עונש פלילי — אבל הוא יכול להביא לצווי מניעה לפי , לפיצויים לפי סעיף 5, ואפילו לפיצויים משולשים במקרים מכוונים מסוימים לפי סעיף 14-2. בתיק האזרחי של Yanolja נפסקו כ-1 מיליארד וון לפי המסגרת הזו.
פרשת Yanolja: למה אפשר לנצח פלילית ולהפסיד אזרחית
זו הפרשה שכל משתמש עסקי בקוריאה צריך להבין. אספר אותה כסיפור אחד, כי כך היא התרחשה בפועל — וגם כי התוצאה המפוצלת היא כל הנקודה.
מה קרה: GC Company גרפה את נתוני הנסיעות של Yanolja
GC Company הפעילה פלטפורמת תיירות מקוונת מתחרה. הם בנו זחלן (crawler) שפיתחו בעצמם, שניגש לשרת ה-API של אפליקציית Baro Reservation של Yanolja, למד את כתובות ה-API ואת פקודות הבקשה ושלח אותן לשרת. כלי הגריפה אסף מידע על מקומות לינה — שמות שותפים, כתובות, מחירים, זמינות ותמונות. GC Company השתמשה בנתונים האלה באופן פנימי לצורכי שיווק ומיצוב תחרותי.
Yanolja הגישה גם תלונה פלילית וגם תביעה אזרחית.
פסק הדין הפלילי: זיכוי מלא מכל האישומים (בית המשפט העליון 2021Do1533)

בית המשפט העליון ב-12 במאי 2022, בכל שלושת האישומים:
- ICNA סעיף 48 (חדירה): לא היו מגבלות גישה. שרת ה-API היה נגיש לציבור דרך דפדפן ואפליקציה סלולרית. לא הייתה חסימה טכנית. סעיפי תנאי השימוש הגבילו שימוש, לא גישה.
- חוק זכויות היוצרים (זכויות יצרן מסד נתונים): הנאשמים לא העתיקו "את כל או חלק מהותי" ממסד הנתונים. הנתונים שהועתקו כבר היו ידועים לציבור, והראיות לא הוכיחו שהחלק שהועתק שיקף את ההשקעה המהותית של Yanolja.
- סעיף 314 לחוק העונשין (הפרעה לעסק): לא הוכחה הפרעה ממשית לפעולת שרת ה-API של Yanolja. לא הוכח שינוי בנתונים. לא הוכחה כוונה פלילית להפריע לעסק.
הכלל שאפשר לצטט: מגבלות גישה נבחנות דרך "אמצעי הגנה, תנאי שימוש ונסיבות אובייקטיביות אחרות." אם השער פתוח, מעבר דרכו אינו הסגת גבול.
פסק הדין האזרחי: פיצויים של 1 מיליארד וון לפי UCPA
וכאן הסיפור מתהפך. בית המשפט המחוזי המרכזי של סיאול — ואחריו בית המשפט הגבוה של סיאול (תיק 2021Na2034740, שניתן ב-25 באוגוסט 2022) — קבעו ש-GC Company הפרה את סעיף הסל של UCPA. בית המשפט פסק כ-1 מיליארד וון (~800 אלף דולר) כפיצויים והורה להפסיק שכפול נתונים נוסף.
ההיגיון: מסד הנתונים של מקומות הלינה של Yanolja היה בעל ערך מסחרי ושיקף השקעה מהותית — איסוף, אימות ועדכון של נתוני לינה. GC Company רכבה חינם על ההשקעה הזו. פסק הדין האזרחי הפך חלוט ברמת בית המשפט הגבוה של סיאול.
השורה התחתונה המעשית: זיכוי פלילי אינו שווה בטיחות אזרחית
זהו הלקח הכי לא אינטואיטיבי בדיני הגריפה בקוריאה. גישה חוקית מבחינה פלילית לא העניקה חסינות לשימוש מסחרי לא הוגן. "האם אפשר להעמיד אותי לדין?" ו"האם אפשר לתבוע אותי?" הן שאלות שונות, שיכולות לקבל תשובות הפוכות.
למשתמשים עסקיים: גם אם שיטת הגריפה שלכם נמצאת בבירור באזור הירוק לצרכים פליליים, השימוש שלכם בנתונים — במיוחד אם הוא מתחרה ישירות במקור — הוא שקובע את הסיכון האזרחי.
קוריאה מול ארה"ב מול האיחוד האירופי: איך חוקי גריפת האתרים משווים
לא מצאתי מדריך אחר שמרכז את זה בטבלה אחת — וזה די מפתיע בהתחשב בכמה עסקים גורפים מידע חוצה-גבולות.
| ממד | קוריאה הדרומית | ארצות הברית | האיחוד האירופי / EEA |
|---|---|---|---|
| חוק מרכזי | ICNA סעיף 48, חוק זכויות היוצרים | CFAA (18 U.S.C. §1030), חוקים מדינתיים | GDPR, דירקטיבת מסדי נתונים (96/9/EC) |
| פסק דין מכונן | Yanolja v GC Company (בית המשפט העליון 2021Do1533, 2022) | hiQ v LinkedIn (המעגל ה-9, 2022), Van Buren v. US (2021) | Ryanair v PR Aviation (CJEU C-30/14, 2015) |
| גריפת נתונים ציבוריים | חוקית אם אין חסמי גישה אובייקטיביים ("שער פתוח") | חוקית לפי ההיגיון ב-hiQ (נתונים ציבוריים); Van Buren צמצם את CFAA | תלוי בזכויות DB, חוזה, זכויות יוצרים, GDPR, וחוקי המדינות החברות |
| כללי מידע אישי | PIPA (תוקן ב-2023) — הסכמה או בסיס חוקי | תחומי: CCPA (קליפורניה), חוקי פרטיות מדינתיים | GDPR — הסכמה / אינטרס לגיטימי מחמירים; קנס מרבי 20 מיליון אירו או 4% מההכנסה העולמית |
| הפרת תנאי שימוש = פשע? | לא (בתי המשפט קובעים שתנאי שימוש ≠ הפרת ICNA) | לא (Van Buren 2021: תנאי שימוש ≠ CFAA) | בדרך כלל לא, אך ייתכן הפרת חוזה (Ryanair) |
| הגנת מסד נתונים | זכויות יצרן מסד נתונים לפי חוק זכויות היוצרים | אין זכות פדרלית כללית למסדי נתונים | זכות sui generis למסד נתונים |
| עונש פלילי מרבי | עד 5 שנים / 50 מיליון וון (ICNA) | עד 10 שנים / 250 אלף דולר (CFAA) | משתנה לפי מדינה חברה |
הבדלים מרכזיים שחשובים לעסק שלכם
- בקוריאה אין חריג רחב ל-Text-and-Data-Mining (TDM) כמו בדירקטיבת ה-DSM של האיחוד האירופי. אם אתם מאמנים מודלי AI על נתונים קוריאניים שגורפו, אין לכם פטור סטטוטורי.
- סעיף הסל של UCPA בקוריאה רחב ופחות צפוי מאשר דיני התחרות הבלתי הוגנת בארה"ב. קשה הרבה יותר לשחזר בארה"ב תוצאה כמו ב-Yanolja.
- כל שלוש השיטות מסכימות: הפרת תנאי שימוש בלבד אינה עבירה פלילית.
- הגנת מסדי הנתונים בקוריאה היא סטטוטורית (כמו באיחוד האירופי), בעוד שבארה"ב אין זכות פדרלית כללית למסדי נתונים. זה נותן לבעלי פלטפורמות קוריאניות יותר כלים אזרחיים.
- אם אתם גורפים מידע חוצה-גבולות, תחול המסגרת המחמירה ביותר. פרויקט גריפה שנוגע לנתונים קוריאניים, אמריקאיים ואירופיים צריך לעמוד בשלושת המשטרים.
תרחישים לפי ענף: האם גריפת אתרים חוקית בקוריאה עבור הענף שלכם?
פרופיל הסיכון משתנה מאוד לפי ענף, ואף מדריך שמצאתי לא ממפה את דיני הגריפה בקוריאה לענפים ספציפיים. אז הרכבתי את זה בעצמי.
מסחר אלקטרוני: ניטור מחירים ונתוני מוצרים

גריפת מחירי מוצרים ציבוריים מ-Coupang, מ-Gmarket או מ-11Street היא הדוגמה הכי נקייה לאזור הירוק — להיצמד לשדות עובדתיים (מחיר, זמינות, שם מוצר), לא להיכנס לאזורים שדורשים התחברות, לא לעקוף חסימות טכניות, ולהשתמש בנתונים פנימית להשוואת ביצועים.
הסיכון עולה כשגורפים תיאורי מוצרים (תוכן יצירתי → זכויות יוצרים), פרטי קשר של מוכרים (PIPA), תמונות (זכויות יוצרים), או קטלוג שלם (זכויות יצרן מסד נתונים + UCPA).
לא מצאתי תביעה קוריאנית מובילה בגריפת מסחר אלקטרוני שניתן להשוות ל-Yanolja. התקדים המפותח יותר נמצא בתיירות ובגיוס — אבל היעדר תביעות אינו היעדר סיכון.
ה- של Thunderbit ומצב הגריפה בענן בנויים בדיוק בשביל התבנית הזו: בדיקות חוזרות של מחירים ומלאי בדפים ציבוריים, עם AI Suggest Fields שמאפשר לבחור את העמודות הרצויות ולהוציא שדות של מידע אישי.
נדל"ן: רשימות נכסים
נדל"ן הוא מטבעו טריטוריה צהובה. רישומים בפלטפורמות כמו Zigbang או Naver Real Estate מערבבים נתונים עובדתיים (מחיר, שטח, שכונה) עם שמות סוכנים, טלפונים של משרדים, מספרי סלולר, תמונות ומסדי נתונים אוצרי-פלטפורמה.
גריפת פרטי נכס ציבוריים יכולה להיות בסיכון נמוך יותר. אבל איסוף עמודות של פרטי סוכנים מפעיל מיד את PIPA — וגריפת כל הרישומים באזור מסוים מתחילה להיראות כמו שכפול מהותי של מסד נתונים.
איך מפחיתים סיכון: לא לכלול עמודות אישיות, לצמצם היקף גאוגרפי, לתעד מטרה עסקית לגיטימית, לכבד מגבלות קצב, ולא לשחזר שירות רישומים מתחרה. ה-AI של Thunderbit יכול להיות מוגדר לחלץ רק את שדות הנכס שאתם צריכים — מחיר, מטרים רבועים, מיקום — תוך דילוג על פרטי קשר אישיים.
גיוס: משרות
גיוס הוא הסקטור בעל הסיכון הגבוה, נקודה. בקוריאה יש תקדים ישיר: JobKorea v. Saramin. Saramin גרפה את מסד נתוני המשרות של JobKorea ונקבעה אחראית להפרת זכויות במסד נתונים ולתחרות בלתי הוגנת. נתוני גיוס משלבים בדרך כלל השקעת פלטפורמה (רישומים אוצרים ומאומתים), העתקה בהיקף גדול של מסד נתונים, ומידע אישי או פרטי קשר של מגייסים.
ההמלצה שלי: בדרך כלל הימנעו מגריפת פלטפורמת משרות מתחרה כדי לבנות או להעשיר מסד נתוני משרות מתחרה. אם המקרה שימושי צר, קבלו בדיקה משפטית לפני איסוף, צמצמו נפח, הסירו אנשי קשר אישיים, ואל תפיצו מחדש את התוצאות.
רפרנס מלא לעונשים: מה מסתכן אם גריפת האתרים משתבשת בקוריאה
| החוק הקוריאני | סוג ההפרה | עונש פלילי מרבי | סעד אזרחי/מנהלי מרבי | השינוי המרכזי 2023–2026 |
|---|---|---|---|---|
| ICNA סעיף 48 | גישה לא מורשית / הפרעה | 5 שנים / קנס 50 מיליון וון | פיצויים + צו מניעה | 2024: נוסף סעיף 48(4), שמכוון לכלי עקיפה |
| חוק זכויות היוצרים (זכויות DB, סעיף 93) | שכפול מהותי של DB | 3 שנים / קנס 30 מיליון וון | פיצויים סטטוטוריים עד 50 מיליון וון/יצירה (מכוון למטרות רווח) | — |
| PIPA | איסוף בלתי חוקי של מידע אישי | 5 שנים / קנס 50 מיליון וון | קנס מנהלי עד 3% מכלל המכירות; תביעה ייצוגית אפשרית | רפורמת 2023; הנחיית AI לנתונים ציבוריים ב-2024; מגמה ב-2026 ל-10% בדליפות חוזרות |
| UCPA סעיף 2(1)(k)/(m) | רכישה/שימוש בלתי הוגנים בנתונים | אזרחי בלבד (אין פלילי לסעיף הסל) | פיצויים + צו מניעה; פיצויים משולשים במקרים מכוונים מסוימים | 2022: חוק מסגרת הנתונים חיזק סעיפים |
| חוק העונשין סעיף 314 | הפרעה לעסק באמצעות אמצעים טכנולוגיים | 5 שנים / קנס 15 מיליון וון | — | Yanolja: לא הוכחה הפרעה ממשית |
הנקודה הקריטית: המסלולים הפליליים והאזרחיים פועלים בנפרד. אפשר להתמודד עם שניהם בו-זמנית — ולנצח באחד ולהפסיד בשני.
רשימת בדיקה בת 10 נקודות לתאימות בגריפת אתרים בקוריאה
הנה עשר שאלות כן/לא שכדאי לעבור עליהן לפני כל פרויקט גריפה. הדפיסו, סמנו, הדביקו למסך — מה שעובד.
- האם האתר היעד אינו דורש התחברות כדי לגשת לנתונים שאתם רוצים? אם צריך התחברות, טוקן או חשבון, הסיכון נע בחדות לעבר ICNA סעיף 48.
- האם אין מגבלות גישה טכניות? CAPTCHAs, חסימות IP, מפתחות API, מגבלות קצב וחומות בוטים הם סימני אדום חזקים.
- האם בדקתם את robots.txt של האתר? זה לא מחייב משפטית כשלעצמו לפי התקדים הקוריאני, אבל זו ראיה שימושית לציפיות האתר ולתום הלב שלכם.
- האם אתם אוספים מידע אישי כלשהו? אם שמות, מספרי טלפון, אימיילים, מזהים או פרטי קשר של אנשים נמצאים בהיקף, צריך ניתוח לפי PIPA.
- האם אתם מעתיקים "חלק מהותי" ממסד הנתונים של האתר? שאלו גם שאלה כמותית וגם איכותית — כמה, והאם החלק שהועתק משקף את ההשקעה של המקור?
- האם הגדרתם את המטרה שלכם? ניתוח פנימי בסיכון נמוך יותר מהפצה מחדש או בניית מסד נתונים מתחרה. (אבל Yanolja מראה ששימוש תחרותי פנימי אינו מגן מוחלט.)
- האם תיעדתם בכתב את המטרה העסקית הלגיטימית שלכם? תיעוד עוזר במאזן האינטרס הלגיטימי לפי PIPA ובהוכחת תום לב.
- האם הסרתם או אנונימיזתם שדות של מידע אישי לפני אחסון/שימוש? הוצאה של פרטי קשר מוציאה לעיתים קרובות גריפת נדל"ן, גיוס ומדריכים מהתבנית המסוכנת ביותר של PIPA.
- האם אתם משתמשים במרווחי בקשות סבירים? הימנעו מהעמסת יתר על השרת — הסיכון לפי חוק העונשין סעיף 314 ו-ICNA סעיף 48(3) עולה כאשר הגריפה פוגעת בתפקוד השירות.
- האם התייעצתם עם עורך דין קוריאני לפרויקטים בהיקף גדול, מסחריים או חוצי-גבולות? ייתכן שיחולו גם דין קוריאני וגם GDPR/דיני פרטיות או גישה למחשבים בארה"ב.
⚠️ הבהרה: רשימת הבדיקה הזו היא לצורכי התמצאות, לא ייעוץ משפטי. תמיד כדאי להתייעץ עם עורך דין מקומי בקוריאה לגבי מצבים ספציפיים.
איך Thunderbit עוזר לכם לגרוף אתרים קוריאניים באחריות
גילוי נאות: אני עובד בצוות השיווק של Thunderbit. אבל באמת אני חושב שההתאמה בין המוצר לחוק כאן שימושית, ולא רק הצעה מכירתית.
Thunderbit נבנה עבור מקרי השימוש באזור הירוק שהמאמר הזה מתאר: גריפת נתונים זמינים לציבור ללא צורך בהתחברות. כך תכונות מסוימות ממפות למסגרת התאימות:
- מצב גריפה בענן לאתרים ציבוריים — בלי צורך להתחבר, בלי סשן מקומי, ושמירה על גבולות גישה ציבוריים. זה תואם לעקרון "השער פתוח" ב-Yanolja.
- AI Suggest Fields מאפשר לכם להגדיר בדיוק אילו עמודות נתונים לחלץ. צריכים מחירי מוצרים וזמינות אבל לא מספרי טלפון של מוכרים? פשוט הוציאו את העמודות האישיות. זו הדרך הפשוטה ביותר להימנע מטריגרים של PIPA.
- Scheduled scraper לבדיקות חוזרות של מחירים, מלאי או רישומים במרווחים סבירים — בלי להעמיס על השרת בבקשות רצופות.
- ייצוא נתונים חינמי ל-Excel, Google Sheets, Airtable ו-Notion עבור תהליכי עבודה פנימיים של ניתוח.
- גריפת תתי-עמודים להעמקת נתונים מרישומים ציבוריים (למשל, כניסה לעמודי מוצרים בודדים כדי לחלץ מפרטים) בלי גישה לאזורים שדורשים התחברות או מוגבלים.
- התאמת פריסה באמצעות AI — הכלי קורא את מבנה האתר מחדש בכל פעם, ומסתגל לשינויים בפריסה בלי סלקטורים קשיחים ושבירים.
Thunderbit תומך בשימוש רב-לשוני בעשרות שפות, וזה חשוב לצוותים שעובדים עם אתרים בשפה הקוריאנית. אפשר לנסות אותו בחינם דרך .
אף כלי לא מבטל סיכון משפטי. אבל הגדרה אחראית — דפים ציבוריים, נתונים עובדתיים, ללא שדות אישיים, ומרווחי בקשות סבירים — שומרת אתכם במסגרת התאימות שמתוארת במאמר הזה.
נקודות מרכזיות על חוקיות גריפת האתרים בקוריאה
חמישה דברים שכדאי לזכור:
- טכנולוגיית גריפת אתרים כשלעצמה חוקית בקוריאה. בית המשפט העליון אישר זאת בפרשת Yanolja.
- הסיכון תלוי בשיטת הגישה (שער פתוח מול שער סגור), בסוג הנתונים (אישי מול עובדתי) ובשימוש (פנימי מול הפצה מחדש תחרותית).
- זיכוי פלילי ≠ בטיחות אזרחית. פרשת Yanolja מוכיחה שאפשר להימנע מהעמדה לדין ועדיין להתמודד עם פיצויים של מיליארד וון.
- כשגורפים נתונים ציבוריים, לא אישיים ועובדתיים, לשימוש פנימי וללא מחסומי גישה — בדרך כלל אתם באזור הבטוח. אבל ל"בדרך כלל" יש משקל — היקף, נפח ומטרה כולם חשובים.
- תמיד כדאי להתייעץ עם יועץ משפטי מקומי בקוריאה בפרויקטים גדולים או מסחריים. המאמר הזה הוא לצורכי התמצאות, לא ייעוץ משפטי.
אם אתם רוצים להתחיל לגרוף אתרים קוריאניים באחריות, מאפשרת לבדוק את התהליך בהיקף קטן. לעוד על איך גריפת AI עובדת בפועל, בדקו את המדריכים שלנו על ועל . ואם אתם רוצים לראות את הכלי בפעולה, בערוץ ה- יש הדרכות למקרי שימוש נפוצים.
שאלות נפוצות
1. האם גריפת נתונים הזמינים לציבור חוקית בקוריאה?
בדרך כלל כן לצרכים פליליים — לפי פסק הדין של בית המשפט העליון ב-Yanolja, גישה לנתונים מאתר שאין בו מגבלות גישה אובייקטיביות אינה מפרה את ICNA. אבל עדיין ייתכן סיכון אזרחי לפי UCPA או חוק זכויות היוצרים, בהתאם לנפח, להשקעת המקור ולשימוש המסחרי שלכם בנתונים.
2. האם אפשר לתבוע אותי על גריפת אתרים בקוריאה גם אם זה לא פלילי?
כן. המסלולים הפליליים והאזרחיים נפרדים. GC Company זוכתה מכל האישומים הפליליים אך חויבה לשלם כ-1 מיליארד וון בפיצויים אזרחיים לפי סעיף הסל של UCPA. זיכוי פלילי לא מגן מפני תביעות אזרחיות.
3. האם הפרת תנאי השימוש של אתר הופכת גריפה לבלתי חוקית בקוריאה?
בתי המשפט בקוריאה קבעו בעקביות שהפרת תנאי שימוש בלבד אינה עבירה פלילית לפי ICNA — בית המשפט הבחין בין הגבלת שימוש (תנאי שימוש) לבין הגבלת גישה (חסמים טכניים). עם זאת, הפרת תנאי שימוש עדיין יכולה לתמוך בתביעת הפרת חוזה אזרחית או לשמש ראיה לחוסר תום לב בניתוח תחרות בלתי הוגנת.
4. איך חוקי הגריפה בקוריאה משווים לארה"ב?
שתי השיטות מגינות על גריפת נתונים ציבוריים (Yanolja בקוריאה, hiQ v LinkedIn בארה"ב) ושתי המערכות קובעות שהפרת תנאי שימוש בלבד אינה עבירה פלילית (Van Buren בארה"ב). ההבדל המרכזי: לקוריאה יש הגנה סטטוטורית חזקה יותר על מסדי נתונים וסעיף סל רחב יותר בתחרות בלתי הוגנת מאשר לארה"ב, שבה אין זכות פדרלית כללית למסדי נתונים. לבעלי פלטפורמות קוריאניות יש יותר כלים משפטיים אזרחיים נגד גורפים.
5. מה קורה אם אני גורף מידע אישי מאתרים קוריאניים?
PIPA חל בלי קשר לשאלה אם המידע נראה לציבור. איסוף מידע אישי — שמות, מספרי טלפון, אימיילים — ללא הסכמה או בסיס חוקי אחר הוא הפרה. התיקון ל-PIPA ב-2023 חיזק את ההגנות האלה, וההנחיה של PIPC מ-2024 לגבי מידע אישי הזמין לציבור מתייחסת במפורש ל-web crawling ולגריפה. העונשים יכולים להגיע עד 5 שנות מאסר, 50 מיליון וון בקנסות, ועיצומים מנהליים של עד 3% מכלל המכירות.
למדו עוד
