Pět japonských zákonů upravuje web scraping. Žádný z nich ale ten výraz vlastně nepoužívá.
Pokud jste se někdy snažili zjistit, jestli je váš scrapingový projekt v Japonsku legální, nejspíš jste narazili na záplavu vágních příspěvků na fórech, článků zaměřených na trénování AI a rozporuplných rad. Strávil jsem týdny procházením japonských zákonů, vládních doporučení, údajů o vymáhání práva i právních komentářů, abych dal dohromady co nejjasnější průvodce v angličtině, jaký jsem dokázal.
Ať už sledujete konkurenční ceny na Rakutenu, stahujete data o nemovitostech pro analýzu trhu, nebo stavíte seznam B2B leadů, tenhle článek vás provede všemi relevantními zákony — s praktickými tabulkami, reálnými scénáři a 10krokovým checklistem souladu, který můžete použít ještě předtím, než začnete data extrahovat.
Co vlastně znamená „Je web scraping v Japonsku legální?“
Web scraping — tedy používání softwaru k automatickému stahování dat z webů — není řešen jedním jediným japonským zákonem. Žádný předpis neříká „scraping je legální“ ani „scraping je nelegální“. Zákonnost vašeho projektu závisí na třech věcech: co scrapujete, jak k tomu přistupujete a co s daty uděláte potom.
Právní rámec tvoří pět zákonů:
| Zákon | Co znamená pro scrapery |
|---|---|
| Autorský zákon (zákon č. 48 z roku 1970) | Chrání tvůrčí díla, obrázky, texty a struktury databází. Článek 30-4 poskytuje širokou výjimku pro analýzu dat. |
| APPI (zákon o ochraně osobních údajů, zákon č. 57 z roku 2003) | Upravuje sběr, použití, sdílení a přeshraniční předávání osobních údajů o žijících fyzických osobách. |
| UCAL (zákon o zákazu neoprávněného přístupu k počítačovým systémům, zákon č. 128 z roku 1999) | Trestá obcházení autentizace a přístupových kontrol — japonský zákon proti hackingu. |
| UCPA (zákon o zabránění nekalé soutěži, zákon č. 47 z roku 1993) | Chrání obchodní tajemství a „sdílená data s omezeným přístupem“ před neoprávněným získáním. |
| Trestní zákoník (zákon č. 45 z roku 1907) | Články 233, 234 a 234-2 mohou dopadat na scraping, pokud narušuje provoz webu. |
Zbytek článku rozebírá každý zákon na praktických příkladech a s odhadem rizik. Chcete přeskočit rovnou k akčním bodům? Přejděte na .
Japonský autorský zákon a článek 30-4: výjimka pro informační analýzu
Japonský autorský zákon chrání tvůrčí díla: články, fotografie, produktové popisy i databázové struktury s kreativním uspořádáním. Když scraper stáhne webovou stránku, technicky tím podle obsah „rozmnožuje“ — jde o výhradní právo autora na rozmnožování.
Jenže tady Japonsko vyniká.
V roce 2018 přijalo Japonsko rozsáhlou novelu (účinnou od 1. ledna 2019), která doplnila — pružnou autorskoprávní výjimku, díky níž je většina analytického web scrapingu legální. ji označuje za jeden z nejpřívětivějších rámců na světě pro analýzu dat a vývoj AI.
Většina článků v angličtině rámuje článek 30-4 jen jako něco relevantního pro trénování AI. To je ale příliš úzký výklad. Zákon výslovně pokrývá „informační analýzu“ — extrakci, porovnávání, klasifikaci a další statistické zpracování dat. Jinými slovy přesně to, co dělají business scrapers každý den.
Co článek 30-4 skutečně říká (jednoduše)
Článek 30-4 dovoluje použití autorského díla, „pokud účel nespočívá v osobním užívání nebo umožnění jinému člověku užívat si myšlenky či pocity vyjádřené v díle“. V praxi musí platit dvě podmínky:
-
Test „užívání“. Pokud extrahujete faktická data — ceny, data, výměry, stav zásob — místo toho, abyste konzumovali nebo znovu publikovali tvůrčí obsah, jste na správné straně. potvrzují, že mezi neúživné použití patří analýza dat, klasifikace a indexace.
-
Test „neoprávněné újmy“. Váš scraping by neměl nahrazovat původní dílo ani podkopávat trh držitele autorských práv. Například scrapování placeného datasetu připraveného k analýze, abyste ho nemuseli koupit, může tímto testem neprojít, i když je váš účel analytický.

Reálné scrapingové scénáře podle článku 30-4
Tady se teorie potkává s praxí. Tento zákon se vztahuje mnohem dál než jen na trénování AI:
| Případ použití | Platí článek 30-4? | Proč |
|---|---|---|
| Scraping nabídek nemovitostí pro analýzu tržních cen | ✅ Ano | Nabídková cena, plocha i stáří budovy jsou faktické vstupy pro informační analýzu, ne pro užívání výrazu |
| Scraping burzovních dat z burzovních webů | ✅ Ano | Účel statistické analýzy |
| Scraping obrázků produktů pro konkurenční e‑shop | ❌ Ne | Zneužívá samotný výrazový obsah |
| Scraping zpravodajských článků pro jejich opětovné zveřejnění | ❌ Ne | Nahrazuje původní dílo |
| Scraping produktových popisů pro sledování cen | ✅ Pravděpodobně ano | Extrahuje faktická data, ne tvůrčí výraz |
| Tvorba RAG systému nad scrapovanými dokumenty | ⚠️ Smíšené | Vectorizace může být neúživné použití, ale výstup chráněných pasáží vyžaduje další analýzu |
Ještě jedna nuance: článek 47-5 nabízí užší ochranu pro „drobné užití“ jako vedlejší efekt počítačového zpracování informací — například malé úryvky nebo miniatury ve výsledcích vyhledávání. Není to hlavní bezpečný přístav pro scraping, ale může podpořit předběžné kopírování nutné pro vyhledávací nebo analytické služby. posuzuje „drobné“ podle podílu, množství a přesnosti zobrazení.
Shrnutí: pokud extrahujete fakta pro analýzu, ne pro opětovné zveřejnění tvůrčího obsahu, japonský autorskoprávní rámec stojí na vaší straně.
Japonský zákon o neoprávněném přístupu k počítačovým systémům (UCAL): kdy scraping překročí hranici
Tento zákon skoro žádný anglický článek o scrapingu nevysvětluje. Přitom je to možná nejdůležitější jasná hranice v japonském právu.
(不正アクセス禁止法, zákon č. 128 z roku 1999) je funkčním ekvivalentem amerického CFAA. Trestá neoprávněný přístup k počítačům chráněným autentizačními opatřeními. Sankce podle mohou dosáhnout až 3 let odnětí svobody nebo pokuty až 1 000 000 ¥.
UCAL nezakazuje scraping veřejných webových stránek. Zákon se uplatní teprve tehdy, když obejdete nebo překonáte autentizaci — přihlašovací bránu, hesla, přístupové tokeny nebo podobné kontroly. Tahle hranice je naprosto zásadní.
Úrovně rizika UCAL u běžných scrapingových scénářů
| Scénář | Úroveň rizika UCAL | Vysvětlení |
|---|---|---|
| Scraping veřejných produktových nabídek | ✅ Nízká | Nejde o obcházení autentizace |
| Scraping za přihlášením s vlastními přihlašovacími údaji | ⚠️ Střední — záleží na ToS | UCAL se nemusí vztahovat, pokud jsou přihlašovací údaje vaše, ale riziko ToS a smluvní riziko trvá |
| Obcházení autentizace nebo CAPTCHA za účelem přístupu k datům | ❌ Vysoká — pravděpodobné porušení | Článek 2(4)(ii) pokrývá obcházení přístupových omezení |
| Přístup k omezeným API bez oprávnění | ❌ Vysoká — pravděpodobné porušení | Autentizovaná nebo partnerská API jsou přímo v teritoriu UCAL |
| Použití cizích přihlašovacích údajů nebo session tokenů | ❌ Vysoká — pravděpodobné porušení | Článek 2(4)(i) přímo řeší použití identifikačního kódu jiné osoby |
Japonská Národní policejní agentura , což je o 8,1 % více než předchozí rok. Z toho 511 případů (90,8 %) se týkalo neoprávněného použití identifikačního kódu jiné osoby. Hlavním cílem vymáhání je tedy zneužití přístupových údajů, ne běžný scraping veřejně dostupných dat.
Jak se UCAL liší od amerického CFAA
UCAL je v podstatném smyslu užší než CFAA. Soustředí se výhradně na obcházení autentizace, zatímco formulace CFAA o „překročení oprávněného přístupu“ se v amerických soudech diskutuje už desetiletí. Po rozhodnutí Nejvyššího soudu USA je pouhé porušení ToS webu méně pravděpodobné jako důvod trestní odpovědnosti podle CFAA. Japonsko dospívá k podobnému praktickému výsledku: porušení ToS je záležitost smluvního práva, ne trestní věc podle UCAL — pokud k tomu nepřistupuje samostatný prvek obcházení přístupové kontroly.
Novely APPI z roku 2022: co by měli scrapery vědět o osobních údajích
Japonský (APPI) je hlavní právní předpis země v oblasti ochrany dat — a pravidla výrazně zpřísnily. Pokud scrapujete jména, e-maily, telefonní čísla nebo jakákoli data, která identifikují žijící fyzickou osobu z japonských webů, APPI se na vás vztahuje.
Praktická otázka zní: kdy scraping spustí povinnost souladu s APPI?
Co se podle APPI počítá jako „osobní informace“
APPI definuje osobní informace jako údaje, které mohou identifikovat konkrétní žijící osobu — a to i při snadném propojení s jinými informacemi. potvrzuje, že pracovní e-mail typu firstname.lastname@company.jp může být osobní informací, pokud identifikuje konkrétní osobu, a že cookie ID se stává osobním údajem, když je spojeno s dalšími daty umožňujícími identifikaci.
Novely z roku 2022 zavedly novou kategorii: „informace vztahující se k jednotlivci“ — data, která přímo neidentifikují osobu, ale mohou to udělat po spojení s jinými údaji (cookie ID, historie prohlížení, historie nákupů). Pro scraping je to důležité proto, že data, která scraperu připadnou anonymní, mohou být na straně příjemce identifikovatelná po sloučení s CRM nebo adtech daty.
Omezení přeshraničního předávání
Pokud scrapujete japonské weby zvenčí Japonska a sbíráte osobní údaje, APPI vyžaduje analýzu předtím, než data předáte do zahraničí. popisuje tři běžné cesty: příjemce je v zemi uznané PPC jako rovnocenná, příjemce zavedl rovnocenná ochranná opatření, nebo platí výjimka podle článku 27(1).
Pokud americká, evropská nebo singapurská firma scrapuje osobní údaje z japonských webů a ukládá je mimo Japonsko, je potřeba analýza zahraničního předání podle APPI. To spoustu mezinárodních týmů zaskočí.
Třetí strana v režimu opt-outu (článek 27)
Otázka z fór, kterou vídám nejčastěji: „Co když nasdílím nebo prodám scrapovaná data z japonských webů?“
APPI obecně vyžaduje předchozí souhlas pro poskytnutí osobních údajů třetím stranám. Existuje formální mechanismus opt-outu — ale vyžaduje podání na , informování dotčených osob a možnost, jak poskytování třetím stranám zastavit. Novely z roku 2022 to ještě zpřísnily: opt-out nelze použít pro osobní údaje získané protiprávním způsobem ani pro údaje přijaté od jiného podniku na základě opt-outu.
uvádí, že od října 2021 bylo přijato celkem 405 oznámení o opt-outu, z toho 93 ve fiskálním roce 2024. Tento systém existuje, ale je formální, ne neformální.
Kdy scraping nevyvolá APPI
APPI se nevztahuje na data, která nelze identifikovat na žijící osobu. Mezi méně riziková pole z hlediska APPI patří:
- Ceny produktů, SKU, stav zásob a poplatky za dopravu
- Otevírací doba obchodů a obecné firemní kontakty (info@company.jp)
- Cena inzerované nemovitosti, plocha, stáří budovy a vzdálenost od stanice — pokud nejsou navázány na jméno vlastníka nebo makléře
- Agregované tržní statistiky, kde jsou odstraněny údaje o jednotlivcích
Jeden praktický návrhový detail za zmínku stojí: funkce AI Suggest Fields umožňuje uživatelům přesně určit, které datové sloupce se mají extrahovat. Můžete záměrně vynechat pole s osobními údaji a soustředit se jen na byznysová fakta, která potřebujete — takže snižujete expozici vůči APPI už při návrhu, ne náhodou.
Zákon o zabránění nekalé soutěže (UCPA): scraping dat konkurence

vstupuje do hry ve chvíli, kdy scraping přejde od veřejných faktů ke důvěrným obchodním informacím nebo chráněným datasetům.
UCPA definuje obchodní tajemství jako informaci, která je (1) spravována jako tajná, (2) užitečná pro podnikání a (3) veřejně neznámá. tyto tři požadavky jako podmínky ochrany obchodního tajemství.
Fakta z veřejných webů — ceny produktů, lokality obchodů, nabídky práce, katalogy produktů — obvykle nejsou obchodním tajemstvím, protože nejsou tajná a jsou veřejně známá. Jejich scraping tedy UCPA zpravidla neporušuje.
Kdy se na scraping může vztahovat UCPA
| Scénář | Riziko podle UCPA | Proč |
|---|---|---|
| Scraping veřejného produktového katalogu konkurence pro sledování cen | Obvykle nízké | Veřejné katalogové informace zpravidla nejsou tajné |
| Scraping interních cenových dat zneužitím zranitelnosti API | Vysoké | Neveřejné a užitečné obchodní informace získané protiprávním způsobem |
| Scraping placené databáze pouze pro partnery nebo licencovaného API mimo rozsah oprávnění | Vysoké | Novely UCPA z roku 2018 chrání „sdílená data s omezeným přístupem“ |
| Použití scrapovaných dat k vytvoření konkurenčního produktu, který parazituje na nákladné databázi | Šedá zóna | Soudy mohou hodnotit omezení přístupu, investici i nahrazování |
Novela UCPA z roku 2018 doplnila ochranu pro „sdílená data s omezeným přístupem“ — technické nebo obchodní informace, které jsou ve značném rozsahu shromážděné, vedené elektronicky a pravidelně poskytované určitým osobám. UCPA ale vylučuje data, která jsou v podstatě stejná jako informace zveřejněné bezplatně. Bezplatný veřejný seznam produktů je tedy něco jiného než komerční dataset dostupný jen členům.
Přetížení serveru a japonský trestní zákoník: neshodit web
Samotná data mohou být ke sběru naprosto legální. Ale způsob, jakým scrapujete, může vytvořit trestní riziko. Japonský obsahuje ustanovení o narušení podnikání, která se aktivují, když automatizovaný přístup naruší web nebo firemní systém.
| Článek trestního zákoníku | Jednání | Trest |
|---|---|---|
| Článek 233 | Narušení podnikání podvodnými prostředky | Až 3 roky nebo 500 000 ¥ |
| Článek 234 | Násilné narušení podnikání | Stejné jako článek 233 |
| Článek 234-2 | Narušení poškozením počítače / zasahováním do něj | Až 5 let nebo 1 000 000 ¥ |
Každá japonská debata o scrapingu nakonec skončí u incidentu v ústřední knihovně města Okazaki (kolem roku 2010). Softwarový inženýr z webu knihovny a během dvou týdnů vygeneroval zhruba 33 000 automatických přístupů. Server knihovny se stal obtížně použitelným a policie uživatele zatkla kvůli podezření z narušení podnikání. Případ neskončil meritorním rozsudkem, ale zůstává silnou připomínkou, že záleží i na dopadu na server — i když jsou data samotná veřejná.
Pro kontext, proč provozovatelé webů přitvrzují: , že automatizované boty tvořily v roce 2024 51 % webového provozu a z toho škodlivé boty 37 %. , že boty představovaly 42 % veškerého webového provozu, přičemž zvlášť zasažený byl e‑commerce.
Jak se vyhnout problémům s přetížením serveru
- Respektujte robots.txt (i když to není zákon, je to důkaz záměru provozovatele)
- Přidávejte prodlevy mezi požadavky a omezujte souběžnost
- Vyhněte se špičce na cílovém webu
- Zastavte nebo zpomalte provoz, když vidíte chyby, blokace nebo odpovědi s omezením rychlosti
- Místo opakovaného načítání stejných URL ukládejte už stažené stránky do cache
Cloudové scrapingové řešení Thunderbit rozděluje požadavky mezi více serverů, takže přirozeně rozkládá zátěž a snižuje riziko přetížení jednoho cílového serveru. Není to právní štít, ale je to praktická volba, která odpovídá zodpovědnému scrapingu.
Porušení podmínek služby: smluvní riziko, ne trestní
Řada japonských webů má ve svých podmínkách zakázaný scraping nebo automatizovaný sběr dat. Podle japonského práva je porušení ToS smluvní problém — ne trestný čin.
vysvětlují, že podmínky webu jsou závazné, pokud jsou řádně začleněny do smlouvy. Click-wrap dohody (kdy musíte kliknout na „Souhlasím“) jsou nejsilnější. Podmínky schované v nenápadných odkazech v patičce jsou slabší.
| Podoba ToS | Signál vymahatelnosti |
|---|---|
| Jasný click-wrap s povinným tlačítkem „Souhlasím“ | Nejsilnější |
| Podmínky odkazované u transakce, ale bez potvrzovacího kliknutí | Méně jisté |
| Podmínky schované v patičce nebo na špatně viditelném místě | Slabší |
| Žádný smluvní vztah s provozovatelem | Nárok ze smlouvy může být slabý |
Nepodařilo se najít žádný spolehlivý zdroj, který by ukazoval, že samotné porušení ToS bez dalšího automaticky přechází v japonský trestný čin. Praktický závěr je tento: porušení ToS může založit občanskoprávní smluvní riziko (náhrada škody, předběžné opatření), ale trestní odpovědnost obvykle vyžaduje další samostatný prvek — obcházení přístupových kontrol podle UCAL, narušení podnikání podle trestního zákoníku nebo porušení autorského práva.
Moje rada: přečtěte si ToS před scrapováním jakéhokoli japonského webu. Pokud scraping výslovně zakazují, hledejte alternativu — API, datové partnerství nebo jiný zdroj stejných informací.
Japonsko vs. USA vs. EU: jak se zákony o web scrapingu srovnávají
Pokud přicházíte z amerického nebo evropského právního prostředí, tahle tabulka vám pomůže se zorientovat. Japonský rámec je v některých oblastech mírnější a v jiných přísnější.
| Právní oblast | Japonsko | Spojené státy | EU |
|---|---|---|---|
| Hlavní zákon pro scraping | Žádný jediný zákon; mozaika Autorského zákona, APPI, UCPA, UCAL a Trestního zákoníku | CFAA, státní zákony | GDPR, směrnice o databázích, směrnice DSM |
| Výjimka z autorského práva pro analýzu dat | Článek 30-4 (široký) | Fair use (posuzuje se případ od případu) | Výjimka pro TDM (články 3–4 směrnice DSM) — s opt-outem pro komerční TDM |
| Scraping osobních údajů | APPI — systém opt-outu pro poskytování třetím stranám (čl. 27) | Liší se podle státu (CCPA atd.) | GDPR — přísný souhlas / oprávněný zájem |
| Obcházení přístupových kontrol | UCAL — trestný čin | CFAA — trestní i civilní odpovědnost | Liší se podle členského státu |
| Porušení ToS = nelegální? | Jen smluvní právo; nebyla zjištěna trestní odpovědnost | CFAA po rozhodnutí Van Buren: pravděpodobně ne | Liší se; stále může platit GDPR |
| Riziko přetížení serveru | Trestní zákoník čl. 233, 234-2 (narušení podnikání) | CFAA + deliktní zásah do podnikání | Liší se |
Hlavní závěry srovnání
Článek 30-4 je v Japonsku širší než americký fair use nebo evropské výjimky pro TDM — a dělá z Japonska jednu z nejpřívětivějších zemí pro analytický scraping z hlediska autorského práva. UCAL je užší než CFAA, protože se soustředí čistě na obcházení autentizace. Pravidla APPI pro přeshraniční předávání jsou přísnější než roztříštěné americké rámce ochrany soukromí, ale v některých provozních detailech méně předepisující než GDPR.
Pro mezinárodní týmy: možná máte větší volnost scrapovat veřejná japonská data pro analýzu, než si myslíte. Největší složitost je v práci s osobními údaji — hlavně u přeshraničního předávání a sdílení s třetími stranami.
Váš 10krokový checklist souladu pro scraping japonských webů
Než začnete scrapovat jakýkoli japonský web, projděte si těchto deset otázek s odpovědí ano/ne. Každá z nich odpovídá jednomu z výše uvedených pěti zákonů.
- Je data veřejně dostupná? (bez přihlášení, bez paywallu, bez obcházení kontroly přístupu) → Pokud ano, riziko podle UCAL je nízké.
- Zakazuje web v ToS scraping? → Pokud ano, posuďte smluvní riziko; zvažte alternativní zdroje dat.
- Sbíráte osobní údaje definované APPI? (jména, e-maily, telefonní čísla, ID) → Pokud ano, zajistěte soulad s APPI.
- Budete scrapovaná osobní data předávat mimo Japonsko? → Pokud ano, dodržte pravidla APPI podle článku 28 o přeshraničním předávání.
- Plánujete sdílet nebo prodávat scrapovaná data třetím stranám? → Pokud ano, postupujte podle opt-out procedur APPI článku 27 nebo získejte souhlas.
- Jsou data chráněna autorským právem? → Pokud scrapujete pro informační analýzu (ne pro opětovné zveřejnění tvůrčího obsahu), článek 30-4 se pravděpodobně uplatní.
- Nahradí vaše scrapingová aktivita původní dílo? → Pokud ano, ochrana podle článku 30-4 se pravděpodobně neuplatní.
- Obcházíte autentizaci, CAPTCHA nebo přístupové kontroly? → Pokud ano, vysoké riziko podle UCAL — nepokračujte bez právního poradenství.
- Hrozí, že váš objem scrapingu přetíží server? → Pokud ano, omezte rychlost, přidejte prodlevy a použijte distribuovaný scraping.
- Spravuje cílová data firma jako obchodní tajemství? → Pokud jde o neveřejná proprietární data, může se uplatnit UCPA.
Pokud všechny odpovědi směřují k veřejným, faktickým, neosobním, rychlostně omezeným a nerepublikačním analytickým datům — jste na dobré cestě. Jakákoli červená vlajka by měla spustit právní kontrolu ještě před začátkem.

Jak Thunderbit pomáhá scrapovat japonské weby v souladu s pravidly
Chci být upřímný: Thunderbit je nástroj, ne právní rada. Ale je navržený tak, aby odpovídal zásadám souladu, které jsem popsal.
- AI Suggest Fields: AI Thunderbitu přečte stránku a navrhne přesně ty datové sloupce, které je potřeba extrahovat. Pomáhá vám záměrně definovat jen neosobní data, která potřebujete — a tím snižuje zbytečný sběr osobních údajů už od návrhu.
- Cloud Scraping: Rozděluje požadavky mezi více serverů, čímž přirozeně rozkládá zátěž a snižuje riziko přetížení jednoho japonského serveru. (Berme to jako vstřícnost k rate limitům zabudovanou přímo v nástroji.)
- Bezplatné extraktory e‑mailů a telefonních čísel: Když opravdu potřebujete z japonských webů získat kontaktní údaje, a umožňují extrakci na jedno kliknutí. Ale spojte to s výše uvedenými pokyny k APPI — sběr osobních údajů vyžaduje, abyste znali své povinnosti v oblasti souladu.
- Export do Excelu, Google Sheets, Airtable nebo Notion: Scrapovaná data lze hned strukturovat a exportovat k analýze, což podporuje účel „informační analýzy“, který chrání článek 30-4.
- Bez nutnosti údržby: AI Thunderbitu načítá web vždy znovu a přizpůsobuje se změnám rozložení. Nehrozí tak rozbité scrapery, které by opakovaně bombardovaly server neúspěšnými požadavky — praktický způsob, jak se vyhnout typům problémů s přetížením serveru, které vedly k incidentu v knihovně v Okazaki.
Pokud chcete praktický návod, jak Thunderbit používat, podívejte se na náš nebo na . Vyzkoušet ho zdarma můžete přes .
Příklady praktického použití
| Případ použití | Doporučená pole k extrakci | Právní odůvodnění |
|---|---|---|
| Sledování cen japonských e‑shopů | Název produktu, uvedená cena, dostupnost, prodejce, SKU, URL, časové razítko | Faktická obchodní data; článek 30-4 pro informační analýzu; nezkopírovat produktové obrázky ani recenze pro opětovné zveřejnění |
| Analýza japonského realitního trhu | Nabídková cena, lokalita, plocha, stáří budovy, typ nemovitosti, nejbližší stanice, URL, časové razítko | Podporuje agregovanou tržní analýzu; vynechte jména makléřů, telefonní čísla a jména vlastníků, pokud není zajištěn soulad s APPI |
| Sledování provozu v B2B | Název firmy, adresa pobočky, obecný firemní e-mail, otevírací doba, kategorie služeb | Nižší riziko APPI, pokud není identifikována žijící osoba; zkontrolujte ToS a rate limits |
Hlavní závěry k legalitě web scrapingu v Japonsku
Web scraping je v Japonsku ve většině případů legální — zejména když scrapujete veřejně dostupná, neosobní a faktická data pro analytické účely. „Ve většině případů“ ale neznamená „ve všech“.
- Autorský zákon (článek 30-4): Analytický scraping veřejných dat je povolen; opětovné zveřejnění tvůrčího obsahu nikoli.
- UCAL: Nepřekonávejte autentizaci ani přístupové kontroly.
- APPI: Zacházejte s osobními údaji opatrně, zejména při přeshraničním předávání a sdílení s třetími stranami.
- UCPA: Veřejná data obvykle nejsou obchodním tajemstvím; uzamčená nebo placená data nesou vyšší riziko.
- Trestní zákoník: Neshazujte server.
Před zahájením jakéhokoli scrapingového projektu použijte 10krokový checklist. Když si nejste jistí, poraďte se s právníkem — hlavně u projektů s osobními údaji nebo obsahem chráněným přístupovými omezeními.
Pokud chcete začít scrapovat japonské weby v souladu s pravidly, je postavený tak, aby byl pro netechnické uživatele co nejjednodušší. Definujte pole, extrahujte data, exportujte je do preferovaného nástroje a soustřeďte se na analýzu.
Nejčastější dotazy
Je legální scrapovat veřejné weby v Japonsku?
Obecně ano. Scraping veřejně dostupných dat pro informační analýzu je podle japonského autorského zákona, článku 30-4, obvykle legální, pokud nepřetížíte server, neobcházíte přístupové kontroly, nesbíráte osobní údaje bez souladu s APPI ani znovu nezveřejňujete chráněný výrazový obsah. Rozhodující je účel: analýza, ne opětovné zveřejnění.
Můžu scrapovat osobní údaje (e-maily, telefonní čísla) z japonských webů?
Můžete, ale APPI se vztahuje. Potřebujete zákonný účel, musíte uvést, jak data využijete, a počítat s omezeními u přeshraničního předávání a sdílení s třetími stranami. Novely z roku 2022 tato pravidla výrazně zpřísnily — zejména pro data odcházející z Japonska nebo sdílená s jinými firmami.
Co se stane, když ToS japonského webu scraping zakazují?
Porušení ToS je smluvní záležitost (možná občanskoprávní odpovědnost za škodu nebo předběžné opatření), ne trestný čin. Může ale podpořit širší právní nároky a zvýšit tvrdost vymáhání. Před scrapováním si ToS vždy přečtěte a zvažte, zda nejsou data dostupná jinou cestou.
Je scraping za přihlašovací bránou v Japonsku legální?
Použití vlastních přihlašovacích údajů je šedá zóna — UCAL se nemusí přímo uplatnit, ale riziko porušení ToS a smluvní riziko trvá. Obcházení autentizace, použití cizích přihlašovacích údajů nebo obcházení přístupových kontrol je pravděpodobně trestným porušením zákona o neoprávněném přístupu k počítačovým systémům, s trestem až 3 roky vězení nebo 1 000 000 ¥.
Můžu prodávat data, která jsem scrapoval z japonských webů?
Pokud data obsahují osobní informace, musíte dodržet systém opt-outu pro poskytování třetím stranám podle článku 27 APPI — což vyžaduje formální podání na PPC, informování jednotlivců a mechanismy opt-outu. Prodej osobních údajů bez správného postupu je porušením compliance. U neosobních faktických agregátů je riziko APPI nižší, ale stále platí autorské právo, UCPA, ToS a .
Další informace
