Ist Web-Scraping in Japan legal? Alle Gesetze, die Sie kennen müssen

Fünf japanische Gesetze regeln Web-Scraping. Und keines davon nimmt den Begriff „Web-Scraping“ überhaupt in den Mund.

Wer schon einmal klären wollte, ob das eigene Scraping-Projekt in Japan legal ist, ist vermutlich gegen eine Wand aus schwammigen Forenbeiträgen, einseitig auf KI-Training fokussierten Artikeln und einander widersprechenden Ratschlägen gelaufen. Ich habe Wochen damit zugebracht, offizielle japanische Gesetzestexte, behördliche Leitlinien, Durchsetzungsdaten und juristische Kommentare durchzuarbeiten, um den klarsten englischsprachigen Leitfaden zusammenzustellen, der mir möglich war.

Ob Sie nun die Preise der Konkurrenz auf Rakuten beobachten, Immobiliendaten für eine Marktanalyse ziehen oder eine B2B-Leads-Liste aufbauen: Dieser Artikel führt Sie durch jedes relevante Gesetz — mit praktischen Tabellen, realen Szenarien und einer 10-Schritte-Checkliste zur Compliance, die Sie vor jeder Datenextraktion nutzen können.

Was bedeutet „Ist Web-Scraping in Japan legal“ eigentlich?

Web-Scraping — also der Einsatz von Software, um Daten automatisch von Websites zu ziehen — wird in keinem einzelnen japanischen Gesetz ausdrücklich behandelt. Kein Gesetz erklärt: „Scraping ist legal“ oder „Scraping ist illegal“. Ob Ihr Vorhaben rechtmäßig ist, hängt an drei Dingen: was Sie scrapen, wie Sie darauf zugreifen und was Sie danach mit den Daten anstellen.

Fünf Gesetze bilden den rechtlichen Rahmen:

Gesetz	Was es für Scraper abdeckt
Urheberrechtsgesetz (Gesetz Nr. 48 von 1970)	Schützt kreative Werke, Bilder, Texte und Datenbankstrukturen. Artikel 30-4 enthält eine breite Ausnahme für Datenanalyse.
APPI (Gesetz zum Schutz personenbezogener Daten, Gesetz Nr. 57 von 2003)	Regelt Erhebung, Nutzung, Weitergabe und grenzüberschreitende Übermittlung personenbezogener Daten lebender Personen.
UCAL (Gesetz zum Verbot unbefugten Computerzugriffs, Gesetz Nr. 128 von 1999)	Stellt das Umgehen von Authentifizierung und Zugriffskontrollen unter Strafe — Japans Anti-Hacking-Gesetz.
UCPA (Gesetz zur Verhinderung unlauterer Wettbewerbspraktiken, Gesetz Nr. 47 von 1993)	Schützt Geschäftsgeheimnisse und „geteilte Daten mit eingeschränktem Zugriff“ vor unrechtmäßiger Erlangung.
Strafgesetzbuch (Gesetz Nr. 45 von 1907)	Die Artikel 233, 234 und 234-2 können greifen, wenn Scraping den Betrieb einer Website stört.

Der Rest dieses Artikels nimmt sich jedes Gesetz mit praxisnahen Beispielen und Risikobewertungen vor. Sie wollen direkt zu den To-dos springen? Dann geht es hier zur 10-Schritte-Checkliste für die Compliance beim Scraping japanischer Websites.

Japans Urheberrechtsgesetz und Artikel 30-4: die Ausnahme für Informationsanalyse

Japans Urheberrechtsgesetz schützt kreative Werke: Artikel, Fotos, Produktbeschreibungen, Datenbankstrukturen mit kreativer Anordnung. Lädt ein Scraper eine Webseite herunter, „vervielfältigt“ er diesen Inhalt technisch gesehen gemäß Artikel 21 — dem ausschließlichen Vervielfältigungsrecht des Urhebers.

Doch genau hier sticht Japan hervor.

2018 verabschiedete Japan eine weitreichende Änderung (in Kraft seit dem 1. Januar 2019), die Artikel 30-4 einführte — eine flexible urheberrechtliche Ausnahme, die den Großteil des analytischen Web-Scrapings legal macht. Die Agency for Cultural Affairs zählt sie zu den weltweit großzügigsten Regelungen für Datenanalyse und KI-Entwicklung.

Die meisten englischsprachigen Artikel zeichnen Artikel 30-4, als drehe er sich nur um KI-Training. Das greift zu kurz. Das Gesetz deckt ausdrücklich „Informationsanalyse“ ab — Extraktion, Vergleich, Klassifizierung und andere statistische Auswertungen von Daten. Mit anderen Worten: genau das, womit Business-Scraper täglich zu tun haben.

Was Artikel 30-4 tatsächlich sagt (in einfachem Englisch)

Artikel 30-4 erlaubt die Nutzung eines urheberrechtlich geschützten Werks, „wenn der Zweck nicht darin besteht, die in dem Werk zum Ausdruck gebrachten Gedanken oder Gefühle persönlich zu genießen oder eine andere Person dazu zu veranlassen“. In der Praxis müssen zwei Bedingungen erfüllt sein:

Der „Genuss“-Test. Wenn Sie Faktendaten extrahieren — Preise, Daten, Quadratmeter, Lagerbestände — statt kreative Inhalte zu konsumieren oder erneut zu veröffentlichen, sind Sie auf der sicheren Seite. Die Leitlinien der ACA zu KI und Urheberrecht 2024 bestätigen, dass zu den nicht genießenden Nutzungen Datenanalyse, Klassifizierung und Indexierung zählen.
Der „unzumutbare Schaden“-Test. Ihr Scraping darf das Originalwerk nicht ersetzen oder den Markt des Rechteinhabers aushöhlen. Eine kostenpflichtige, analysierbare Datensatzquelle zu scrapen, nur um sie nicht kaufen zu müssen, kann diesen Test verfehlen — selbst wenn Ihr Zweck analytisch ist.

ig_0a3cda0b72101bd40169f1b3ed9fd08191a17c22b803fb48ab_compressed.webp

Reale Scraping-Szenarien unter Artikel 30-4

Hier zeigt sich, wie das Gesetz in der Praxis greift. Sein Anwendungsbereich reicht weit über KI-Training hinaus:

Anwendungsfall	Gilt Artikel 30-4?	Warum
Immobilienangebote für Marktpreisanalysen scrapen	✅ Ja	Angebotspreis, Fläche und Gebäudealter sind faktische Eingaben für Informationsanalyse, nicht für den Genuss des Ausdrucks
Börsendaten von Börsenseiten scrapen	✅ Ja	Zweck der statistischen Analyse
Produktbilder für eine konkurrierende E-Commerce-Website scrapen	❌ Nein	Ausnutzung des expressiven Inhalts selbst
Nachrichtenartikel scrapen, um sie erneut zu veröffentlichen	❌ Nein	Ersetzt das Originalwerk
Produktbeschreibungen für Preisbeobachtung scrapen	✅ Wahrscheinlich ja	Extraktion faktischer Daten, nicht Genuss des Ausdrucks
Ein RAG-System auf Basis gescrapter Dokumente aufbauen	⚠️ Gemischt	Vektorisierung kann nicht-genießend sein, aber die Ausgabe geschützter Passagen erfordert weitere Prüfung

Noch eine Feinheit: Artikel 47-5 bietet einen engeren Schutz für „geringfügige Verwertung“, die als Nebenfolge computergestützter Informationsverarbeitung anfällt — etwa kurze Snippets oder Thumbnails in Suchergebnissen. Das ist nicht der zentrale sichere Hafen fürs Scraping, kann aber notwendige Vorbereitungskopien für Such- oder Analyse-Dienste abdecken. Der Kommentar der ACA von 2019 misst „geringfügig“ an Anteil, Menge und Darstellungsgenauigkeit.

Die Quintessenz: Wenn Sie Fakten zur Analyse extrahieren, statt kreative Inhalte neu zu veröffentlichen, steht das japanische Urheberrecht auf Ihrer Seite.

Japans Gesetz zum unbefugten Computerzugriff (UCAL): Wann Scraping die Grenze überschreitet

Kaum ein englischsprachiger Scraping-Artikel erklärt dieses Gesetz. Dabei ist es vermutlich die wichtigste klare Grenze im japanischen Recht.

Das Gesetz zum unbefugten Computerzugriff (不正アクセス禁止法, Gesetz Nr. 128 von 1999) ist das japanische Pendant zum US-CFAA. Es stellt den unbefugten Zugriff auf Computer unter Strafe, die durch Authentifizierungsmaßnahmen geschützt sind. Die Strafen nach Artikel 11 können bis zu 3 Jahre Freiheitsstrafe oder eine Geldstrafe von bis zu ¥1.000.000 betragen.

UCAL untersagt nicht das Scraping öffentlicher Webseiten. Das Gesetz greift erst, wenn Sie Authentifizierung umgehen oder aushebeln — Login-Schranken, Passwörter, Zugriffstokens oder vergleichbare Kontrollen. Genau dieser Unterschied ist ausschlaggebend.

UCAL-Risikostufen für gängige Scraping-Szenarien

Szenario	UCAL-Risiko	Erläuterung
Öffentliche Produktlisten scrapen	✅ Niedrig	Kein Umgehen von Authentifizierung beteiligt
Hinter einem Login mit eigenen Zugangsdaten scrapen	⚠️ Mittel — abhängig von den AGB	UCAL greift möglicherweise nicht, wenn die Zugangsdaten Ihnen gehören, aber AGB- und Vertragsrisiken bleiben bestehen
Authentifizierung oder CAPTCHA umgehen, um auf Daten zuzugreifen	❌ Hoch — wahrscheinlich Verstoß	Artikel 2(4)(ii) erfasst die Umgehung von Zugriffsbeschränkungen
Geschützte APIs ohne Autorisierung aufrufen	❌ Hoch — wahrscheinlich Verstoß	Authentifizierte oder nur für Partner zugängliche APIs fallen klar unter UCAL
Die Zugangsdaten oder Sitzungstokens einer anderen Person verwenden	❌ Hoch — wahrscheinlich Verstoß	Artikel 2(4)(i) betrifft direkt die Nutzung des Identifikationscodes einer anderen Person

Japans Nationale Polizeibehörde meldete 2024 insgesamt 563 aufgeklärte UCAL-Verstöße, ein Plus von 8,1 % gegenüber dem Vorjahr. Davon betrafen 511 Fälle (90,8 %) die unbefugte Nutzung des Identifikationscodes einer anderen Person. Der Schwerpunkt der Durchsetzung liegt also eindeutig auf dem Missbrauch von Zugangsdaten, nicht auf gewöhnlichem öffentlichem Scraping.

Wie sich UCAL vom US-CFAA unterscheidet

UCAL ist in einem wichtigen Punkt enger gefasst als der CFAA. Es zielt speziell auf das Umgehen von Authentifizierung ab, während die Formulierung „exceeds authorized access“ im CFAA vor US-Gerichten seit Jahrzehnten umstritten ist. Nach der Entscheidung des US Supreme Court in Van Buren führt ein bloßer Verstoß gegen die Nutzungsbedingungen einer Website seltener zu einer strafrechtlichen Haftung nach dem CFAA. Japan landet bei einem ähnlichen praktischen Ergebnis: AGB-Verstöße sind eine Vertragsfrage, keine strafrechtliche UCAL-Frage — es sei denn, ein eigenständiges Element der Zugriffskontrolle kommt hinzu.

APPI-Änderungen 2022: Was Scraper über personenbezogene Daten wissen müssen

Japans Gesetz zum Schutz personenbezogener Daten (APPI) ist das zentrale Datenschutzgesetz des Landes — und die Änderungen von 2022 haben die Regeln spürbar verschärft. Sobald Sie auf japanischen Websites Namen, E-Mail-Adressen, Telefonnummern oder andere Daten scrapen, die eine lebende Person identifizieren, gilt APPI.

Die praktische Frage lautet: Wann löst Scraping eine APPI-Compliance aus?

Was unter APPI als „personenbezogene Daten“ gilt

APPI Artikel 2 definiert personenbezogene Daten als Daten, die eine bestimmte lebende Person identifizieren können — auch durch schlichte Verknüpfung mit anderen Informationen. Die FAQ-Leitlinien der PPC bestätigen, dass eine geschäftliche E-Mail wie vorname.nachname@firma.jp personenbezogene Daten sein kann, sofern sie eine bestimmte Person identifiziert, und dass Cookie-IDs zu personenbezogenen Daten werden, wenn man sie mit anderen identifizierenden Informationen kombiniert.

Die Änderungen von 2022 schufen eine neue Kategorie: „personenbezogene Informationen mit Personenbezug“ — Daten, die eine Person nicht direkt identifizieren, dies aber in Kombination mit anderen Daten tun könnten (Cookie-IDs, Browserverlauf, Kaufhistorie). Warum das fürs Scraping zählt: Daten, die für den Scraper anonym aussehen, können auf der Empfängerseite durch Zusammenführung mit CRM- oder Adtech-Daten identifizierbar werden.

Einschränkungen bei grenzüberschreitender Übermittlung

Wenn Sie japanische Websites von außerhalb Japans scrapen und dabei personenbezogene Daten erfassen, verlangt APPI Artikel 28 eine Prüfung, bevor diese Daten ins Ausland gelangen. Die Leitlinie der PPC zur Auslandsübermittlung skizziert drei gängige Wege: Der Empfänger sitzt in einem von der PPC als gleichwertig anerkannten Land, der Empfänger hat gleichwertige Schutzmaßnahmen aufgebaut, oder eine Ausnahme nach Artikel 27 Absatz 1 greift.

Scrapt ein US-, EU- oder singapurisches Unternehmen personenbezogene Daten von japanischen Websites und speichert sie außerhalb Japans, ist eine Prüfung der Auslandsübermittlung nach APPI fällig. Das überrascht viele internationale Teams.

Die Opt-out-Regelung für Weitergabe an Dritte (Artikel 27)

Die häufigste Forenfrage, die mir begegnet: „Was passiert, wenn ich gescrapte Daten von japanischen Websites teile oder verkaufe?“

APPI Artikel 27 verlangt grundsätzlich die vorherige Zustimmung, bevor personenbezogene Daten an Dritte gehen. Es gibt einen formellen Opt-out-Mechanismus — der setzt aber eine Meldung bei der Personal Information Protection Commission, die Benachrichtigung der betroffenen Personen und eine Möglichkeit zum Widerspruch gegen die Weitergabe voraus. Die Änderungen von 2022 haben das weiter eingegrenzt: Ein Opt-out ist tabu für personenbezogene Daten, die durch unrechtmäßige Mittel erlangt wurden oder die ein anderes Unternehmen über ein Opt-out-Verfahren weitergereicht hat.

Der Jahresbericht 2024 der PPC weist 405 insgesamt akzeptierte Opt-out-Meldungen seit Oktober 2021 aus, davon 93 im Geschäftsjahr 2024. Das System existiert, wird aber formell und nicht lax gehandhabt.

Wann Scraping nicht unter APPI fällt

APPI gilt nicht für Daten, die keine lebende Person identifizieren können. Zu den Feldern mit geringerem APPI-Risiko gehören unter anderem:

Produktpreise, SKUs, Lagerbestände und Versandkosten
Öffnungszeiten von Geschäften und allgemeine Firmenkontaktinformationen (info@company.jp)
Immobilienpreis, Fläche, Gebäudealter und Entfernung zur Station — sofern nicht mit namentlich genannten Eigentümern oder Maklern verknüpft
Aggregierte Marktstatistiken, bei denen individuelle Zuordnungen entfernt wurden

Ein praktischer Design-Ansatz, der hier erwähnenswert ist: Die Funktion Thunderbit „AI Suggest Fields“ lässt Nutzer genau festlegen, welche Datenfelder extrahiert werden. Sie können personenbezogene Felder bewusst weglassen und sich auf die geschäftlichen Fakten beschränken, die Sie brauchen — und so das APPI-Risiko durch Design statt durch Zufall senken.

Gesetz zur Verhinderung unlauteren Wettbewerbs (UCPA): Scraping von Wettbewerbsdaten

ig_0a3cda0b72101bd40169f1b4462be08191a1ab2d0796a7d30e_compressed.webp

Das Gesetz zur Verhinderung unlauterer Wettbewerbspraktiken kommt ins Spiel, wenn Scraping von öffentlichen Fakten in vertrauliche Geschäftsinformationen oder geschützte Datensätze übergeht.

UCPA definiert ein Geschäftsgeheimnis als Information, die (1) als geheim verwaltet wird, (2) für das Geschäft nützlich ist und (3) nicht öffentlich bekannt ist. METI fasst diese drei Anforderungen als Voraussetzungen für den Schutz von Geschäftsgeheimnissen zusammen.

Öffentliche Website-Fakten — Produktpreise, Filialstandorte, Stellenausschreibungen, Produktkataloge — sind in der Regel keine Geschäftsgeheimnisse, weil sie nicht geheim und öffentlich bekannt sind. Solche Informationen zu scrapen, verstößt typischerweise nicht gegen UCPA.

Wann UCPA beim Scraping greifen könnte

Szenario	UCPA-Risiko	Warum
Produktkatalog eines Wettbewerbers für Preisbeobachtung scrapen	Meist niedrig	Öffentliche Katalogfakten sind in der Regel nicht geheim
Interne Preisdaten durch Ausnutzen einer API-Schwachstelle scrapen	Hoch	Nicht öffentliche, nützliche Geschäftsinformationen, unrechtmäßig erlangt
Kostenpflichtige Partnerdatenbank oder lizenzierte API außerhalb des Nutzungsumfangs scrapen	Hoch	Die UCPA-Änderungen von 2018 schützen „geteilte Daten mit eingeschränktem Zugriff“
Gescrapte Daten nutzen, um ein konkurrierendes Produkt zu bauen, das von einer teuren Datenbank profitiert	Grauzone	Gerichte können Zugriffsbeschränkungen, Investitionen und Substitution bewerten

Die UCPA-Änderung von 2018 brachte Schutz für „geteilte Daten mit eingeschränktem Zugriff“ — technische oder geschäftliche Informationen, die in erheblichem Umfang gesammelt, elektronisch verwaltet und regelmäßig bestimmten Personen bereitgestellt werden. UCPA Artikel 19 nimmt davon jedoch Daten aus, die im Wesentlichen mit Informationen identisch sind, die unentgeltlich öffentlich zugänglich gemacht wurden. Eine kostenlose öffentliche Produktliste ist also etwas anderes als ein nur für Mitglieder zugänglicher kommerzieller Datensatz.

Serverüberlastung und Japans Strafgesetzbuch: Bringen Sie die Website nicht zum Absturz

Die Daten selbst können völlig legal zu erheben sein. Aber wie Sie scrapen, kann strafrechtliche Risiken erzeugen. Japans Strafgesetzbuch enthält Bestimmungen zur Geschäftsbehinderung, die greifen, wenn automatisierter Zugriff eine Website oder ein Geschäftssystem stört.

Artikel des Strafgesetzbuchs	Verhalten	Strafe
Artikel 233	Behinderung des Geschäfts durch betrügerische Mittel	Bis zu 3 Jahre oder ¥500.000
Artikel 234	Gewaltförmige Behinderung des Geschäfts	Gleich wie Artikel 233
Artikel 234-2	Behinderung durch Beschädigung/Störung eines Computers	Bis zu 5 Jahre oder ¥1.000.000

Jede japanische Scraping-Debatte landet früher oder später beim Vorfall der Zentralbibliothek der Stadt Okazaki (~2010). Ein Softwareingenieur erstellte einen Crawler, um Informationen über neue Bücher zu sammeln von der Website der Bibliothek und erzeugte über zwei Wochen hinweg rund 33.000 automatisierte Zugriffe. Der Server der Bibliothek wurde dadurch schwer nutzbar, und die Polizei nahm den Nutzer wegen des Verdachts auf Geschäftsbehinderung fest. Das Verfahren endete ohne Sachurteil, bleibt aber eine eindringliche Erinnerung daran, dass die Serverlast zählt — selbst wenn die Daten selbst öffentlich sind.

Etwas Kontext, warum Website-Betreiber eskalieren: Thales/Imperva berichtete, dass automatisierte Bots 2024 51 % des Web-Traffics ausmachten, davon 37 % schlechte Bots. Akamai fand heraus, dass Bots 42 % des gesamten Web-Traffics stellten, wobei besonders der E-Commerce betroffen war.

So vermeiden Sie Probleme mit Serverüberlastung

robots.txt respektieren (zwar kein Gesetz, aber ein Hinweis auf die Absicht des Betreibers)
Pausen zwischen den Anfragen einbauen und die Parallelität begrenzen
Spitzenzeiten der Zielseite meiden
Traffic stoppen oder zurückfahren, sobald Sie Fehler, Sperren oder Rate-Limit-Antworten sehen
Bereits abgerufene Seiten cachen, statt dieselben URLs immer wieder aufzurufen

Thunderbits Cloud-Scraping-Funktion verteilt Anfragen auf mehrere Server und streut die Last dadurch von Natur aus, sodass das Risiko sinkt, einen einzelnen Zielserver zu überlasten. Das ist kein rechtlicher Schutzschild, aber eine praktische Designentscheidung, die verantwortungsvolles Scraping stützt.

Verstöße gegen die Nutzungsbedingungen: Vertragsrisiko, kein Strafrisiko

Viele japanische Websites führen Nutzungsbedingungen, die Scraping oder automatisierte Datenerhebung untersagen. Nach japanischem Recht ist ein Verstoß gegen die Nutzungsbedingungen eine Vertragsfrage — kein Straftatbestand.

METIs Auslegungsrichtlinien zum elektronischen Handel führen aus, dass Website-Bedingungen bindend sind, sofern sie ordnungsgemäß in den Vertrag einbezogen werden. Click-Wrap-Vereinbarungen (bei denen Sie auf „Agree“ klicken müssen) wiegen am schwersten. Bedingungen, die in schwer auffindbaren Footer-Links versteckt sind, wiegen leichter.

AGB-Design	Durchsetzbarkeitssignal
Klarer Click-Wrap mit erforderlichem „Agree“-Button	Am stärksten
Bedingungen nahe der Transaktion verlinkt, aber ohne „Agree“-Klick	Unsicherer
Bedingungen im Footer oder an schwer auffindbarer Stelle versteckt	Schwächer
Kein Vertragsverhältnis mit dem Betreiber	Vertragsanspruch möglicherweise schwach

Es ließ sich keine belastbare Quelle finden, die belegt, dass ein bloßer AGB-Verstoß ohne weitere Umstände zu einer japanischen Strafverfolgung führt. Die praktische Sicht: Ein Verstoß gegen die Nutzungsbedingungen kann zivilrechtliche Vertragsrisiken auslösen (Schadensersatz, Unterlassung), strafrechtliche Risiken setzen jedoch in der Regel ein eigenständiges Element voraus — Umgehung von Zugriffskontrollen nach UCAL, Geschäftsbehinderung nach dem Strafgesetzbuch oder eine Urheberrechtsverletzung.

Mein Rat: Lesen Sie die Nutzungsbedingungen, bevor Sie irgendeine japanische Website scrapen. Ist Scraping dort ausdrücklich verboten, halten Sie nach Alternativen Ausschau — einer API, einer Datenpartnerschaft oder einer anderen Quelle für dieselben Informationen.

Japan vs. USA vs. EU: Wie sich die Web-Scraping-Gesetze vergleichen

Wenn Sie aus einem US- oder EU-Rechtsumfeld kommen, hilft Ihnen diese Tabelle bei der Einordnung. Japans Rahmen ist in manchen Bereichen großzügiger und in anderen strenger.

Rechtliche Dimension	Japan	Vereinigte Staaten	EU
Zentrales Scraping-Gesetz	Kein Einzelgesetz; Flickenteppich aus Urheberrechtsgesetz, APPI, UCPA, UCAL, Strafgesetzbuch	CFAA, einzelstaatliche Gesetze	DSGVO, Datenbankrichtlinie, DSM-Richtlinie
Urheberrechtliche Ausnahme für Datenanalyse	Artikel 30-4 (breit)	Fair Use (je nach Einzelfall)	TDM-Ausnahme (Artikel 3–4, DSM-Richtlinie) — mit Opt-out für kommerzielles TDM
Scraping personenbezogener Daten	APPI — Opt-out für Weitergabe an Dritte (Art. 27)	Je nach Bundesstaat unterschiedlich (CCPA usw.)	DSGVO — strenge Einwilligung/berechtigtes Interesse
Umgehung von Zugriffskontrollen	UCAL — Straftat	CFAA — straf- und zivilrechtlich	Je nach Mitgliedstaat unterschiedlich
AGB-Verstoß = illegal?	Nur Vertragsrecht; keine strafrechtliche Haftung festgestellt	CFAA nach Van Buren: wahrscheinlich nein	Je nach Lage; DSGVO kann trotzdem gelten
Risiko durch Serverüberlastung	Strafgesetzbuch Art. 233, 234-2 (Geschäftsbehinderung)	CFAA + deliktische Störung	Unterschiedlich

Zentrale Erkenntnisse aus dem Vergleich

Japans Artikel 30-4 reicht weiter als US Fair Use oder die EU-TDM-Ausnahmen — damit gehört Japan aus urheberrechtlicher Sicht zu den großzügigeren Ländern fürs analytische Scraping. UCAL ist enger gefasst als der CFAA, weil es sich rein aufs Umgehen von Authentifizierung konzentriert. APPI ist bei grenzüberschreitenden Übermittlungen strenger als die zersplitterten US-Datenschutzregime, aber in manchen operativen Details weniger kleinteilig als die DSGVO.

Für internationale Teams heißt das: Sie haben womöglich mehr Spielraum, öffentliche japanische Daten für Analysen zu scrapen, als Sie vermuten. Die eigentliche Komplexität steckt im Umgang mit personenbezogenen Daten — besonders bei grenzüberschreitenden Übermittlungen und Weitergaben an Dritte.

Ihre 10-Schritte-Checkliste für das Scraping japanischer Websites

Bevor Sie mit dem Scraping irgendeiner japanischen Website loslegen, arbeiten Sie diese zehn Ja/Nein-Fragen ab. Jede knüpft an eines der fünf oben genannten Gesetze an.

Sind die Daten öffentlich zugänglich? (Kein Login, keine Paywall, kein Umgehen von Zugriffskontrollen) → Falls ja, ist das UCAL-Risiko niedrig.
Untersagen die Nutzungsbedingungen der Website Scraping? → Falls ja, das Vertragsrisiko bewerten; über alternative Datenquellen nachdenken.
Erheben Sie personenbezogene Daten im Sinne von APPI? (Namen, E-Mails, Telefonnummern, IDs) → Falls ja, APPI-Compliance sicherstellen.
Werden Sie gescrapte personenbezogene Daten außerhalb Japans übertragen? → Falls ja, die Regeln von APPI Artikel 28 zur grenzüberschreitenden Übermittlung einhalten.
Wollen Sie gescrapte Daten an Dritte weitergeben oder verkaufen? → Falls ja, die Opt-out-Verfahren nach APPI Artikel 27 befolgen oder Einwilligung einholen.
Sind die Daten urheberrechtlich geschützt? → Wenn Sie für die Informationsanalyse scrapen (nicht zur Neuveröffentlichung kreativer Inhalte), gilt Artikel 30-4 wahrscheinlich.
Wird Ihre Scraping-Aktivität das Originalwerk ersetzen? → Falls ja, greift der Schutz durch Artikel 30-4 wahrscheinlich nicht.
Umgehen Sie Authentifizierung, CAPTCHA oder Zugriffskontrollen? → Falls ja, hohes UCAL-Risiko — nicht ohne juristischen Rat fortfahren.
Droht Ihr Scraping-Volumen den Server zu überlasten? → Falls ja, Anfragen drosseln, Pausen einbauen, verteiltes Scraping nutzen.
Behandelt das Unternehmen die Zieldatenmenge als Geschäftsgeheimnis? → Handelt es sich um nicht öffentliche proprietäre Daten, kann UCPA greifen.

Lautet jede Antwort auf öffentlich, faktisch, nicht personenbezogen, rate-limited und nicht zur Neuveröffentlichung gedacht — dann stehen die Chancen gut. Jede rote Flagge sollte vor dem Start eine rechtliche Prüfung auslösen.

ig_0a3cda0b72101bd40169f1b4db54888191a61af73340d78e18_compressed.webp

Wie Thunderbit Ihnen hilft, japanische Websites rechtskonform zu scrapen

Ich will ehrlich sein: Thunderbit ist ein Tool, keine Rechtsberatung. Aber es ist so angelegt, dass es zu den oben beschriebenen Compliance-Prinzipien passt.

AI Suggest Fields: Thunderbits KI liest die Seite und schlägt genau vor, welche Datenfelder sich extrahieren lassen. So definieren Sie bewusst nur die nicht personenbezogenen Felder, die Sie benötigen — und drosseln die unnötige Erhebung personenbezogener Daten von vornherein.
Cloud Scraping: Verteilt Anfragen über mehrere Server und streut so die Last natürlich, sodass das Risiko sinkt, einen einzelnen japanischen Server zu überlasten. (Man kann es als eingebaute Rate-Limit-Freundlichkeit verstehen.)
Kostenlose E-Mail- und Telefon-Extraktoren: Wenn Sie Kontaktinformationen von japanischen Websites wirklich erfassen müssen, bieten Thunderbits E-Mail-Extraktor und Telefon-Extraktor eine Extraktion per Klick. Kombinieren Sie das aber mit den obigen APPI-Hinweisen — wer personenbezogene Daten erhebt, muss seine Compliance-Pflichten kennen.
Export nach Excel, Google Sheets, Airtable oder Notion: Gescrapte Daten lassen sich sofort strukturieren und für Analysen exportieren, was den von Artikel 30-4 geschützten Zweck der „Informationsanalyse“ unterstützt.
Keine Wartung nötig: Thunderbits KI liest die Website bei jedem Lauf neu und stellt sich auf Layoutänderungen ein. Heißt: keine kaputten Scraper, die mit wiederholt fehlschlagenden Anfragen einen Server belasten — eine praktische Möglichkeit, genau die Serverlastprobleme zu vermeiden, die den Okazaki-Library-Vorfall auslösten.

Eine praktische Anleitung, wie Sie Thunderbit einsetzen, finden Sie auf unserem YouTube-Kanal oder im Schnellstart-Leitfaden. Sie können es kostenlos über die Chrome-Erweiterung ausprobieren.

Thunderbit für das Web-Scraping in Japan testen

Praktische Anwendungsbeispiele

Anwendungsfall	Empfohlene Felder zum Extrahieren	Rechtliche Begründung
Preisbeobachtung im japanischen E-Commerce	Produktname, angezeigter Preis, Verfügbarkeit, Verkäufer, SKU, URL, Zeitstempel	Faktische Geschäftsdaten; Artikel 30-4 Informationsanalyse; keine Produktbilder oder Bewertungen zur Neuveröffentlichung kopieren
Marktanalyse im japanischen Immobilienbereich	Angebotspreis, Lage, Wohnfläche, Gebäudealter, Immobilientyp, nächste Station, URL, Zeitstempel	Unterstützt aggregierte Marktanalysen; Namen von Maklern, Telefonnummern und Eigentümern ausschließen, sofern keine APPI-Compliance vorliegt
Monitoring von B2B-Abläufen	Firmenname, Niederlassungsadresse, allgemeine Firmen-E-Mail, Öffnungszeiten, Dienstleistungskategorie	Geringeres APPI-Risiko, sofern keine lebende Person identifiziert wird; Nutzungsbedingungen und Rate Limits prüfen

Wichtige Erkenntnisse zur Legalität von Web-Scraping in Japan

Web-Scraping ist in Japan in den meisten Fällen legal — vor allem dann, wenn Sie öffentlich verfügbare, nicht personenbezogene, faktische Daten zu Analysezwecken scrapen. Doch „in den meisten Fällen“ heißt eben nicht „in allen Fällen“.

Urheberrechtsgesetz (Artikel 30-4): Analytisches Scraping öffentlicher Daten ist erlaubt; kreative Inhalte neu zu veröffentlichen nicht.
UCAL: Umgehen Sie keine Authentifizierung oder Zugriffskontrollen.
APPI: Gehen Sie mit personenbezogenen Daten sorgsam um, besonders bei grenzüberschreitenden Übermittlungen und Weitergaben an Dritte.
UCPA: Öffentliche Daten sind in der Regel kein Geschäftsgeheimnis; abgeschottete oder kostenpflichtige Daten bergen mehr Risiko.
Strafgesetzbuch: Bringen Sie den Server nicht zum Absturz.

Nutzen Sie die 10-Schritte-Checkliste, bevor Sie ein Scraping-Projekt starten. Im Zweifel holen Sie juristischen Rat ein — gerade bei Projekten mit personenbezogenen Daten oder zugriffsbeschränkten Inhalten.

Wenn Sie bereit sind, japanische Websites rechtskonform zu scrapen: Thunderbit wurde so gebaut, dass der Prozess auch für nicht-technische Nutzer unkompliziert bleibt. Definieren Sie Ihre Felder, extrahieren Sie die Daten, exportieren Sie in Ihr bevorzugtes Tool und widmen Sie sich der Analyse.

KI-Web-Scraper für japanische Websites testen Get Started Free

FAQs

Ist es legal, öffentliche Websites in Japan zu scrapen?

Im Allgemeinen ja. Das Scraping öffentlich verfügbarer Daten zu Analysezwecken ist nach Japans Urheberrechtsgesetz Artikel 30-4 normalerweise legal, sofern Sie den Server nicht überlasten, keine Zugriffskontrollen umgehen, keine personenbezogenen Daten ohne APPI-Compliance erheben und keine urheberrechtlich geschützten Ausdrucksformen neu veröffentlichen. Entscheidend ist der Zweck: Analyse, nicht Neuveröffentlichung.

Kann ich personenbezogene Daten (E-Mails, Telefonnummern) von japanischen Websites scrapen?

Ja, aber APPI gilt. Sie brauchen einen rechtmäßigen Zweck, müssen offenlegen, wie Sie die Daten verwenden, und unterliegen Einschränkungen bei grenzüberschreitenden Übermittlungen und der Weitergabe an Dritte. Die Änderungen von 2022 haben diese Regeln erheblich verschärft — insbesondere für Daten, die Japan verlassen oder an andere Unternehmen weitergegeben werden.

Was passiert, wenn die Nutzungsbedingungen einer japanischen Website Scraping verbieten?

Ein Verstoß gegen die Nutzungsbedingungen ist eine Vertragsfrage (mögliche zivilrechtliche Haftung für Schadensersatz oder Unterlassung), kein Straftatbestand. Er kann jedoch breitere rechtliche Ansprüche stützen und die Durchsetzung verschärfen. Lesen Sie die Nutzungsbedingungen immer vor dem Scraping und prüfen Sie, ob die Daten auf anderem Weg verfügbar sind.

Ist Scraping hinter einer Login-Schranke in Japan legal?

Die Nutzung eigener Zugangsdaten ist eine Grauzone — UCAL greift möglicherweise nicht direkt, aber Verstöße gegen die Nutzungsbedingungen und Vertragsrisiken bleiben. Das Umgehen von Authentifizierung, die Nutzung fremder Zugangsdaten oder das Aushebeln von Zugriffskontrollen ist wahrscheinlich ein strafbarer Verstoß gegen das Gesetz zum unbefugten Computerzugriff, mit Strafen von bis zu 3 Jahren Freiheitsstrafe oder ¥1.000.000.

Kann ich Daten verkaufen, die ich von japanischen Websites gescrapt habe?

Enthalten die Daten personenbezogene Informationen, müssen Sie das Opt-out-System der Weitergabe an Dritte nach APPI Artikel 27 befolgen — samt formeller PPC-Meldung, individueller Benachrichtigung und Opt-out-Mechanismen. Der Verkauf personenbezogener Daten ohne ordnungsgemäße Verfahren ist ein Compliance-Verstoß. Bei nicht-personenbezogenen faktischen Aggregationen fällt das APPI-Risiko geringer aus, doch Urheberrecht, UCPA, AGB und rechtliche Auswirkungen von Web-Scraping gelten weiterhin.

Mehr erfahren

Daten mit KI extrahieren

Daten einfach zu Google Sheets, Airtable oder Notion übertragen

Chrome Store Rating

PRODUCT HUNT#1 Product of the Week