Fünf japanische Gesetze regeln Web-Scraping. Keines von ihnen verwendet tatsächlich den Begriff „Web-Scraping“.
Wenn Sie schon einmal herauszufinden versucht haben, ob Ihr Scraping-Projekt in Japan legal ist, sind Sie vermutlich auf eine Wand aus vagen Forenbeiträgen, auf KI-Training fokussierten Artikeln und widersprüchlichen Ratschlägen gestoßen. Ich habe Wochen damit verbracht, offizielle japanische Gesetze, behördliche Leitlinien, Durchsetzungsdaten und juristische Kommentare zu durchforsten, um den klarsten Leitfaden auf Englisch zusammenzustellen, den ich konnte.
Ganz gleich, ob Sie die Preise von Wettbewerbern auf Rakuten überwachen, Immobiliendaten für Marktanalysen ziehen oder eine B2B-Leads-Liste aufbauen: Dieser Artikel führt Sie durch jedes relevante Gesetz — mit praktischen Tabellen, realen Szenarien und einer 10-Schritte-Checkliste zur Compliance, die Sie vor dem Extrahieren von Daten nutzen können.
Was bedeutet „Ist Web-Scraping in Japan legal“ eigentlich?
Web-Scraping — also der Einsatz von Software, um automatisch Daten von Websites zu ziehen — wird in keinem einzelnen japanischen Gesetz ausdrücklich behandelt. Kein Gesetz sagt: „Scraping ist legal“ oder „Scraping ist illegal“. Ob Ihr Vorhaben rechtmäßig ist, hängt von drei Dingen ab: was Sie scrapen, wie Sie darauf zugreifen und was Sie danach mit den Daten tun.
Fünf Gesetze bilden den rechtlichen Rahmen:
| Gesetz | Was es für Scraper abdeckt |
|---|---|
| Urheberrechtsgesetz (Gesetz Nr. 48 von 1970) | Schützt kreative Werke, Bilder, Texte und Datenbankstrukturen. Artikel 30-4 enthält eine breite Ausnahme für Datenanalyse. |
| APPI (Gesetz zum Schutz personenbezogener Daten, Gesetz Nr. 57 von 2003) | Regelt Erhebung, Nutzung, Weitergabe und grenzüberschreitende Übermittlung personenbezogener Daten lebender Personen. |
| UCAL (Gesetz zum Verbot unbefugten Computerzugriffs, Gesetz Nr. 128 von 1999) | Stellt das Umgehen von Authentifizierung und Zugriffskontrollen unter Strafe — Japans Anti-Hacking-Gesetz. |
| UCPA (Gesetz zur Verhinderung unlauterer Wettbewerbspraktiken, Gesetz Nr. 47 von 1993) | Schützt Geschäftsgeheimnisse und „geteilte Daten mit eingeschränktem Zugriff“ vor unrechtmäßiger Erlangung. |
| Strafgesetzbuch (Gesetz Nr. 45 von 1907) | Die Artikel 233, 234 und 234-2 können greifen, wenn Scraping den Betrieb einer Website stört. |
Der Rest dieses Artikels erklärt jedes Gesetz mit praxisnahen Beispielen und Risikobewertungen. Möchten Sie direkt zu den To-dos springen? Dann gehen Sie zur .
Japans Urheberrechtsgesetz und Artikel 30-4: die Ausnahme für Informationsanalyse
Japans Urheberrechtsgesetz schützt kreative Werke: Artikel, Fotos, Produktbeschreibungen, Datenbankstrukturen mit kreativer Anordnung. Wenn ein Scraper eine Webseite herunterlädt, „vervielfältigt“ er diesen Inhalt technisch gesehen gemäß — dem ausschließlichen Vervielfältigungsrecht des Urhebers.
Aber hier hebt sich Japan ab.
2018 verabschiedete Japan eine weitreichende Änderung (in Kraft seit dem 1. Januar 2019), die einführte — eine flexible urheberrechtliche Ausnahme, die den Großteil des analytischen Web-Scrapings legal macht. Die bezeichnet sie als eines der weltweit permissivsten Systeme für Datenanalyse und KI-Entwicklung.
Die meisten englischsprachigen Artikel stellen Artikel 30-4 so dar, als sei er nur für KI-Training relevant. Das ist zu eng gefasst. Das Gesetz deckt ausdrücklich „Informationsanalyse“ ab — also Extraktion, Vergleich, Klassifizierung und andere statistische Datenanalysen. Anders gesagt: genau das, was Business-Scraper täglich tun.
Was Artikel 30-4 tatsächlich sagt (in einfachem Englisch)
Artikel 30-4 erlaubt die Nutzung eines urheberrechtlich geschützten Werks, „wenn der Zweck nicht darin besteht, die in dem Werk zum Ausdruck gebrachten Gedanken oder Gefühle persönlich zu genießen oder eine andere Person dazu zu veranlassen“. In der Praxis müssen zwei Bedingungen erfüllt sein:
-
Der „Genuss“-Test. Wenn Sie Faktendaten extrahieren — Preise, Daten, Quadratmeter, Lagerbestände — statt kreative Inhalte zu konsumieren oder neu zu veröffentlichen, sind Sie auf der sicheren Seite. Die bestätigen, dass nicht-genießende Nutzungen Datenanalyse, Klassifizierung und Indexierung umfassen.
-
Der „unzumutbare Schaden“-Test. Ihr Scraping darf das Originalwerk nicht ersetzen oder den Markt des Rechteinhabers untergraben. Eine kostenpflichtige, analysierbare Datensatzquelle zu scrapen, um sie nicht kaufen zu müssen, kann diesen Test etwa nicht bestehen — selbst wenn Ihr Zweck analytisch ist.

Reale Scraping-Szenarien unter Artikel 30-4
Hier zeigt sich, wie das Gesetz in der Praxis wirkt. Es gilt weit über KI-Training hinaus:
| Anwendungsfall | Gilt Artikel 30-4? | Warum |
|---|---|---|
| Immobilienangebote für Marktpreisanalysen scrapen | ✅ Ja | Angebotspreis, Fläche und Gebäudealter sind faktische Eingaben für Informationsanalyse, nicht für den Genuss des Ausdrucks |
| Börsendaten von Börsenseiten scrapen | ✅ Ja | Zweck der statistischen Analyse |
| Produktbilder für eine konkurrierende E-Commerce-Website scrapen | ❌ Nein | Ausnutzung des expressiven Inhalts selbst |
| Nachrichtenartikel scrapen, um sie erneut zu veröffentlichen | ❌ Nein | Ersetzt das Originalwerk |
| Produktbeschreibungen für Preisbeobachtung scrapen | ✅ Wahrscheinlich ja | Extraktion faktischer Daten, nicht Genuss des Ausdrucks |
| Ein RAG-System auf Basis gescrapter Dokumente aufbauen | ⚠️ Gemischt | Vektorisierung kann nicht-genießend sein, aber die Ausgabe geschützter Passagen erfordert weitere Prüfung |
Noch eine Nuance: Artikel 47-5 bietet einen engeren Schutz für „geringfügige Verwertung“, die als Nebenfolge computergestützter Informationsverarbeitung anfällt — etwa kurze Snippets oder Thumbnails in Suchergebnissen. Das ist nicht der zentrale sichere Hafen fürs Scraping, kann aber notwendige Vorbereitungskopien für Such- oder Analyse-Dienste stützen. Der bewertet „geringfügig“ nach Anteil, Menge und Darstellungsgenauigkeit.
Die Quintessenz: Wenn Sie Fakten zur Analyse extrahieren statt kreative Inhalte neu zu veröffentlichen, ist das japanische Urheberrecht auf Ihrer Seite.
Japans Gesetz zum unbefugten Computerzugriff (UCAL): Wann Scraping die Grenze überschreitet
Kaum ein englischsprachiger Scraping-Artikel erklärt dieses Gesetz. Es ist vermutlich die wichtigste klare Grenze im japanischen Recht.
Das (不正アクセス禁止法, Gesetz Nr. 128 von 1999) ist das funktionale Gegenstück zum US-CFAA in Japan. Es stellt den unbefugten Zugriff auf Computer unter Strafe, die durch Authentifizierungsmaßnahmen geschützt sind. Die Strafen nach können bis zu 3 Jahre Freiheitsstrafe oder eine Geldstrafe von bis zu ¥1.000.000 betragen.
UCAL verbietet nicht das Scraping öffentlicher Webseiten. Das Gesetz greift erst, wenn Sie Authentifizierung umgehen oder aushebeln — Login-Schranken, Passwörter, Zugriffstokens oder ähnliche Kontrollen. Genau dieser Unterschied ist entscheidend.
UCAL-Risikostufen für gängige Scraping-Szenarien
| Szenario | UCAL-Risiko | Erläuterung |
|---|---|---|
| Öffentliche Produktlisten scrapen | ✅ Niedrig | Kein Umgehen von Authentifizierung beteiligt |
| Hinter einem Login mit eigenen Zugangsdaten scrapen | ⚠️ Mittel — abhängig von den AGB | UCAL greift möglicherweise nicht, wenn die Zugangsdaten Ihnen gehören, aber AGB- und Vertragsrisiken bleiben bestehen |
| Authentifizierung oder CAPTCHA umgehen, um auf Daten zuzugreifen | ❌ Hoch — wahrscheinlich Verstoß | Artikel 2(4)(ii) erfasst die Umgehung von Zugriffsbeschränkungen |
| Geschützte APIs ohne Autorisierung aufrufen | ❌ Hoch — wahrscheinlich Verstoß | Authentifizierte oder nur für Partner zugängliche APIs fallen klar unter UCAL |
| Die Zugangsdaten oder Sitzungstokens einer anderen Person verwenden | ❌ Hoch — wahrscheinlich Verstoß | Artikel 2(4)(i) betrifft direkt die Nutzung des Identifikationscodes einer anderen Person |
Die japanische Nationale Polizeibehörde , ein Anstieg von 8,1 % gegenüber dem Vorjahr. Davon betrafen 511 Fälle (90,8 %) die unbefugte Nutzung des Identifikationscodes einer anderen Person. Der Schwerpunkt der Durchsetzung liegt also klar auf Missbrauch von Zugangsdaten, nicht auf gewöhnlichem öffentlichen Scraping.
Wie sich UCAL vom US-CFAA unterscheidet
UCAL ist in einem wichtigen Punkt enger gefasst als der CFAA. Es konzentriert sich speziell auf das Umgehen von Authentifizierung, während die Formulierung „exceeds authorized access“ im CFAA vor US-Gerichten seit Jahrzehnten diskutiert wird. Nach der Entscheidung des US Supreme Court in führt ein bloßer Verstoß gegen die Nutzungsbedingungen einer Website weniger wahrscheinlich zu einer strafrechtlichen Haftung nach dem CFAA. Japan kommt zu einem ähnlichen praktischen Ergebnis: Verstöße gegen AGB sind eine Vertragsfrage, keine strafrechtliche UCAL-Frage — außer es gibt ein eigenständiges Element der Zugriffskontrolle.
APPI-Änderungen 2022: Was Scraper über personenbezogene Daten wissen müssen
Japans (APPI) ist das zentrale Datenschutzgesetz des Landes — und die haben die Regeln deutlich verschärft. Wenn Sie Namen, E-Mail-Adressen, Telefonnummern oder andere Daten scrapen, die eine lebende Person auf japanischen Websites identifizieren, gilt APPI.
Die praktische Frage lautet: Wann löst Scraping APPI-Compliance aus?
Was unter APPI als „personenbezogene Daten“ gilt
APPI definiert personenbezogene Daten als Daten, die eine bestimmte lebende Person identifizieren können — auch durch einfache Verknüpfung mit anderen Informationen. Die bestätigen, dass eine geschäftliche E-Mail wie vorname.nachname@firma.jp personenbezogene Daten sein kann, wenn sie eine bestimmte Person identifiziert, und dass Cookie-IDs zu personenbezogenen Daten werden, wenn sie mit anderen identifizierenden Informationen kombiniert werden.
Die Änderungen von 2022 führten eine neue Kategorie ein: „personenbezogene Informationen mit Personenbezug“ — also Daten, die eine Person nicht direkt identifizieren, dies aber in Kombination mit anderen Daten könnten (Cookie-IDs, Browserverlauf, Kaufhistorie). Warum das für Scraping wichtig ist: Daten, die für den Scraper anonym wirken, können auf der Empfängerseite durch Zusammenführung mit CRM- oder Adtech-Daten identifizierbar werden.
Einschränkungen bei grenzüberschreitender Übermittlung
Wenn Sie japanische Websites von außerhalb Japans scrapen und dabei personenbezogene Daten erfassen, verlangt APPI eine Prüfung, bevor diese Daten ins Ausland übermittelt werden. Die beschreibt drei gängige Wege: Der Empfänger befindet sich in einem von der PPC als gleichwertig anerkannten Land, der Empfänger hat gleichwertige Schutzmaßnahmen etabliert, oder eine Ausnahme nach Artikel 27 Absatz 1 greift.
Wenn ein US-, EU- oder singapurisches Unternehmen personenbezogene Daten von japanischen Websites scrapt und außerhalb Japans speichert, ist eine Prüfung der Auslandsübermittlung nach APPI erforderlich. Das überrascht viele internationale Teams.
Die Opt-out-Regelung für Weitergabe an Dritte (Artikel 27)
Die häufigste Forenfrage, die ich sehe: „Was passiert, wenn ich gescrapte Daten von japanischen Websites teile oder verkaufe?“
APPI verlangt grundsätzlich die vorherige Zustimmung, bevor personenbezogene Daten an Dritte weitergegeben werden. Es gibt einen formellen Opt-out-Mechanismus — aber dafür sind eine Meldung bei der , die Benachrichtigung der betroffenen Personen und eine Möglichkeit zum Widerspruch gegen die Weitergabe an Dritte erforderlich. Die Änderungen von 2022 haben dies weiter eingegrenzt: Ein Opt-out darf nicht für personenbezogene Daten verwendet werden, die durch unrechtmäßige Mittel erlangt wurden oder die von einem anderen Unternehmen über ein Opt-out-Verfahren empfangen wurden.
Der zeigt 405 insgesamt akzeptierte Opt-out-Meldungen seit Oktober 2021, darunter 93 im Geschäftsjahr 2024. Das System existiert, ist aber formell, nicht locker gehandhabt.
Wann Scraping nicht unter APPI fällt
APPI gilt nicht für Daten, die keine lebende Person identifizieren können. Felder mit geringerem APPI-Risiko sind unter anderem:
- Produktpreise, SKUs, Lagerbestände und Versandkosten
- Öffnungszeiten von Geschäften und allgemeine Firmenkontaktinformationen (info@company.jp)
- Immobilienpreis, Fläche, Gebäudealter und Entfernung zur Station — sofern sie nicht mit namentlich genannten Eigentümern oder Maklern verknüpft sind
- Aggregierte Marktstatistiken, bei denen individuelle Zuordnungen entfernt wurden
Ein praktischer Design-Ansatz, den man erwähnen sollte: Die Funktion „AI Suggest Fields“ ermöglicht es Nutzern, genau festzulegen, welche Datenfelder extrahiert werden sollen. Sie können bewusst personenbezogene Felder ausschließen und sich nur auf die geschäftlichen Fakten konzentrieren, die Sie brauchen — und so das APPI-Risiko durch Design statt durch Zufall reduzieren.
Gesetz zur Verhinderung unlauteren Wettbewerbs (UCPA): Scraping von Wettbewerbsdaten

Das wird relevant, wenn Scraping von öffentlichen Fakten in vertrauliche Geschäftsinformationen oder geschützte Datensätze übergeht.
UCPA definiert ein Geschäftsgeheimnis als Information, die (1) als geheim verwaltet wird, (2) für das Geschäft nützlich ist und (3) nicht öffentlich bekannt ist. diese drei Anforderungen als Voraussetzungen für den Schutz von Geschäftsgeheimnissen zusammen.
Öffentliche Website-Fakten — Produktpreise, Standorte von Filialen, Stellenausschreibungen, Produktkataloge — sind in der Regel keine Geschäftsgeheimnisse, weil sie nicht geheim und öffentlich bekannt sind. Das Scrapen solcher Informationen verstößt typischerweise nicht gegen UCPA.
Wann UCPA beim Scraping greifen könnte
| Szenario | UCPA-Risiko | Warum |
|---|---|---|
| Produktkatalog eines Wettbewerbers für Preisbeobachtung scrapen | Meist niedrig | Öffentliche Katalogfakten sind in der Regel nicht geheim |
| Interne Preisdaten durch Ausnutzen einer API-Schwachstelle scrapen | Hoch | Nicht öffentliche, nützliche Geschäftsinformationen, unrechtmäßig erlangt |
| Kostenpflichtige Partnerdatenbank oder lizenzierte API außerhalb des Nutzungsumfangs scrapen | Hoch | Die UCPA-Änderungen von 2018 schützen „geteilte Daten mit eingeschränktem Zugriff“ |
| Gescrapte Daten nutzen, um ein konkurrierendes Produkt zu bauen, das von einer teuren Datenbank profitiert | Grauzone | Gerichte können Zugriffsbeschränkungen, Investitionen und Substitution bewerten |
Die UCPA-Änderung von 2018 führte Schutz für „geteilte Daten mit eingeschränktem Zugriff“ ein — technische oder geschäftliche Informationen, die in erheblichem Umfang gesammelt, elektronisch verwaltet und regelmäßig bestimmten Personen bereitgestellt werden. UCPA schließt jedoch Daten aus, die im Wesentlichen mit Informationen identisch sind, die unentgeltlich öffentlich zugänglich gemacht wurden. Eine kostenlose öffentliche Produktliste ist also etwas anderes als ein nur für Mitglieder zugänglicher kommerzieller Datensatz.
Serverüberlastung und Japans Strafgesetzbuch: Bringen Sie die Website nicht zum Absturz
Die Daten selbst können völlig legal zu erheben sein. Aber wie Sie scrapen, kann strafrechtliche Risiken erzeugen. Japans enthält Bestimmungen zur Geschäftsbehinderung, die greifen, wenn automatisierter Zugriff eine Website oder ein Geschäftssystem stört.
| Artikel des Strafgesetzbuchs | Verhalten | Strafe |
|---|---|---|
| Artikel 233 | Behinderung des Geschäfts durch betrügerische Mittel | Bis zu 3 Jahre oder ¥500.000 |
| Artikel 234 | Gewaltförmige Behinderung des Geschäfts | Gleich wie Artikel 233 |
| Artikel 234-2 | Behinderung durch Beschädigung/Störung eines Computers | Bis zu 5 Jahre oder ¥1.000.000 |
Jede japanische Scraping-Diskussion landet irgendwann beim Vorfall der Zentralbibliothek der Stadt Okazaki (~2010). Ein Softwareingenieur von der Website der Bibliothek und erzeugte über zwei Wochen hinweg etwa 33.000 automatisierte Zugriffe. Der Server der Bibliothek wurde schwer nutzbar, und die Polizei nahm den Nutzer wegen des Verdachts auf Geschäftsbehinderung fest. Das Verfahren endete ohne Sachurteil, bleibt aber eine eindrückliche Erinnerung daran, dass die Belastung des Servers zählt — selbst wenn die Daten selbst öffentlich sind.
Etwas Kontext dafür, warum Website-Betreiber eskalieren: 2024 machten automatisierte Bots 51 % des Web-Traffics aus, davon 37 % schlechte Bots. , dass Bots 42 % des gesamten Web-Traffics ausmachten, wobei besonders der E-Commerce betroffen war.
So vermeiden Sie Probleme mit Serverüberlastung
- robots.txt respektieren (auch wenn es kein Gesetz ist, zeigt es die Absicht des Betreibers)
- Pausen zwischen Anfragen einbauen und die Parallelität begrenzen
- Spitzenzeiten der Zielseite vermeiden
- Verkehr stoppen oder reduzieren, wenn Sie Fehler, Sperren oder Rate-Limit-Antworten sehen
- Bereits abgerufene Seiten cachen, statt dieselben URLs immer wieder aufzurufen
Die Cloud-Scraping-Funktion von Thunderbit verteilt Anfragen auf mehrere Server und streut dadurch die Last natürlich, wodurch das Risiko sinkt, einen einzelnen Zielserver zu überlasten. Das ist kein rechtlicher Schutzschild, aber eine praktische Designentscheidung, die verantwortungsvolles Scraping unterstützt.
Verstöße gegen die Nutzungsbedingungen: Vertragsrisiko, kein Strafrisiko
Viele japanische Websites enthalten Nutzungsbedingungen, die Scraping oder automatisierte Datenerhebung verbieten. Nach japanischem Recht ist ein Verstoß gegen die Nutzungsbedingungen eine Vertragsfrage — kein Straftatbestand.
erklären, dass Website-Bedingungen verbindlich sind, wenn sie ordnungsgemäß in den Vertrag einbezogen werden. Click-Wrap-Vereinbarungen (bei denen Sie auf „Agree“ klicken müssen) sind am stärksten. Bedingungen, die in schwer auffindbaren Footer-Links versteckt sind, sind schwächer.
| AGB-Design | Durchsetzbarkeitssignal |
|---|---|
| Klarer Click-Wrap mit erforderlichem „Agree“-Button | Am stärksten |
| Bedingungen nahe der Transaktion verlinkt, aber ohne „Agree“-Klick | Unsicherer |
| Bedingungen im Footer oder an schwer auffindbarer Stelle versteckt | Schwächer |
| Kein Vertragsverhältnis mit dem Betreiber | Vertragsanspruch möglicherweise schwach |
Es wurde keine belastbare Quelle gefunden, die zeigt, dass ein bloßer AGB-Verstoß ohne weitere Umstände zu einer japanischen Strafverfolgung führt. Die praktische Sicht ist: Ein Verstoß gegen die Nutzungsbedingungen kann zivilrechtliche Vertragsrisiken schaffen (Schadensersatz, Unterlassung), aber strafrechtliche Risiken erfordern normalerweise ein eigenständiges Element — Umgehung von Zugriffskontrollen nach UCAL, Geschäftsbehinderung nach dem Strafgesetzbuch oder Urheberrechtsverletzung.
Mein Rat: Lesen Sie die Nutzungsbedingungen, bevor Sie irgendeine japanische Website scrapen. Wenn Scraping dort ausdrücklich verboten ist, suchen Sie nach Alternativen — einer API, einer Datenpartnerschaft oder einer anderen Quelle für dieselben Informationen.
Japan vs. USA vs. EU: Wie sich die Web-Scraping-Gesetze vergleichen
Wenn Sie aus einem US- oder EU-Rechtsumfeld kommen, hilft Ihnen diese Tabelle bei der Einordnung. Japans Rahmen ist in manchen Bereichen freizügiger und in anderen restriktiver.
| Rechtliche Dimension | Japan | Vereinigte Staaten | EU |
|---|---|---|---|
| Zentrales Scraping-Gesetz | Kein Einzelgesetz; Flickenteppich aus Urheberrechtsgesetz, APPI, UCPA, UCAL, Strafgesetzbuch | CFAA, einzelstaatliche Gesetze | DSGVO, Datenbankrichtlinie, DSM-Richtlinie |
| Urheberrechtliche Ausnahme für Datenanalyse | Artikel 30-4 (breit) | Fair Use (je nach Einzelfall) | TDM-Ausnahme (Artikel 3–4, DSM-Richtlinie) — mit Opt-out für kommerzielles TDM |
| Scraping personenbezogener Daten | APPI — Opt-out für Weitergabe an Dritte (Art. 27) | Je nach Bundesstaat unterschiedlich (CCPA usw.) | DSGVO — strenge Einwilligung/berechtigtes Interesse |
| Umgehung von Zugriffskontrollen | UCAL — Straftat | CFAA — straf- und zivilrechtlich | Je nach Mitgliedstaat unterschiedlich |
| AGB-Verstoß = illegal? | Nur Vertragsrecht; keine strafrechtliche Haftung festgestellt | CFAA nach Van Buren: wahrscheinlich nein | Je nach Lage; DSGVO kann trotzdem gelten |
| Risiko durch Serverüberlastung | Strafgesetzbuch Art. 233, 234-2 (Geschäftsbehinderung) | CFAA + deliktische Störung | Unterschiedlich |
Zentrale Erkenntnisse aus dem Vergleich
Japans Artikel 30-4 ist breiter als US Fair Use oder die EU-TDM-Ausnahmen — damit gehört Japan aus urheberrechtlicher Sicht zu den freizügigeren Ländern für analytisches Scraping. UCAL ist enger gefasst als der CFAA, weil es sich rein auf das Umgehen von Authentifizierung konzentriert. APPI ist bei grenzüberschreitenden Übermittlungen strenger als die fragmentierten US-Datenschutzregime, aber in manchen operativen Details weniger detailliert als die DSGVO.
Für internationale Teams heißt das: Sie haben möglicherweise mehr Freiheit, öffentliche japanische Daten für Analysen zu scrapen, als Sie denken. Die eigentliche Komplexität liegt beim Umgang mit personenbezogenen Daten — insbesondere bei grenzüberschreitenden Übermittlungen und Weitergaben an Dritte.
Ihre 10-Schritte-Checkliste für das Scraping japanischer Websites
Bevor Sie mit dem Scraping irgendeiner japanischen Website beginnen, gehen Sie diese zehn Ja/Nein-Fragen durch. Jede bezieht sich auf eines der fünf oben genannten Gesetze.
- Sind die Daten öffentlich zugänglich? (Kein Login, keine Paywall, kein Umgehen von Zugriffskontrollen) → Wenn ja, ist das UCAL-Risiko niedrig.
- Verbieten die Nutzungsbedingungen der Website Scraping? → Wenn ja, Vertragsrisiko bewerten; alternative Datenquellen in Betracht ziehen.
- Erheben Sie personenbezogene Daten im Sinne von APPI? (Namen, E-Mails, Telefonnummern, IDs) → Wenn ja, APPI-Compliance sicherstellen.
- Werden Sie gescrapte personenbezogene Daten außerhalb Japans übertragen? → Wenn ja, die Regeln von APPI Artikel 28 zur grenzüberschreitenden Übermittlung einhalten.
- Planen Sie, gescrapte Daten an Dritte weiterzugeben oder zu verkaufen? → Wenn ja, die Opt-out-Verfahren nach APPI Artikel 27 befolgen oder Einwilligung einholen.
- Sind die Daten urheberrechtlich geschützt? → Wenn Sie für Informationsanalyse scrapen (nicht zur Neuveröffentlichung kreativer Inhalte), gilt Artikel 30-4 wahrscheinlich.
- Wird Ihre Scraping-Aktivität das Originalwerk ersetzen? → Wenn ja, gilt der Schutz durch Artikel 30-4 wahrscheinlich nicht.
- Umgehen Sie Authentifizierung, CAPTCHA oder Zugriffskontrollen? → Wenn ja, hohes UCAL-Risiko — nicht ohne juristischen Rat fortfahren.
- Besteht durch Ihr Scraping-Volumen die Gefahr, den Server zu überlasten? → Wenn ja, Anfragen drosseln, Pausen einbauen, verteiltes Scraping nutzen.
- Wird die Zieldatenmenge vom Unternehmen als Geschäftsgeheimnis behandelt? → Wenn es sich um nicht öffentliche proprietäre Daten handelt, kann UCPA greifen.
Wenn jede Antwort auf öffentlich, faktisch, nicht personenbezogen, rate-limited und nicht zur Neuveröffentlichung gedacht ist — dann stehen die Chancen gut. Jede rote Flagge sollte vor dem Start eine rechtliche Prüfung auslösen.

Wie Thunderbit Ihnen hilft, japanische Websites rechtskonform zu scrapen
Ich möchte offen sein: Thunderbit ist ein Tool, keine Rechtsberatung. Aber es ist so konzipiert, dass es zu den oben beschriebenen Compliance-Prinzipien passt.
- AI Suggest Fields: Thunderbits KI liest die Seite und schlägt genau vor, welche Datenfelder extrahiert werden sollten. So können Sie bewusst nur die nicht personenbezogenen Felder definieren, die Sie benötigen — und unnötige Erhebung personenbezogener Daten von vornherein reduzieren.
- Cloud Scraping: Verteilt Anfragen über mehrere Server und streut so die Last natürlich, wodurch das Risiko sinkt, einen einzelnen japanischen Server zu überlasten. (Man kann es als integrierte Rate-Limit-Freundlichkeit verstehen.)
- Kostenlose E-Mail- und Telefon-Extraktoren: Wenn Sie Kontaktinformationen von japanischen Websites wirklich erfassen müssen, bieten und eine Extraktion mit einem Klick. Kombinieren Sie das aber mit den obigen APPI-Hinweisen — das Erheben personenbezogener Daten erfordert das Verständnis Ihrer Compliance-Pflichten.
- Export nach Excel, Google Sheets, Airtable oder Notion: Gescrapte Daten können sofort strukturiert und für Analysen exportiert werden, was den von Artikel 30-4 geschützten Zweck der „Informationsanalyse“ unterstützt.
- Keine Wartung erforderlich: Thunderbits KI liest die Website bei jedem Lauf neu und passt sich an Layoutänderungen an. Das bedeutet keine defekten Scraper, die wiederholt mit fehlgeschlagenen Anfragen einen Server belasten — eine praktische Möglichkeit, genau die Art von Serverlastproblemen zu vermeiden, die den Okazaki-Library-Vorfall auslösten.
Für eine praktische Anleitung, wie Sie Thunderbit einsetzen, besuchen Sie unseren oder den . Sie können es kostenlos über die ausprobieren.
Praktische Anwendungsbeispiele
| Anwendungsfall | Empfohlene Felder zum Extrahieren | Rechtliche Begründung |
|---|---|---|
| Preisbeobachtung im japanischen E-Commerce | Produktname, angezeigter Preis, Verfügbarkeit, Verkäufer, SKU, URL, Zeitstempel | Faktische Geschäftsdaten; Artikel 30-4 Informationsanalyse; keine Produktbilder oder Bewertungen zur Neuveröffentlichung kopieren |
| Marktanalyse im japanischen Immobilienbereich | Angebotspreis, Lage, Wohnfläche, Gebäudealter, Immobilientyp, nächste Station, URL, Zeitstempel | Unterstützt aggregierte Marktanalysen; Namen von Maklern, Telefonnummern und Eigentümern ausschließen, sofern keine APPI-Compliance vorliegt |
| Monitoring von B2B-Abläufen | Firmenname, Niederlassungsadresse, allgemeine Firmen-E-Mail, Öffnungszeiten, Dienstleistungskategorie | Geringeres APPI-Risiko, sofern keine lebende Person identifiziert wird; Nutzungsbedingungen und Rate Limits prüfen |
Wichtige Erkenntnisse zur Legalität von Web-Scraping in Japan
Web-Scraping ist in Japan in den meisten Fällen legal — besonders dann, wenn Sie öffentlich verfügbare, nicht personenbezogene, faktische Daten zu Analysezwecken scrapen. Aber „in den meisten Fällen“ heißt nicht „in allen Fällen“.
- Urheberrechtsgesetz (Artikel 30-4): Analytisches Scraping öffentlicher Daten ist erlaubt; kreative Inhalte neu zu veröffentlichen nicht.
- UCAL: Umgehen Sie keine Authentifizierung oder Zugriffskontrollen.
- APPI: Behandeln Sie personenbezogene Daten sorgfältig, besonders bei grenzüberschreitenden Übermittlungen und Weitergabe an Dritte.
- UCPA: Öffentliche Daten sind in der Regel kein Geschäftsgeheimnis; abgeschottete oder kostenpflichtige Daten bergen mehr Risiko.
- Strafgesetzbuch: Bringen Sie den Server nicht zum Absturz.
Nutzen Sie die 10-Schritte-Checkliste, bevor Sie irgendein Scraping-Projekt starten. Im Zweifel holen Sie juristischen Rat ein — besonders bei Projekten mit personenbezogenen Daten oder zugriffsbeschränkten Inhalten.
Wenn Sie bereit sind, japanische Websites rechtskonform zu scrapen, wurde so gebaut, dass der Prozess auch für nicht-technische Nutzer unkompliziert ist. Definieren Sie Ihre Felder, extrahieren Sie die Daten, exportieren Sie in Ihr bevorzugtes Tool und konzentrieren Sie sich auf die Analyse.
FAQs
Ist es legal, öffentliche Websites in Japan zu scrapen?
Im Allgemeinen ja. Das Scraping öffentlich verfügbarer Daten zu Analysezwecken ist nach Japans Urheberrechtsgesetz Artikel 30-4 normalerweise legal, sofern Sie den Server nicht überlasten, keine Zugriffskontrollen umgehen, keine personenbezogenen Daten ohne APPI-Compliance erheben und keine urheberrechtlich geschützten Ausdrucksformen neu veröffentlichen. Entscheidend ist der Zweck: Analyse, nicht Neuveröffentlichung.
Kann ich personenbezogene Daten (E-Mails, Telefonnummern) von japanischen Websites scrapen?
Ja, aber APPI gilt. Sie benötigen einen rechtmäßigen Zweck, müssen offenlegen, wie Sie die Daten verwenden, und unterliegen Einschränkungen bei grenzüberschreitenden Übermittlungen und der Weitergabe an Dritte. Die Änderungen von 2022 haben diese Regeln erheblich verschärft — insbesondere für Daten, die Japan verlassen oder an andere Unternehmen weitergegeben werden.
Was passiert, wenn die Nutzungsbedingungen einer japanischen Website Scraping verbieten?
Ein Verstoß gegen die Nutzungsbedingungen ist eine Vertragsfrage (mögliche zivilrechtliche Haftung für Schadensersatz oder Unterlassung), kein Straftatbestand. Er kann jedoch breitere rechtliche Ansprüche stützen und die Durchsetzung verschärfen. Lesen Sie die Nutzungsbedingungen immer vor dem Scraping und prüfen Sie, ob die Daten auf anderem Weg verfügbar sind.
Ist Scraping hinter einer Login-Schranke in Japan legal?
Die Nutzung eigener Zugangsdaten ist eine Grauzone — UCAL greift möglicherweise nicht direkt, aber Verstöße gegen die Nutzungsbedingungen und Vertragsrisiken bleiben bestehen. Das Umgehen von Authentifizierung, die Nutzung fremder Zugangsdaten oder das Aushebeln von Zugriffskontrollen ist wahrscheinlich ein strafbarer Verstoß gegen das Gesetz zum unbefugten Computerzugriff, mit Strafen von bis zu 3 Jahren Freiheitsstrafe oder ¥1.000.000.
Kann ich Daten verkaufen, die ich von japanischen Websites gescrapt habe?
Wenn die Daten personenbezogene Informationen enthalten, müssen Sie das Opt-out-System der Weitergabe an Dritte nach APPI Artikel 27 befolgen — einschließlich formeller PPC-Meldung, individueller Benachrichtigung und Opt-out-Mechanismen. Der Verkauf personenbezogener Daten ohne ordnungsgemäße Verfahren ist ein Compliance-Verstoß. Für nicht-personenbezogene faktische Aggregationen ist das APPI-Risiko geringer, aber Urheberrecht, UCPA, AGB und gelten weiterhin.
Mehr erfahren
