Web-Scraping in Großbritannien: Was riskant ist und wofür Sie verklagt werden könnten

„Wenn ich die Preise eines Wettbewerbers von einer öffentlichen Website scrape – kann ich dafür wirklich Ärger bekommen?“ Diese Frage stellt sich früher oder später jedes Vertriebsteam. Ein sauber in Reihen aufgelistetes Verzeichnis mit Lieferantenkontakten, am Ende soll bloß eine Tabelle herauskommen – und trotzdem das Zögern. Nachvollziehbar.

Im Vereinigten Königreich gibt es kein einzelnes „Web-Scraping-Gesetz“. Stattdessen entscheiden vier sich überschneidende Rechtsrahmen, ob ein Scraping-Vorgang rechtmäßig ist. Deshalb lautet die Antwort fast immer: „Es kommt darauf an“ – was aber niemanden lähmen muss. Dieser Leitfaden klärt, was das Recht tatsächlich sagt, wie es auf reale Szenarien wirkt, wie hoch die Strafen ausfallen und wie Sie rechtskonform bleiben.

In die Recherche dazu ist für unser Team bei Thunderbit viel Arbeit geflossen – die Ergebnisse teilen wir hier, damit Sie sie sich nicht aus fünf Kanzlei-Blogs und einem Reddit-Thread zusammensuchen müssen.

Thunderbit für Web-Scraping testen

Was ist Web-Scraping? Und warum nutzen britische Unternehmen es?

Web-Scraping bedeutet, mithilfe von Software automatisch Daten von Websites zu sammeln – also den mühsamen Weg zu ersetzen, Inhalte per Copy-Paste von Webseiten in eine Tabelle zu übertragen.

Die Technik selbst ist neutral. Sie ist weder grundsätzlich legal noch grundsätzlich illegal. Entscheidend ist, was Sie scrapen, wie Sie es scrapen und was Sie anschließend mit den Daten anfangen.

Britische Unternehmen nutzen Scraping für zahlreiche legitime Zwecke:

Preisvergleich: PreisSpy UK etwa aktualisiert Produktpreise drei- bis fünfmal täglich mithilfe automatisierten Web-Scrapings.
Lead-Generierung: Vertriebsteams ziehen Firmennamen, E-Mails und Telefonnummern aus öffentlichen Verzeichnissen.
Marktforschung: Analysten beobachten Immobilienangebote, Jobbörsen oder die Produktportfolios der Konkurrenz.
Akademische Forschung: Das Office for National Statistics erfasste zwischen 2014 und 2015 über 2,2 Millionen Preisangaben von Supermarkt-Websites.
Training von KI-Modellen: Ein rasant wachsender – und rechtlich noch ungeklärter – Anwendungsfall.

Der Trend ist unmissverständlich. Eine Bright Data/Vanson-Bourne-Umfrage unter 500 Entscheidungsträgern (davon 200 im Vereinigten Königreich) ergab, dass 89 % öffentliche Webdaten als entscheidend oder sehr wichtig für die globale Wirtschaft einstufen und 38 % sie mindestens täglich beziehen.

Zugleich gaben 73 % an, dass die fehlende klare Regulierung ihre Organisation beunruhige. Genau diese Unsicherheit ist der Anlass für diesen Artikel.

Ist Web-Scraping in Großbritannien legal? Die direkte Antwort

Kein britisches Gesetz verbietet Web-Scraping pauschal. Mehrere Gesetze regeln jedoch, wie es ablaufen darf, und ob ein konkretes Projekt rechtmäßig ist, hängt von vier Faktoren ab:

ig_010beacbdecb066e0169f1876f3d8c8191b68ddebcf937b561_compressed.webp

Welche Daten Sie scrapen (personenbezogene Daten vs. faktische/nicht personenbezogene Daten)
Wie Sie darauf zugreifen (öffentliche Seite vs. Umgehung von Login-Schranken oder CAPTCHAs)
Was die Nutzungsbedingungen der Website sagen (verbieten sie automatisierten Zugriff?)
Wie Sie die Daten danach verwenden (interne Analyse vs. kommerzieller Weiterverkauf)

Die treffendste Analogie: Web-Scraping ähnelt dem Fotografieren im öffentlichen Raum. Ein Foto in der Öffentlichkeit ist nicht automatisch illegal – doch bestimmte Motive, Orte, Methoden und Verwendungen schaffen rechtliche Risiken. Beim Scraping zählt die öffentliche Verfügbarkeit ebenso, ist aber nicht die ganze Geschichte.

Die jüngste GenAI-Konsultation des ICO gehört zu den klarsten offiziellen britischen Stellungnahmen zu gescrapten personenbezogenen Daten. Demnach bleiben berechtigte Interessen die einzige verfügbare rechtmäßige Grundlage, um generative KI-Modelle mit solchen Daten zu trainieren – aber nur, wenn der Entwickler einen strengen Dreistufentest besteht. Eine hohe Hürde, die zeigt, wie ernst britische Aufsichtsbehörden gescrapte Daten nehmen.

Die vier britischen Gesetze, die auf Web-Scraping anwendbar sind

Vier überlappende Perspektiven – jedes Scraping-Projekt kann eine, zwei oder alle vier davon berühren.

UK GDPR und der Data Protection Act 2018

Sobald Sie personenbezogene Daten scrapen – Namen, E-Mails, Telefonnummern, IP-Adressen, Social-Media-Profile –, greift die UK GDPR. „Öffentlich zugänglich“ ist eben nicht „frei verwendbar“.

Öffentlich sichtbare personenbezogene Daten bleiben personenbezogene Daten.

Die relevanteste rechtmäßige Grundlage für kommerzielles Scraping ist das berechtigte Interesse (Artikel 6) – doch darauf kann man sich nicht einfach berufen. Sie müssen:

einen konkreten, legitimen Zweck benennen
belegen, dass die Verarbeitung für diesen Zweck erforderlich ist
Ihr Interesse gegen die Rechte der Personen abwägen, deren Daten Sie erfassen

Die Antwort des ICO auf die GenAI-Konsultation ist besonders deutlich: Ein allgemeiner gesellschaftlicher Nutzen reicht nicht; Entwickler müssen belegen, warum Alternativen zum Scraping ungeeignet sind, und Transparenzmechanismen schaffen, mit denen Betroffene ihre Rechte verstehen und ausüben können. Quelle: ICO GenAI response.

Für die B2B-Lead-Generierung gilt dasselbe. Ein Vertriebsteam darf sich beim Erfassen öffentlich gelisteter Geschäftskontaktdaten auf berechtigte Interessen stützen, muss dieses Interesse aber dokumentieren, nur die nötigsten Felder erfassen, besondere Kategorien personenbezogener Daten meiden, möglichst Datenschutzinformationen bereitstellen und Widersprüche respektieren.

Urheberrecht, Datenbankrechte und die TDM-Ausnahme

Urheberrecht schützt originelle Website-Inhalte: Texte, Bilder, Produktbeschreibungen, Artikel. Reine Faktendaten wie Preise sind für sich genommen meist weniger urheberrechtlich heikel – wer jedoch geschützte Ausdrucksformen kopiert und erneut veröffentlicht, bewegt sich im Verletzungsbereich.

Datenbankrechte wiegen beim Scraping schwerer, als viele annehmen. Das Vereinigte Königreich hat nach dem Brexit die sui-generis-Datenbankrechte im EU-Stil beibehalten; das Entnehmen eines „wesentlichen Teils“ aus einer geschützten Datenbank – kuratierte Verzeichnisse, Produktkataloge, Marktplatz-Listings – kann eine Verletzung sein, selbst wenn einzelne Datenpunkte rein faktisch sind.

Die Ausnahme für Text- und Data-Mining (TDM) nach Section 29A CDPA erlaubt Kopien für Text- und Datenanalyse nur, wenn der Nutzer rechtmäßigen Zugang hat und der Zweck nicht-kommerzielle Forschung ist. Eng gefasst: Kommerzielles Scraping, kommerzielles KI-Training und der Weiterverkauf von Datensätzen fallen nicht darunter.

Die britische Regierung erwog, diese Ausnahme für KI-Training auszuweiten, entschied jedoch laut ihrem Bericht zu Copyright and AI vom März 2026, keine Reformen einzuführen, solange unklar ist, ob sie die Ziele für Urheber, KI-Entwickler und die britische Wirtschaft erfüllen. Aktuell ist für das Kopieren geschützter Werke zum KI-Training in der Regel eine Erlaubnis nötig, sofern keine Ausnahme greift.

Nutzungsbedingungen der Website und Vertragsrecht

Die meisten Websites haben Nutzungsbedingungen (Terms of Service, ToS), die automatisiertes Scraping verbieten oder einschränken. Schon beim Aufrufen der Website stimmen Sie diesen Bedingungen möglicherweise zu – besonders dann, wenn Sie eine Zustimmungsmaske anklicken (Clickwrap). Browsewrap-Vereinbarungen (Bedingungen hinter einem Footer-Link) hängen stärker vom Einzelfall ab, doch britische Gerichte haben gezeigt, dass sie ToS-Beschränkungen gegen Scraping durchsetzen können. Im Streit Ryanair gegen Billigfluege wertete das Gericht sichtbare Website-Bedingungen im Kontext von Screen Scraping als verbindlich.

robots.txt ist kein Gesetz, sondern ein maschinenlesbares Signal des Website-Betreibers. Eine typische Datei sieht so aus:

User-agent: *
Disallow: /account/
Disallow: /checkout/
Disallow: /private/
Crawl-delay: 10

Das Missachten von robots.txt macht Scraping nicht automatisch illegal, gilt vor Gericht und beim ICO aber als Hinweis auf die Absicht des Website-Betreibers. Wer robots.txt ignoriert, erhöht sein rechtliches Risiko – vor allem in Kombination mit einem ToS-Verstoß oder aggressiven Request-Mengen.

Der Computer Misuse Act 1990

Dieser Punkt raubt vielen den Schlaf – zu Recht, denn er begründet strafrechtliche Offenses. Section 1 betrifft unbefugten Zugriff auf Computermaterial (Höchststrafe: 2 Jahre Freiheitsstrafe). Section 3 betrifft unbefugte Handlungen, die den Betrieb eines Computers beeinträchtigen (Höchststrafe: 10 Jahre Freiheitsstrafe).

Das CMA-Risiko ist am geringsten, wenn die Daten wirklich öffentlich sind und der Scraper keine technischen Barrieren umgeht. Es steigt, sobald Sie:

Login-Schranken, CAPTCHAs oder IP-Sperren umgehen
gestohlene Zugangsdaten nutzen oder Fake-Accounts anlegen
Verkehrsvolumen erzeugen, das den Zielservice beeinträchtigt

Das Vereinigte Königreich kennt keine klare, US-artige Regel nach dem Motto „öffentliche Daten sind Freiwild“. Das macht britische Empfehlungen vorsichtiger: Öffentlicher Zugang senkt das CMA-Risiko deutlich, doch Website-Bedingungen, technische Kontrollen und das Wissen des Scrapers um bestehende Beschränkungen können weiterhin eine Rolle spielen.

„Darf ich das legal scrapen?“ – Ein kurzer Entscheidungs-Flowchart

Bevor Sie irgendetwas scrapen, gehen Sie diese fünf Entscheidungspunkte durch. Keine Rechtsberatung – nur ein 60-Sekunden-Risikoscreening.

Entscheidungspunkt	Wenn JA	Wenn NEIN
Sind die Daten personenbezogene Daten (Namen, E-Mails usw.)?	UK GDPR gilt. Rechtsgrundlage bestimmen, LIA durchführen, Felder minimieren, Transparenz planen.	Die DSGVO-Ebene greift möglicherweise nicht, aber andere Prüfungen fortsetzen.
Verbieten die ToS der Website Scraping ausdrücklich?	Vertragsverletzungsrisiko. API, Lizenz oder juristische Prüfung erwägen.	Geringeres Vertragsrisiko, aber robots.txt prüfen.
Wird ein wesentlicher Teil einer Datenbank extrahiert?	Sui-generis-Datenbankrecht wahrscheinlich verletzt. Lizenzierung oder engeres Extrahieren erwägen.	Urheberrecht kann dennoch für einzelne kopierte Inhalte gelten.
Werden Login, CAPTCHA oder Zugriffskontrollen umgangen?	Mögliche Straftat nach CMA 1990. Stoppen und rechtlich prüfen lassen.	Geringeres CMA-Risiko, wenn der Zugriff tatsächlich öffentlich ist.
Ist der Zweck nicht-kommerzielle Forschung?	Section-29A-TDM-Ausnahme kann greifen, wenn Sie rechtmäßigen Zugang haben.	Kein breiter britischer Safe Harbour für kommerzielles TDM. Vollständige IP- und Vertragsprüfung nötig.

Eine solche Übersicht hätte ich mir gewünscht, als wir für unser Team zum ersten Mal in die Recherche zur Scraping-Compliance eingestiegen sind. Sie macht aus juristischer Komplexität eine strukturierte Selbstprüfung, die Sie in unter einer Minute durchlaufen.

Reale Szenarien: Ist Ihr konkretes Scraping in Großbritannien legal?

Abstraktes Recht ist das eine. Was die Leute wirklich wissen wollen: „Bringt mein konkretes Projekt mir Ärger?“

Verständlich. Hier sind fünf typische britische Scraping-Anwendungsfälle mit kurzer rechtlicher Risikobewertung.

Produktpreise für Vergleiche scrapen

Einer der häufigsten – und oft am wenigsten riskanten – geschäftlichen Anwendungsfälle. Preise sind faktische Daten, und die automatisierte Preiserfassung ist genau die Nutzung, auf der Seiten wie PreisSpy beruhen.

Ganz verschwinden die Risiken aber nicht. Verbietet die Zielwebsite Scraping in ihren ToS, kopieren Sie Produktbeschreibungen oder Bilder oder entnehmen Sie einen wesentlichen Teil einer kuratierten Datenbank, können Vertrags-, Urheberrechts- und Datenbankrechtsfragen aufkommen.

Risikolevel: NIEDRIG bis MITTEL
Wichtiger Compliance-Schritt: Nur faktische Preisfelder erfassen, keine Produktbeschreibungen wortwörtlich kopieren, ToS und robots.txt respektieren, Rate Limiting einsetzen und keinen Roh-Mirror des Wettbewerberkatalogs erneut veröffentlichen.

Daten kommerziell scrapen und weiterverkaufen

Das kommerziell riskanteste Szenario, ohne Wenn und Aber. Sie verwandeln die Dateninvestition einer anderen Partei in ein verkäufliches Produkt – und das kann alle vier rechtlichen Säulen gleichzeitig berühren.

Risikolevel: HOCH
Wichtiger Compliance-Schritt: Eine juristische Prüfung ist unverzichtbar. Lizenzvereinbarungen mit den Dateninhabern erwägen. Enthält das Produkt personenbezogene Daten, zusätzlich eine Datenschutz-Folgenabschätzung durchführen.

Geschäftskontaktdaten für Lead-Generierung extrahieren

Jedes Vertriebsteam macht irgendeine Variante davon: E-Mails, Telefonnummern und Firmennamen aus Verzeichnissen scrapen. Der Haken? Geschäftskontaktdaten enthalten oft personenbezogene Daten. Eine namentlich genannte Mitarbeiter-E-Mail ist personenbezogen, auch wenn sie öffentlich gelistet ist.

Risikolevel: MITTEL
Wichtiger Compliance-Schritt: Eine Legitimate Interests Assessment durchführen, nach Möglichkeit nur geschäftliche (keine privaten) Kontaktdaten erfassen, die Rechtsgrundlage dokumentieren und einen Opt-out-Weg anbieten. Tools wie Thunderbit können hier das Zugriffsrisiko senken, da die Chrome-Erweiterung im Browser des Nutzers arbeitet – sie greift nur auf das zu, was der Nutzer ohnehin sehen kann, ohne Zugriffskontrollen zu umgehen.

Akademische oder portfoliobezogene Datenanalyse

Wer tatsächlich nicht-kommerzielle Forschung betreibt, hat den stärksten Urheberrechts-Ausnahmepfad: Section 29A CDPA, sofern rechtmäßiger Zugang besteht.

Risikolevel: NIEDRIG (sofern wirklich nicht-kommerziell)
Wichtiger Compliance-Schritt: Nicht-kommerziellen Zweck dokumentieren, Quellen angeben, nach Möglichkeit anonymisieren oder aggregieren und keine urheberrechtlich geschützten Inhalte oder personenbezogenen Daten erneut verbreiten.

Inhalte zum Training von KI-Modellen scrapen

Das ist der Fall, nach dem 2026 alle fragen – und die Antwort bleibt unbefriedigend. Das ICO behandelt gescrapte personenbezogene Daten zum Training als hochriskante, nicht sichtbare Verarbeitung. Der britische Bericht von 2026 führte keine breite kommerzielle TDM-Ausnahme ein.

Risikolevel: MITTEL bis HOCH
Wichtiger Compliance-Schritt: Lizenzierung, Herkunft des Datensatzes, Urheberrechtsprüfung, Filterung personenbezogener Daten, Dokumentation der Rechtsgrundlage und enges Beobachten der britischen Politikentwicklung.

Szenario-Übersichtstabelle

Szenario	Ausgelöste zentrale Gesetze	Risikolevel	Wichtiger Compliance-Schritt
Produktpreis-Monitoring	ToS, Datenbankrechte, Urheberrecht	Niedrig–Mittel	Faktische Felder erfassen, Website-Signale respektieren
Kommerzieller Datenweiterverkauf	Alle vier Säulen	Hoch	Juristische Prüfung und Lizenzierung unerlässlich
B2B-Lead-Generierung	UK GDPR, ToS	Mittel	LIA durchführen, personenbezogene Daten minimieren
Akademische Forschung	Urheberrecht (TDM-Ausnahme), DSGVO bei personenbezogenen Daten	Niedrig	Zweck nicht-kommerziell halten, nicht erneut veröffentlichen
Training von KI-Modellen	UK GDPR, Urheberrecht, Datenbankrechte	Mittel–Hoch	Daten lizenzieren, Rechtsgrundlage dokumentieren, Politik beobachten

Großbritannien vs. USA vs. EU: Wie sich das Web-Scraping-Recht unterscheidet

Wer ausschließlich im Vereinigten Königreich tätig ist, kann diesen Abschnitt überspringen. Doch die meisten Unternehmen scrapen international – oder zumindest Websites, die in anderen Rechtsordnungen gehostet werden. Die Unterschiede wiegen schwerer, als man denkt.

Rechtsdimension	🇬🇧 UK	🇺🇸 USA	🇪🇺 EU
Zentrales Datenschutzrecht	UK GDPR + DPA 2018	Kein bundesweites Äquivalent (Landesgesetze variieren)	EU-GDPR
Wichtigster Präzedenzfall zum Scraping	Clearview AI (ICO-Strafe von 7,5 Mio. £)	hiQ gegen LinkedIn (Scraping öffentlicher Daten erlaubt, Ninth Circuit – aber hiQ wurde dauerhaft untersagt und zahlte 500.000 $ im endgültigen Zustimmungsurteil)	Ryanair gegen PR Aviation (EuGH, C-30/14, Datenbankrechte)
Recht für Computerzugriffe	Computer Misuse Act 1990	CFAA (durch Van Buren, 2021, enger gefasst)	Je nach Mitgliedstaat unterschiedlich
Urheberrecht / TDM-Ausnahme	Eng: nur nicht-kommerzielle Forschung (Section 29A)	Fair-Use-Doktrin (breiter, einzelfallbezogen)	DSM-Richtlinie Art. 3 & 4 (breitere TDM-Rechte mit Rechtsvorbehalt)
Datenbankrechte	Ja (aus der EU-Datenbankrichtlinie übernommen)	Kein entsprechendes Bundesrecht	Sui-generis-Recht nach der Datenbankrichtlinie
Durchsetzbarkeit von ToS	Vertragsrecht gilt; Browsewrap umstritten	Gemischt: Browsewrap oft nicht durchsetzbar	Variiert; Ryanair stärkte die ToS-Position

Die Quintessenz: Wer über Rechtsordnungen hinweg scrapt, hält sich am besten an das strengste anwendbare Recht. Die USA sind beim Zugriff auf öffentliche Daten unter hiQ permissiver, doch hiQ ist kein Freibrief – das Unternehmen durfte letztlich nicht mehr bei LinkedIn scrapen und zahlte 500.000 $. Die EU verfügt über die DSM-Richtlinie über eine breitere TDM-Architektur. Das Vereinigte Königreich liegt dazwischen: keine breite kommerzielle TDM-Ausnahme, starke Datenbankrechte, aktive Aufsichtsbehörde.

Strafen und Durchsetzung: Was passiert tatsächlich, wenn Sie erwischt werden?

ig_010beacbdecb066e0169f1876f083008191b99b1282ce74a9d8_compressed.webp

Vage Warnungen vor „Geldstrafen“ und „rechtlichem Ärger“ helfen niemandem. Hier die echten Zahlen.

Bußgelder nach UK GDPR

Maximale Strafe: 17,5 Millionen £ oder 4 % des weltweiten Jahresumsatzes, je nachdem, welcher Betrag höher ist.

Reales Beispiel: Das ICO belegte Clearview AI 2022 mit 7.552.800 £, weil das Unternehmen Gesichtsbilder aus britischen sozialen Medien gescraped hatte. Das First-tier Tribunal hob die Entscheidung aus Zuständigkeitsgründen auf, doch das Upper Tribunal entschied im Oktober 2025, dass die Berufung des ICO zulässig sei, und verwies den Fall zurück. Laut ICO hatte Clearview bis Dezember 2025 die Erlaubnis, beim Court of Appeal Berufung einzulegen.

Strafrechtliche Sanktionen nach dem Computer Misuse Act

Section 1 (unbefugter Zugriff): bis zu 2 Jahre Freiheitsstrafe
Section 3 (unbefugte Beeinträchtigung): bis zu 10 Jahre Freiheitsstrafe

Strafverfolgung wegen normalem Scraping öffentlicher Seiten ist extrem selten.

Das Risikoprofil verschiebt sich drastisch, sobald das Verhalten wie Hacking, Missbrauch von Zugangsdaten, CAPTCHA-Umgehung oder eine Dienstbeeinträchtigung aussieht.

Urheberrecht und Datenbankrechte

Zivilrechtlicher Schadensersatz plus Unterlassungsanspruch. Strafrechtliche Sanktionen sind bei vorsätzlicher kommerzieller Verletzung möglich, die meisten Scraping-Streitigkeiten laufen jedoch als Zivilklagen.

Vertragsverletzung (ToS)

Zivilrechtlicher Schadensersatz, Kontosperrung, IP-Blocking. In der Praxis ist dies meist die häufigste Durchsetzungsmaßnahme – und oft das Erste, was geschieht.

Zusammenfassung der Strafschwere

Rechtsrahmen	Maximale Strafe	Wahrscheinlichkeit bei typischem Business-Scraping	Praxisbeispiel
UK GDPR	17,5 Mio. £ oder 4 % des weltweiten Umsatzes	Mittel bei personenbezogenen Daten in großem Umfang; niedrig bei nicht personenbezogenen Daten	Clearview-AI-Strafe über 7,5 Mio. £
CMA Section 1	2 Jahre Freiheitsstrafe	Niedrig bei öffentlichen Seiten; höher bei Umgehung von Kontrollen	CPS-Leitlinien zu unbefugtem Zugriff
CMA Section 3	10 Jahre Freiheitsstrafe	Niedrig, außer wenn der Verkehr Systeme beeinträchtigt	DDoS-ähnliche Beeinträchtigungsfälle
Urheberrecht/Datenbankrechte	Schadensersatz und Unterlassung	Mittel bei geschützten Inhalten oder kuratierten Datenbanken	Ryanair und die BHB-Falllinie
ToS-Verstoß	Schadensersatz, Kontosperrung, Blockierung	Hoch als praktische Durchsetzungsroute	Ryanair-Screen-Scraping-Streitigkeiten

Wie das richtige Scraping-Tool Ihr rechtliches Risiko senkt

Das gewählte Tool macht rechtswidriges Scraping nicht legal. Aber es kann vermeidbare Risiken ausräumen.

Erfahrungsgemäß entscheidet der Unterschied zwischen einem Tool, das Website-Signale respektiert, und einem, das alles aggressiv umgeht, oft darüber, ob ein Datenprojekt normal verläuft oder zum rechtlichen Problem wird.

Respektiert robots.txt und Website-Signale

Ein verantwortungsvolles Tool sollte es leicht machen, robots.txt vor dem Scraping zu prüfen und zu respektieren. Auch ohne rechtliche Bindung werten Gerichte und das ICO die Einhaltung als Beleg für guten Glauben. Die Dokumentation von Thunderbit rät Nutzern, öffentlich verfügbare Daten zu scrapen und robots.txt sowie die Nutzungsbedingungen zu beachten.

Browser-Scraping vs. Cloud-Scraping

Dieser Unterschied ist rechtlich bedeutsam. Browser-Scraping greift nur auf das zu, was der Nutzer in seiner authentifizierten Sitzung sieht – im Grunde die Automatisierung dessen, was man von Hand täte. Cloud-Scraping sendet Anfragen von Servern aus; bei öffentlichen Seiten schneller, kann aus Sicht der Website aber eher wie „automatisierter Zugriff“ wirken.

Thunderbit bietet beide Modi. Browser-Scraping eignet sich für Seiten mit Login-Pflicht und senkt damit das Risiko von „unbefugtem Zugriff“ nach dem CMA, während Cloud-Scraping bei öffentlich verfügbaren E-Commerce-Seiten punktet, wo Tempo zählt. Dieser doppelte Ansatz erlaubt es Nutzern, die Scraping-Methode an das rechtliche Risikoprofil der jeweiligen Seite anzupassen.

Keine Umgehung von Zugriffskontrollen

Ein Tool, das im Browser arbeitet und weder CAPTCHAs knackt noch Login-Schranken umgeht, ist nach dem Computer Misuse Act von Haus aus risikoärmer. Die Chrome-Erweiterung von Thunderbit läuft innerhalb der Browsersitzung des Nutzers – sie greift nur auf das zu, was der Nutzer ohnehin sehen kann.

Transparenter Datenexport (unterstützt DSGVO-Compliance)

Thunderbit exportiert direkt nach Excel, Google Sheets, Airtable oder Notion. Der Nutzer kontrolliert, wohin die Daten gehen. Das stützt Transparenz und Dokumentation der Rechtsgrundlage nach DSGVO: Sie wissen genau, welche Daten Sie erfasst haben und wohin sie geflossen sind. Keine versteckte Verarbeitung oder Aufbewahrung durch das Tool.

Rate Limiting und verantwortungsvoller Zugriff

Aggressive Request-Mengen können CMA Section 3 (unbefugte Beeinträchtigung) auslösen. Rate Limiting ist nicht nur technische Best Practice, sondern auch eine rechtliche Schutzmaßnahme. Verantwortungsvolle Tools überlasten Server nicht und senken so rechtliches Risiko wie auch die Gefahr einer IP-Sperre.

ig_010beacbdecb066e0169f18811201081919686e582502a1db7_compressed.webp

Eine praktische Compliance-Checkliste für Web-Scraping in Großbritannien

Gehen Sie diese Punkte durch, bevor Sie irgendetwas scrapen:

Lesen Sie die Nutzungsbedingungen und die Acceptable-Use-Policy der Zielwebsite.
Prüfen Sie die robots.txt-Datei und dokumentieren Sie, ob relevante Pfade ausgeschlossen sind.
Stellen Sie fest, ob es sich um personenbezogene Daten handelt. Wenn ja, bestimmen Sie Ihre rechtmäßige Grundlage nach UK GDPR.
Bewerten Sie, ob Sie einen „wesentlichen Teil“ einer Datenbank extrahieren.
Stellen Sie sicher, dass Sie keine technischen Zugriffskontrollen umgehen (CAPTCHAs, Logins, Rate Limits).
Wenn Ihr Zweck nicht-kommerzielle Forschung ist, dokumentieren Sie das, um von der TDM-Ausnahme zu profitieren.
Nutzen Sie Rate Limiting. Überlasten Sie den Zielserver nicht.
Dokumentieren Sie alles: Ihre Rechtsgrundlage, die ToS-Prüfung, die erfassten Datenfelder, Exportziele und die Aufbewahrungsfrist.
Wenn Sie unsicher sind, holen Sie Rechtsrat ein bei einer Kanzlei mit Spezialisierung auf Datenschutz und IP.

Diese Checkliste ersetzt kein anwaltliches Gutachten – aber sie gibt Ihnen eine solide Ausgangsstruktur und zeigt guten Glauben, falls später Fragen aufkommen.

Wichtigste Erkenntnisse

Web-Scraping ist in Großbritannien nicht illegal – aber es wird durch vier sich überschneidende Rechtsrahmen reguliert: UK GDPR, Urheber- und Datenbankrechte, Vertragsrecht und den Computer Misuse Act.
Ob ein Scrape legal ist, hängt davon ab, was Sie scrapen, wie Sie darauf zugreifen, was die Website-Bedingungen sagen und was Sie mit den Daten tun.
Das Scraping personenbezogener Daten bringt die höchste Compliance-Last mit sich. Berechtigte Interessen ist meist die einzige praktikable Rechtsgrundlage und verlangt eine dokumentierte Abwägung.
Das Vereinigte Königreich kennt keine breite kommerzielle TDM-Ausnahme. Kommerzielles KI-Training und der Weiterverkauf von Datensätzen sind ohne Lizenzierung riskant.
Nutzen Sie den Entscheidungs-Flowchart und die Szenariotabelle oben, um Ihre konkrete Situation vor dem Start zu bewerten.
Wählen Sie Tools, die zu Compliance-Best-Practices passen: browserbasierter Zugriff, keine CAPTCHA-Umgehung, transparenter Datenexport und Rate Limiting. Thunderbit ist genau nach diesen Prinzipien entwickelt – doch die Compliance-Verantwortung liegt stets beim Nutzer.
Bei Zweifeln: Dokumentieren Sie Ihre Begründung und sprechen Sie mit einem Anwalt. Die Kosten für eine rechtliche Einschätzung liegen fast immer unter denen einer ICO-Untersuchung.

KI-Web-Scraper mit Thunderbit testen Get Started Free

FAQs

Ist das Scrapen öffentlich verfügbarer Daten in Großbritannien legal?

Im Allgemeinen ja – öffentlich zugängliche Daten zu scrapen ist risikoärmer als geschützte oder private Daten. Doch „öffentlich verfügbar“ heißt nicht „frei nutzbar, wie Sie wollen“. Die UK GDPR kann weiterhin für öffentliche personenbezogene Daten gelten, Urheberrecht kann geschützte Ausdrucksformen erfassen, Datenbankrechte können kuratierte Sammlungen schützen und ToS können automatisierten Zugriff einschränken.

Kann ich E-Mails und Telefonnummern von britischen Websites scrapen?

Sind die Daten personenbezogene Daten – was E-Mails und Telefonnummern in der Regel sind –, brauchen Sie eine rechtmäßige Grundlage nach UK GDPR. Berechtigte Interessen ist die häufigste Grundlage für B2B-Lead-Generierung, doch Sie müssen eine Abwägung durchführen, nur die nötigsten Daten erheben und einen Opt-out-Weg anbieten. Das Scrapen privater Kontaktdaten (Handynummern, private E-Mails) ist deutlich riskanter als Einträge aus Geschäftsdirektorien.

Was ist nach britischem Recht der Unterschied zwischen Web-Scraping und Web-Crawling?

Rechtlich gibt es keinen wirklich relevanten Unterschied – das Gesetz schaut auf das Verhalten, nicht auf das Etikett. Crawling meint meist das Entdecken oder Indizieren von Seiten; Scraping meint meist das Extrahieren strukturierter Daten. Beides umfasst automatisierten Zugriff auf Websites und unterliegt denselben Rechtsrahmen.

Macht robots.txt Scraping illegal?

Nein. robots.txt ist rechtlich nicht bindend. Das Missachten erhöht jedoch Ihr rechtliches Risiko, weil Gerichte und das ICO es als Beleg für die Absicht des Website-Betreibers werten. Wer robots.txt ignoriert und zugleich gegen ein Scraping-Verbot in den ToS verstößt, häuft Risikofaktoren an – und das ist deutlich schwerer zu verteidigen.

Kann ich in Großbritannien wegen Web-Scrapings strafrechtlich verfolgt werden?

Nur wenn Sie Zugriffskontrollen umgehen (CAPTCHAs, Logins, IP-Sperren) oder nach Computer Misuse Act 1990 einen Schaden am Computersystem verursachen. Normales Scraping tatsächlich öffentlicher Daten in angemessenem Umfang, ohne technische Umgehung, führt extrem unwahrscheinlich zu einer Strafanzeige. Das Risikoprofil verschiebt sich drastisch, sobald das Verhalten wie Hacking oder eine absichtliche Dienstbeeinträchtigung wirkt.

Mehr erfahren

Daten mit KI extrahieren

Daten einfach zu Google Sheets, Airtable oder Notion übertragen

Chrome Store Rating

PRODUCT HUNT#1 Product of the Week